2007 Methodology
Versión en español
Sources of Data
The 2007 Economic Census of Guam, Northern Mariana Islands, Puerto Rico, and Virgin Islands was conducted by mail. The economic census for American Samoa was conducted using a combination of mail and personal enumeration. Descriptions of the sources of data for the island areas follow:
- Guam, Northern Mariana Islands, Puerto Rico, and Virgin Islands — A census form was mailed to all employer firms (employers of one person or more) in operation at any time during 2007 and classified as being within the scope of the census. One single report form was used to collect data for Guam, Northern Mariana Islands, and Virgin Islands. Nine separate report forms (Utilities, Transportation, and Warehousing; Construction; Manufacturing; Wholesale Trade; Retail Trade; Finance, Insurance, Real Estate, Rental and Leasing; Accommodation Services; Services; and General Schedule) with English and Spanish versions were used to collect data for Puerto Rico. Firms were instructed to return their completed report form by mail. A telephone follow-up was conducted to obtain information from selected firms that failed to return their report form.
The governments of Guam and Northern Mariana Islands, under the provisions in Title 13 of the United States Code, Section 191(b), were responsible for contacting respondents about overdue census forms. The Chief Economist of the Department of Labor in Guam and the Director of the Central Statistics Division, Department of Commerce in the Northern Mariana Islands, supervised the local activities. Staff from the Census Bureau trained the project leaders, supervisors, and interviewers in Guam and the Northern Mariana Islands, respectively. Staff from the Department of Labor in Guam and the Department of Commerce in the Northern Mariana Islands, who worked with census data, were sworn to uphold the confidentiality of the data. The Census Bureau worked with the Department of Labor and the Central Statistics Division to collect information for nonrespondent establishments. Interviewers were instructed to contact establishments by telephone to obtain the required information. Personal interviews were conducted toobtain data from establishments that requested a personal visit or could not be contacted by telephone. Quality checks were performed to ensure that the necessary reports were obtained.
- American Samoa — A combination of mail and personal enumeration was used to conduct the economic census of American Samoa. Data were collected for establishments with and without employees that were in operation during 2007. A single report form was used to collect data for American Samoa.
- Employer establishments — Establishments with payroll were sent a report form to be completed and returned to the Census Bureau by mail. A telephone follow-up was conducted to collect information for establishments that failed to answer the census.
- Nonemployer establishments — Data for nonemployer establishments were collected through personal enumeration. The Government of American Samoa collected the data under the provisions in Title 13 of the United States Code, Section 191(b). The Chief Statistician of the Statistics Division at the American Samoa Department of Commerce supervised the field enumeration and follow-up of nonemployer and nonrespondent employer establishments referred by the Census Bureau. All persons working with census data were sworn to maintain the confidentiality of Census Bureau information. Census Advisors trained the project leader as well as the interviewers. The advisors worked with local staff to ensure that Census Bureau standards and procedures were followed.
American Samoa was divided into four zones for enumeration — Manu'a Islands, Eastern, Central, and Western districts of Tutuila. Nonemployer establishments were identified from the American Samoa Government Business License List. Interviewers were provided with an assignment list that included the establishments assigned for interview and a labeled report form for each establishment listed. The interviewers obtained information about months in operation, physical location, sales/receipts, employment and payroll, expenses, kind of business, sales by class of customer, description of merchandise sold, construction work done, products produced, or services provided, legal form of organization, ownership status, and status of the establishment at the end of 2007. A consistency review was performed on every report form to ensure the accuracy of the reported data.
The report forms used to collect information for establishments in the island areas are available at www.help.econ.census.gov/econhelp/index2007.html.
A more detailed examination of census methodology is presented in the
History of the 2007 Economic Census at www.census.gov/econ/www/history.html.
Industry Classification of Establishments
The classifications for all establishments are based on the
North American Industry Classification System, United States, 2007 manual. The method of assigning classifications and the level of detail at which establishments are classified depends on whether a report form was obtained for the establishment.
- Establishments that returned a report form are classified on the basis of their self-designation, detail/description of product lines sold, type of construction work done, products produced, or services provided, and other industry-specific inquiries.
- Establishments that did not return a report form are classified on the basis of information obtained from previous survey data and administrative records of other government agencies.
Basis of Reporting
The economic census is conducted on an establishment basis. A company operating at more than one location is required to file a separate report for each store, factory, shop, or other location. Each establishment is assigned a separate industry classification based on its primary activity and not that of its parent company.
Reliability of Data
All data compiled in this publication are subject to nonsampling errors. Nonsampling errors can be attributed to many sources during the development or execution of the census, such as,
- inability to identify all cases in the actual universe;
- definition and classification difficulties;
- differences in the interpretation of questions;
- errors in recording or coding the data obtained; and
- other errors of collection, response, coverage, processing, and estimation for missing or misreported data.
The accuracy of these tabulated data is determined by the joint effects of the various nonsampling errors. Explicit measures of the effects of these nonsampling errors are not available. Precautionary steps were taken in all phases of the collection, processing, and tabulation of the data in an effort to minimize the effects of nonsampling errors.
The Census Bureau obtains limited information extracted from administrative records of other federal agencies, such as employment and payroll. This information is used in conjunction with other information available to the Census Bureau to develop estimates for missing items on the report form or for establishments for which responses were not received in time for publication.
Treatment of Nonresponse
Census report forms included two types of inquiries: general inquiries and industry-specific inquiries. Data for the general inquiries, which include location, kind of business or operation, payroll, and number of employees, were available from a combination of sources for all establishments. Data for industry-specific inquiries, tailored to particular kinds of business, were available only from those establishments that completed the appropriate inquiries on the report form.
For total nonresponse cases (report forms not returned) and missing items, the establishment's administrative records information was used in conjunction with industry averages, prior period data, and outside reference sources to estimate general and industry-specific inquiries. Large nonresponse cases were contacted to obtain information for general and industry-specific inquiries, as appropriate.
When reporting was incomplete or inadequate, product-line data for Puerto Rico wholesale and retail trades were expanded on the premise that data for those establishments not reporting this information are similar to product-line data for those establishments in the same kind of business that reported this information. In 2007, the method used to account for nonresponse to product-line inquiries was to expand the total of reported data to represent 100 percent of the universe. Data presented for product lines were expanded in direct relationship to total sales of all establishments included in the category. A similar expansion was done using the number of establishments that reported product lines to adjust the establishment count.
Disclosure
In accordance with federal law governing census reports (Title 13 of the United States Code, Section 9), no data are published that would disclose the operations of an individual establishment or business. However, the number of establishments in a kind-of-business classification is not considered a disclosure; therefore, this information may be released. Cell values that have a potential for revealing confidential information must be suppressed or have their values perturbed by using the "Noise Infusion" technique described below. Techniques employed to limit disclosure are discussed at
Confidentiality
Noise Infusion
Noise infusion is a method of disclosure avoidance in which values for each firm are perturbed prior to table creation by applying a random noise multiplier to the magnitude data (i.e., characteristics such as receipts, payroll, and number of employees) for each company. Disclosure protection is accomplished in a manner that results in a relatively small change in the vast majority of cell values. For the 2007 Economic Census of Island Areas, each published cell value has an associated noise flag, indicating the relative amount of distortion in the cell value resulting from the perturbation of the data for the contributors to the cell. The flag for low noise (G) indicates the cell value was changed by less than 2 percent with the application of noise, and the flag for moderate noise (H) indicates the value was changed by 2 percent or more but less than 8 percent. Cells that have been changed by 8 percent or more are suppressed from the published tables. Additionally, other cellsin the table may be suppressed for additional protection from disclosure or because the quality of the data does not meet publication standards. Though some of these suppressed cells may be derived by subtraction, the results are not official and may differ substantially from the true estimate.
The number of firms in a particular tabulation cell is not considered a disclosure of confidential information about an individual establishment; therefore, this information may be released without the addition of protective noise. For an introduction to the noise confidentiality protection method, see
Using Noise for Disclosure Limitation of Establishment Tabular Data [PDF] by Timothy Evans, Laura Zayatz, and John Slanta in the Journal of Official Statistics (1998).
Fuentes de Datos
El Censo Económico de 2007 de Guam, las Islas Marianas del Norte, Puerto Rico e Islas Vírgenes se realizó por correo. El censo económico de Samoa Americana se llevó a cabo utilizando una combinación de enumeración por correo y personal. Las descripciones sobre las fuentes de datos para las áreas insulares se presentan a continuación:
- Guam, las Islas Marianas del Norte, Puerto Rico e Islas Vírgenes — El cuestionario censal fue enviado a todas las firmas que empleaban una o más personas, que estuvieron activas en cualquier momento durante el año 2007 y que estaban clasificadas dentro del alcance del censo. Se utilizó un solo cuestionario para recopilar datos sobre Guam, las Islas Marianas del Norte e Islas Vírgenes. Para recopilar los datos de Puerto Rico se utilizaron nueve cuestionarios individuales (Utilidades, Transportación y Almacenaje; Construcción; Manufactura; Comercio al por Mayor; Comercio al Detal; Finanzas, Seguros, Bienes Raíces, Alquiler y Arrendamiento; Servicios de Alojamiento; Servicios; y Cuestionario General) con versiones en inglés y español. Se le indicó a las firmas que completaran los cuestionarios y los devolvieran por correo. Se llevó a cabo un seguimiento por teléfono para obtener los datos de firmas seleccionadas que hasta entonces no habían rendido sus informes.
Los gobiernos de Guam y las Islas Marianas del Norte fueron responsables, bajo las estipulaciones del título 13 del Código de los Estados Unidos, sección 191(b), de contactar a los respondedores que no devolvieron el cuestionario censal. El Economista Jefe del Departamento del Trabajo en Guam y el Director de la División Central de Estadísticas del Departamento de Comercio de las Islas Marianas del Norte supervisaron las actividades locales. El personal del Negociado del Censo entrenó a los líderes del proyecto, supervisores y entrevistadores en Guam y las Islas Marianas del Norte. El personal del Departamento del Trabajo en Guam y del Departamento de Comercio en las Islas Marianas del Norte, que trabajó con los datos censales, fue juramentado para mantener la confidencialidad de los datos. El Negociado del Censo trabajó con el Departamento del Trabajo y a la División Central de Estadísticas para recopilar información sobre los establecimientos que no respondieron. Se le indicó a los entrevistadores que contactaran a los establecimientos por teléfono para obtener la información. Se llevaron a cabo entrevistas personales para obtener datos de establecimientos que solicitaron una visita personal o que no pudieron ser contactados por teléfono. Se cotejó que los cuestionarios necesarios fueran obtenidos.
- Samoa Americana — Se utilizó una combinación de enumeración por correo y personal. Los datos se recopilaron para establecimientos con y sin empleados que estuvieron en operación durante el 2007. Se utilizó un solo cuestionario para recopilar los datos de Samoa Americana.
- Establecimientos con empleados — Se le envió un cuestionario a establecimientos que tenían nómina para que lo completaran y devolvieran por correo al Negociado del Censo. Se llevó a cabo un seguimiento por teléfono para los establecimientos que no respondieron al censo.
- Establecimientos sin empleados — Los datos para los establecimientos que no tenían empleados se recopilaron mediante la enumeración personal. El gobierno de Samoa Americana recopiló los datos bajo las estipulaciones del título 13 del Código de Estados Unidos, sección 191(b). El Jefe de Estadísticas de la División de Estadísticas del Departamento de Comercio de Samoa Americana supervisó la enumeración y el seguimiento de establecimientos sin empleados y de aquéllos referidos por el Negociado del Censo que tenían empleados pero que no respondieron al censo. Todas las personas que trabajaron con los datos censales fueron juramentadas para mantener la confidencialidad de la información obtenida por el Negociado del Censo. El líder del proyecto y los entrevistadores fueron entrenados por asesores del Negociado del Censo. Los asesores trabajaron con el personal local para garantizar que los procedimientos y normas del Negociado del Censo fueran seguidos.
Samoa Americana se dividió en cuatro zonas para la enumeración — Las islas Manu'a y el distrito Oriental, Central y Occidental de Tutuila. Los establecimientos que no tenían empleados se identificaron en base a la Lista de Licencias Comerciales del Gobierno de Samoa Americana. Se le proporcionó a los entrevistadores una lista con los establecimientos que iban a entrevistar y un cuestionario para cada establecimiento. Cada cuestionario tenía una etiqueta con el nombre del establecimiento a entrevistar. Los entrevistadores obtuvieron información acerca de los meses en operación, ubicación física, ventas/ingresos, empleo y nómina, gastos, tipo de negocio, ventas por clase de cliente, descripción de la mercancía vendida, trabajo de construcción realizado, productos elaborados o servicios prestados, tipo de organización jurídica, estado de la propiedad y estado del establecimiento a fines de 2007. Se realizaron revisiones sistemáticas para garantizar la exactitud de los datos rendidos.
Los cuestionarios utilizados para recopilar los datos sobre los establecimientos en las áreas insulares se encuentran disponibles en www.help.econ.census.gov/econhelp/index2007.html.
La
Historia del Censo Económico del 2007 (
History of the 2007 Economic Census) en el Internet (www.census.gov/econ/www/history.html) presenta un examen más detallado de la metodología del censo.
Clasificación Industrial de los Establecimientos
Las clasificaciones para todos los establecimientos están basadas en la edición de 2007 del manual del
Sistema Norteamericano de Clasificación Industrial de los Estados Unidos. El método de asignar clasificaciones y el nivel de detalle al cual los establecimientos son clasificados, depende de que el cuestionario haya sido recibido.
- Los establecimientos que devuelven los informes son clasificados en base a su auto-designación, detalle/descripción de líneas de productos vendidas, tipo de construcción realizada, productos elaborados u otros servicios prestados y otras respuestas específicas sobre la industria.
- Los establecimientos que no devolvieron el cuestionario son clasificados en base a la información obtenida en censos anteriores y registros administrativos de otras agencias de gobierno.
Base Informativa
El censo económico es realizado en base al establecimiento. Se requiere que una compañía que opera en más de una localidad llene un informe para cada tienda, fábrica, taller u otra localización. A cada establecimiento se le asigna una clasificación basada en su actividad principal y no en la de su compañía matriz.
Confiabilidad de los Datos
Los datos recopilados en esta publicación están sujetos a errores ajenos al muestreo. Estos errores pueden ocurrir por muchas razones durante el desarrollo o levantamiento del censo:
- incapacidad para identificar los casos en el universo;
- dificultades con las definiciones y clasificaciones;
- discrepancias en la interpretación de las preguntas;
- errores en el registro o codificación de los datos obtenidos; y
- otros errores relacionados con la recopilación, respuesta, cobertura, procesamiento y estimados que se utilizan para los récords sin respuestas o respuestas incorrectas.
La exactitud de los datos tabulados es determinada por el conjunto de efectos que tienen los errores ajenos al muestreo. No existen medidas explícitas de los efectos que tienen dichos errores. Se han tomado medidas de precaución durante las fases de recopilación, procesamiento y tabulación de los datos para minimizar los efectos de los errores ajenos al muestreo.
El Negociado del Censo obtiene información limitada extraída de registros administrativos de otras agencias federales, tales como empleo y nómina. Dicha información se utiliza conjuntamente con otra información disponible al Negociado del Censo para estimar las preguntas sin respuesta (dejadas en blanco) del cuestionario o los establecimientos cuyas respuestas no fueron recibidas a tiempo para la publicación de los datos censales.
Interpretación de la Falta de Respuestas
Los informes censales incluyen dos tipos de preguntas, preguntas generales y preguntas específicas sobre una industria en particular. Las respuestas a las preguntas generales, incluyendo ubicación física, tipo de negocio u operación, nómina y número de empleados, fueron obtenidas de diversas fuentes de información para todos los establecimientos. Las respuestas a las preguntas específicas formuladas para obtener información acerca de ciertos tipos de negocio, fueron obtenidas únicamente de los establecimientos que contestaron las preguntas apropiadas en el cuestionario.
Para los casos que no respondieron (cuestionarios no devueltos) o que no respondieron a todas las preguntas (preguntas dejadas en blanco) se usó la información provista en los registros administrativos de los establecimientos conjuntamente con los promedios industriales, datos de períodos anteriores y otras fuentes de referencia externas para estimar las respuestas de preguntas generales y específicas. Los casos grandes, aquellos con ventas, envíos, ingresos o entradas cuantiosas que no respondieron, fueron contactados para obtener respuestas sobre preguntas generales y específicas.
los datos por líneas de productos para establecimientos de comercio al por mayor y al detal fueron expandidos utilizando la premisa de que los datos por líneas de productos para aquellos establecimientos que no reportaron esta información son similares a los datos por líneas de productos para los establecimientos en el mismo tipo de negocio que sí reportaron esta información. En el 2007, el método que se utilizó para representar casos sin respuestas a las preguntas sobre líneas de productos fue la expansión del total de datos reportados para representar el 100 por ciento del universo. Los datos presentados para las líneas de productos fueron expandidos en relación directa al total de ventas de todos los establecimientos incluidos en la categoría. De forma similar, se hizo una expansión utilizando el número de establecimientos que reportaron líneas de productos para ajustar el número de establecimientos.
Divulgación
De acuerdo con la ley federal que rige los informes censales (título 13 del Código de los Estados Unidos, sección 9), los datos que se publican no divulgan las operaciones de un establecimiento o negocio en particular. Sin embargo, el número de establecimientos clasificados bajo un tipo de negocio no constituye una divulgación, por lo tanto, esta información puede ser publicada. Los valores pertenecientes a celdas que podrían revelar información confidencial, deben ser suprimidos o alterados utilizando la técnica de "Infusión de Ruido" ("Noise Infusion", en inglés), la cual se describe a continuación. Las técnicas utilizadas para limitar la divulgación se explican en
Confidencialidad.
Infusión de Ruido
La infusión de ruido es un método para evitar la divulgación de información. Mediante este método los datos de envergadura (por ejemplo, características tales como ingresos, nómina y número de empleados) para cada compañía son alterados antes de crear las tablas estadísticas. Dicha alteración se obtiene multiplicando los valores de cada firma por un factor aleatorio. El método se aplicó, de manera que los cambios en los datos fueran relativamente pequeños en la mayoría de las celdas. Cada celda publicada en el Censo Económico de 2007 de las Áreas Insulares, está asociada con una letra que indica la cantidad relativa de distorsión como resultado de las alteraciones hechas a sus contribuidores. La letra para 'ruido menor' (G) indica que el cambio ocurrido en la celda fue menor de 2 por ciento luego de aplicar el factor. La letra para un 'ruido moderado' (H) indica que el valor cambió por 2 por ciento o más, pero menos de 8 por ciento. Las celdas que han cambiado por 8 por ciento o más, no se publican. De igual forma, otras celdas en la tabla pueden ser suprimidas como protección adicional o si la calidad de los datos no permite la publicación de los mismos de acuerdo a las normas de publicación. Aunque alguna de las celdas suprimidas puedan derivarse restando, los resultados no son oficiales y pueden diferir considerablemente del estimado verdadero.
El número de firmas en una celda en particular no divulga información confidencial sobre un establecimiento en específico. Por lo tanto, dicha información puede ser divulgada sin protección alguna. Para una introducción sobre la protección de la confidecialidad que ofrece el método de infusión de ruido, véa
Using Noise for Disclosure Limitation of Establishment Tabular Data [PDF] por Timothy Evans, Laura Zayatz y John Slanta, en la Revista de Estadísticas Oficiales (Journal of Official Statistics) de 1998.