A importância do Censo 2000
Quem foi recenseado?
Os motivos para responder ao Censo
As inovações do Censo 2000
A divulgação dos resultados
Mercosul
Projeto Vamos Contar!
Revista do Censo
FAQ/Webmaster
Outros links

 

Amostragem na Coleta dos Dados do
Censo Demográfico 2000: Uma Versão Resumida

 

Zélia Magalhães Bianchini
Sonia Albieri
Diretoria de Pesquisas – DPE
Departamento de Metodologia - DEMET

 

Plano Amostral

As crescentes necessidades de informações de natureza demográfica e socioeconômica detalhadas para o planejamento, a necessidade de otimização dos recursos disponíveis e a premência na obtenção de resultados com maior rapidez e melhor precisão têm levado à utilização da amostragem nos trabalhos censitários cada vez em maior escala.

Desde 1960, tem sido utilizada a amostragem na coleta dos dados dos Censos Demográficos, com a aplicação de dois modelos de questionário:

  • questionário básico - utilizado para o registro das características básicas (investigadas para 100% da população) do domicílio e dos seus moradores, em cada unidade domiciliar ocupada que não foi selecionada para a amostra.
  • questionário da amostra - utilizado para o registro das características que constam do questionário básico e outras mais detalhadas do domicílio e dos seus moradores, em cada unidade domiciliar ocupada que foi selecionada para a amostra.

O plano amostral tradicional adotado na coleta dos censos demográficos anteriores compreende a seleção sistemática e com equiprobabilidade, dentro de cada setor, de uma amostra de domicílios particulares ocupados (permanentes e improvisados) e de unidades (famílias ou pessoas sós residentes) em domicílios coletivos, de acordo com a fração amostral definida para cada censo.

O período de planejamento de um novo censo é o momento oportuno para a avaliação dos métodos e procedimentos utilizados em todas as etapas da realização da pesquisa censitária, o que significa uma reavaliação também dos aspectos de amostragem. Uma questão que foi novamente colocada em discussão no planejamento do Censo 2000 é a que se refere ao plano amostral.

Uma alternativa ao plano amostral de seleção sistemática é a utilização de amostragem de setores, com a seleção de setores e a aplicação dos questionários da amostra a todos os domicílios dos setores selecionados (amostragem conglomerada de domicílios em um estágio) e a aplicação dos questionários básicos a todos os domicílios dos setores não selecionados para a amostra.

Albieri e Bianchini (1998) reuniram e resumiram as questões referentes ao uso de amostragem de setores na coleta dos dados discutidas por ocasião do planejamento dos Censos de 1980 e 1991 (Ver IBGE, 1983). As vantagens e desvantagens de cada alternativa apresentadas anteriormente continuam plenamente válidas. Além disso, são apresentados alguns resultados adicionais que evidenciam as desvantagens da amostragem de conglomerados em função do efeito de conglomeração e da conseqüente perda na precisão das estimativas, em relação ao plano amostral tradicional. São tecidas considerações sobre a utilidade de informações da amostra para todos os setores, para o atendimento da demanda por informações em níveis geográficos bastante detalhados e da necessidade de se contar com informações amostrais em todos os setores censitários no planejamento de amostras para pesquisas domiciliares. Como conseqüência imediata foi recomendado que o plano de amostragem para o Censo 2000 fosse o mesmo adotado nos censos demográficos anteriores, que não utiliza amostragem de setores.

Em conseqüência, foi tomada a decisão pela manutenção do plano amostral para o Censo 2000, qual seja: em cada setor, seleção sistemática e com equiprobabilidade, de domicílios particulares ocupados e de unidades (famílias e pessoas sós residentes) em domicílios coletivos, de acordo com a fração amostral definida.

Cabe acrescentar que esse plano amostral é semelhante aos planos amostrais adotados na coleta dos dados do censo dos Estados Unidos, desde 1940, e do Canadá, desde 1971.

O Tamanho da Amostra

Outro aspecto de grande relevância diz respeito à definição da fração amostral a ser adotada. Nos censos demográficos de 1960, 1970 e 1980, a fração amostral era de 25% para todos os setores dos municípios brasileiros. Em 1991, uma revisão amostral com grande impacto foi o emprego de duas frações amostrais diferentes de acordo com o tamanho do município, medido em função da projeção de população para a data de referência do Censo: 20% para os setores de municípios com até 15.000 habitantes e 10% para os setores dos demais municípios. (Ver Pinheiro e Lima (1990) e Silva e Bianchini (1990) ).

A complexidade das questões que envolvem a adoção da amostragem na coleta dos dados do Censo fica bastante clara quando se verifica que a decisão sobre uma dada fração amostral ou frações amostrais distintas depende da definição de um conjunto de questões técnicas, operacionais e de custo, tais como: quesitos a serem investigados, nível de precisão aceitável para as estimativas, nível de divulgação mínimo desejável, método de seleção, facilidade da coleta, tempo necessário à execução das várias etapas, infra-estrutura física e de recursos humanos requerida e custos da operação, frente à natureza e à qualidade dos dados obtidos.

Uma avaliação das discussões e estudos realizados quando do planejamento dos censos passados e o estabelecimento dos objetivos (ou das premissas) para o próximo censo servem de base para a definição da fração amostral a ser utilizada para a investigação do questionário mais detalhado no Censo de 2000.

Albieri (1998) reúne as questões referentes à fração amostral usada na coleta dos dados dos Censos Demográficos do Brasil e revisa as discussões ocorridas por ocasião do planejamento dos Censos de 1980 e 1991, de onde se destaca:

"Apesar de passados 20 anos desde o planejamento do Censo Demográfico de 1980, continuam válidas as considerações apresentadas sobre vantagens e desvantagens de cada alternativa para o tamanho da amostra consideradas naquela época. Continuam também válidos, talvez de forma reforçada, os argumentos técnicos (envolvendo precisão de estimativas) e operacionais (custo e prazo) apresentados quando do planejamento do Censo 91."

Apesar dessa constatação, foram realizados novos estudos utilizando os dados do Censo Demográfico de 1991 e considerando frações alternativas de acordo com a população dos municípios. É sob essa ótica que Bianchini e Albieri (1999) apresentam um estudo de alternativas para as frações de amostragem do Censo Demográfico 2000, visando a avaliação dos efeitos da alteração das frações amostrais sobre a precisão das estimativas e a avaliação da redução de custos e de tempo associadas com os aspectos operacionais da coleta.

Ao todo, foram analisadas 6 propostas de composição das frações amostrais, de acordo com os cortes populacionais definidos considerando a população dos municípios projetada para o ano 2000 e o número de municípios existentes em 1997. A Comissão Consultiva do Censo 2000 recomendou a manutenção das frações adotadas em 1991 e sugeriu a avaliação do aumento da fração de 20% para 50% nos municípios menos populosos. No entanto, restrições orçamentárias levaram o IBGE para outra direção: a de calcular os efeitos da redução da fração de 10% para 5% nos municípios com mais de 100.000 habitantes.

Verificou-se que tal redução não causaria perda expressiva de precisão para as estimativas no nível de município. Comparando com as frações usadas em 1991, o novo critério acarretaria uma redução de 23,3% de domicílios e de 15,1% de pessoas a serem investigadas na amostra e um aumento de 3% de domicílios e de 2% de pessoas a serem investigadas com o "questionário básico". A principal desvantagem seria a utilização de três frações: 20% para os municípios com menos de 15.000 habitantes; 10% para os que possuem mais de 15.000 e menos 100 000 habitantes, e 5% para os municípios com população projetada igual ou maior que 100.000 pessoas. Isso exigiria maior controle da operação de coleta e alguma perda de detalhamento geográfico das estimativas para os municípios maiores.

A decisão final foi a de manter as mesmas frações usadas em 1991: 20% para os municípios com até 15.000 habitantes e de 10% para os municípios com mais de 15.000 habitantes, o que corresponde à primeira alternativa apresentada nas tabelas 1 e 2.

As tabelas 1 e 2 apresentam, respectivamente, o número esperado de domicílios e de pessoas com questionários da amostra e básico para o Censo 2000, de acordo com os cortes populacionais definidos considerando a população dos municípios projetada para o ano 2000 e o número de municípios existentes em 1997. Nessas tabelas não estão incluídas as informações relativas a duas alternativas também estudadas, e que foram descartadas logo no início dos estudos, a saber: a utilização de fração amostral única de 10% para todos os municípios e a redução pela metade da fração amostral usada no Censo de 1991, ou seja, 10% para os municípios com até 15.000 habitantes e 5% para os demais municípios. Essas alternativas foram descartadas por acarretarem perda de precisão de forma acentuada nos municípios menos populosos.

Tabela 1 - Número esperado de domicílios com questionários de amostra e básico para o Censo 2000, considerando frações amostrais alternativas de acordo com a população dos municípios

 

Domicílios

Frações amostrais alternativas para o Censo 2000

Total

Quest. Amostra

Quest. Básico

Mesmas frações de 91 (20% e 10%)

Municípios com até 15000 hab. (f = 20%)

5.918.817

1.183.763

4.735.054

Municípios com mais de 15000 hab. (f = 10%)

36.589.919

3.658.992

32.930.927

Total

42.508.736

4.842.755

37.665.981

3 frações (20%, 10% e 5%)

Municípios com até 15000 hab. (f = 20%)

5.918.817

1.183.763

4.735.054

Municípios com 15001 a 100000 hab. (f = 10%)

14.033.618

1.403.362

12.630.256

Municípios com mais de 100000 hab. (f = 5%)

22.556.301

1.127.815

21.428.486

Total

42.508.736

3.714.940

38.793.796

Variação (frações 20%, 10% e 5% / frações de 91)

Absoluta

0

-1.127.815

1.127.815

Relativa

0,0%

-23,3%

3,0%

2 frações (50% e 10%)

Municípios com até 15000 hab. (f = 50%)

5.918.817

2.959.409

2.959.409

Municípios com mais de 15000 hab. (f = 10%)

36.589.919

3.658.992

32.930.927

Total

42.508.736

6.618.401

35.890.336

Variação (frações 50% e 10% / frações de 91)

Absoluta

0

1.775.645

-1.775.645

Relativa

0,0%

36,7%

-4,7%

3 frações (50%, 10% e 5%)

Municípios com até 15000 hab. (f = 50%)

5.918.817

2.959.409

2.959.409

Municípios com 15001 a 100000 hab. (f = 10%)

14.033.618

1.403.362

12.630.256

Municípios com mais de 100000 hab. (f = 5%)

22.556.301

1.127.815

21.428.486

Total

42.508.736

5.490.585

37.018.151

Variação (frações 50%, 10% e 5% / frações de 91)

Absoluta

-

647.830

-647.830

Relativa

0,0%

13,4%

-1,7%

 

Tabela 2 - Número esperado de pessoas com questionários de amostra e básico para o Censo 2000, considerando frações amostrais alternativas de acordo com a população dos municípios

 

Pessoas

Frações amostrais alternativas para o Censo 2000

Total

Quest. Amostra

Quest.

Básico

Mesmas frações de 91 (20% e 10%)

Municípios com até 15000 hab. (f = 20%)

24.171.734

4.834.347

19.337.387

Municípios com mais de 15000 hab. (f = 10%)

141.940.784

14.194.078

127.746.706

Total

166.112.518

19.028.425

147.084.093

3 frações (20%, 10% e 5%)

Municípios com até 15000 hab. (f = 20%)

24.171.734

4.834.347

19.337.387

Municípios com 15001 a 100000 hab. (f = 10%)

84.595.176

8.459.518

76.135.658

Municípios com mais de 100000 hab. (f = 5%)

57.345.608

2.867.280

54.478.328

Total

166.112.518

16.161.145

149.951.373

Variação (frações 20%, 10% e 5% / frações de 91)

Absoluta

0

-2.867.280

2.867.280

Relativa

0,0%

-15,1%

2,0%

2 frações (50% e 10%)

Municípios com até 15000 hab. (f = 50%)

24.171.734

12.085.867

12.085.867

Municípios com mais de 15000 hab. (f = 10%)

141.940.784

14.194.078

127.746.706

Total

166.112.518

26.279.945

139.832.573

Variação (frações 50% e 10% / frações de 91)

Absoluta

0

7.251.520

-7.251.520

Relativa

0,0%

38,1%

-4,9%

3 frações (50%, 10% e 5%)

Municípios com até 15000 hab. (f = 50%)

24.171.734

12.085.867

12.085.867

Municípios com 15001 a 100000 hab. (f = 10%)

84.595.176

8.459.518

76.135.658

Municípios com mais de 100000 hab. (f = 5%)

57.345.608

2.867.280

54.478.328

Total

166.112.518

23.412.665

142.699.853

Variação (frações 50%, 10% e 5% / frações de 91)

Absoluta

0

4.384.240

-4.384.240

Relativa

0,0%

23,0%

-3,0%

 

A Seleção da Amostra

O princípio fundamental da amostragem probabilística é o de ter as suas unidades selecionadas aleatoriamente. A seleção das unidades investigadas por amostragem constitui uma fase importante da coleta do Censo, pois durante a mesma podem ocorrer sérios inconvenientes nas informações coletadas, conduzindo a diversos tipos de tendenciosidades. Utilizando-se o domicílio como unidade de amostragem, e sendo realizada a seleção pelos recenseadores, durante a coleta, as regras de seleção devem ser simples e de fácil aplicação. Por esse motivo, são adotados processos sistemáticos de seleção, estabelecidos de forma a quebrar ou interromper seqüências cíclicas do universo, de modo a obter bastante variação nas séries sistemáticas de seleção e a evitar o surgimento de tendenciosidades cometidas durante a coleta.

A amostragem sistemática prescinde da existência prévia de cadastro e permite que ele seja construído simultaneamente à seleção da amostra, de tal forma que a operacionalização do processo de seleção (por intervalos pré-fixados), dentro de cada setor é simples e de fácil aplicação pelos recenseadores.

O cadastro para a seleção da amostra de cada setor é construído a partir do registro nas Folhas de Coleta de cada unidade visitada identificada, conforme a espécie da unidade: domicílio particular ocupado, domicílio particular fechado, domicílio particular de uso ocasional, domicílio particular vago, domicílio coletivo e não residencial.

Nas Folhas de Coleta de cada setor são numerados, em ordem crescente, todos os domicílios particulares permanentes relacionados, quer sejam ocupados, fechados, de uso ocasional ou vagos e os domicílios particulares improvisados, constituindo o cadastro para a seleção dos domicílios particulares.

Para cada domicílio coletivo registrado nas Folhas de Coleta, de cada setor, são preparadas Folhas de Domicílio Coletivo, com o registro e numeração das unidades (famílias e pessoas sós residentes) ocupadas por moradores, constituindo o cadastro para a seleção das unidades em domicílios coletivos, independente do cadastro de seleção dos domicílios particulares.

Embora algumas tendenciosidades cometidas durante a coleta possam ser atenuadas através de processo de estimação, esforços e controles devem ser previstos e seguidos rigorosamente durante a coleta, a fim de que essas tendenciosidades não prejudiquem significativamente as demais fases de apuração do Censo.

A Estimação

Os dados coletados exclusivamente no questionário da amostra alimentam um processo de estimação que permite generalizar a informação da amostra para a população da qual foi extraída, dando origem às estimativas das características de domicílios, famílias e de pessoas investigadas por amostragem.

Nos censos anteriores a metodologia adotada para a expansão da amostra fez uso das informações disponíveis para o total da população para o emprego de estimadores mais apropriados (e complexos) que os estimadores naturais do desenho amostral e foi aplicada separadamente para cada área de ponderação. Área de ponderação é a menor área geográfica para a qual são calculadas estimativas baseadas nas informações do questionário da amostra. É o nível geográfico definido para a aplicação dos procedimentos de calibração das estimativas com as informações conhecidas para a população como um todo. Uma área de ponderação é sempre um conjunto de setores e cada setor pertence a uma única área de ponderação.

O conhecimento de totais da população para um subconjunto de características investigadas (as quais são pesquisadas a 100%) torna viável a aplicação de metodologias de estimação para a obtenção de pesos ou fatores de expansão para a amostra do Censo Demográfico, as quais procuram, entre outras finalidades, satisfazer os seguintes objetivos principais:

a) buscar a consistência das estimativas a partir da amostra com os totais conhecidos da população para as características investigadas a 100%;

b) obter estimativas mais precisas para as características investigadas por amostragem;

c) controlar, na estimação, possíveis tendências ocorridas durante a coleta dos dados, especialmente na aplicação do mecanismo de seleção da amostra de domicílios e pessoas.

A metodologia de estimação adotada para a expansão da amostra do Censo Demográfico de 91 baseou-se num procedimento de estimação por mínimos quadrados generalizados em duas etapas. Essa metodologia foi adotada em função dos estudos e da pesquisa conduzidos pela equipe de metodologia, e trata-se de um procedimento desenvolvido pelos técnicos do Statistics Canada e aplicado na expansão da amostra do Censo de População canadense em 1991 e 1996, que, em sua essência, é parecido com o Censo Demográfico brasileiro.

A metodologia utilizada em 1991 consistiu em determinar os pesos ou fatores de expansão ajustados para as unidades amostrais tais que são satisfeitas certas restrições. Primeiro, é minimizada a distância entre os pesos finais ajustados e os pesos iniciais, sujeito às restrições que buscam igualar estimativas amostrais aos valores conhecidos do universo para um conjunto de variáveis auxiliares comuns à amostra e universo de cada área de ponderação. Para o Censo 2000, estão sendo pesquisados/estudados novos métodos de ponderação e estimação para selecionar e incorporar as variáveis auxiliares cujos totais são conhecidos para 100% da população.

Em 1991, as áreas de ponderação foram definidas por grupos mutuamente exclusivos de setores, considerando os níveis geográficos mais detalhados da base operacional, como forma de atender a demandas por informações em níveis geográficos menores que os municípios. Para o Censo 2000, estão sendo estudados métodos e sistemas automáticos de formação de áreas de ponderação que conjuguem critérios tais como tamanho (áreas geográficas pequenas), contiguidade (no sentido de serem constituídas por conjuntos de setores vizinhos) e homogeneidade (em relação a um conjunto de características populacionais e de infra-estrutura conhecidas).

Referências

Albieri, S. Uma discussão sobre a fração amostral na coleta dos dados dos Censos Demográficos Brasileiros. Rio de Janeiro: IBGE, Departamento de Metodologia, 1998. 12p.

Albieri, S. e Bianchini, Z.M. Sobre o uso de amostragem de setores na coleta dos dados dos Censos Demográficos Brasileiros. Rio de Janeiro: IBGE, Departamento de Metodologia, 1998. 12p.

Bianchini, Z.M. e Albieri, S. Estudo de alternativas para as frações de amostragem do Censo Demográfico 2000. Rio de Janeiro: IBGE, Diretoria de Pesquisas, 1999.

Costa, L.N. Aplicação da amostragem na coleta dos censos demográficos no Brasil. Rio de Janeiro: Revista Brasileira de Estatística, v.48 n.189/190. pp. 35-64. 1987.

IBGE. Metodologia do Censo Demográfico de 1980. Rio de Janeiro: IBGE, 1983. (Série Relatórios Metodológicos, vol. 4) .

Pinheiro, J.C.R.C. e Lima, J. M. Avaliação dos efeitos de redução da fração de amostragem no Censo Demográfico. Revista Brasileira de Estatística, Rio de Janeiro, v.5, n. 195, pp 53-84, 1990.

Silva, L.F. e Bianchini, Z.M. A redução da amostra e a utilização de duas frações amostrais no censo demográfico de 1990. Rio de Janeiro: IBGE, 1990. (Textos para Discussão, nº 33)

Silva, P.L.N.; Bianchini, Z.M. e Albieri, S. Uma proposta de metodologia para a expansão da amostra do Censo Demográfico de 1991. Rio de Janeiro: IBGE, 1993, 106p. (Textos para Discussão, n.62).

 

IBGE
Volta ao topo