Zélia Magalhães Bianchini
Sonia Albieri
Diretoria de Pesquisas – DPE
Departamento de Metodologia - DEMET
Plano Amostral
As crescentes necessidades de informações de natureza demográfica e socioeconômica detalhadas para o planejamento, a necessidade de otimização dos recursos disponíveis e a premência na obtenção de resultados com maior rapidez e melhor precisão têm levado à utilização da amostragem nos trabalhos censitários cada vez em maior escala.
Desde 1960, tem sido utilizada a amostragem na coleta dos dados dos Censos Demográficos, com a aplicação de dois modelos de questionário:
- questionário básico
- utilizado para o registro das características básicas (investigadas para 100% da população) do domicílio e dos seus moradores, em cada unidade domiciliar ocupada que não foi selecionada para a amostra.
- questionário da amostra
- utilizado para o registro das características que constam do questionário básico e outras mais detalhadas do domicílio e dos seus moradores, em cada unidade domiciliar ocupada que foi selecionada para a amostra.
O plano amostral tradicional adotado na coleta dos censos demográficos anteriores compreende a seleção sistemática e com equiprobabilidade, dentro de cada setor, de uma amostra de domicílios particulares ocupados (permanentes e improvisados) e de unidades (famílias ou pessoas sós residentes) em domicílios coletivos, de acordo com a fração amostral definida para cada censo.
O período de planejamento de um novo censo é o momento oportuno para a avaliação dos métodos e procedimentos utilizados em todas as etapas da realização da pesquisa censitária, o que significa uma reavaliação também dos aspectos de amostragem. Uma questão que foi novamente colocada em discussão no planejamento do Censo 2000 é a que se refere ao plano amostral.
Uma alternativa ao plano amostral de seleção sistemática é a utilização de amostragem de setores, com a seleção de setores e a aplicação dos questionários da amostra a todos os domicílios dos setores selecionados (amostragem conglomerada de domicílios em um estágio) e a aplicação dos questionários básicos a todos os domicílios dos setores não selecionados para a amostra.
Albieri e Bianchini (1998) reuniram e resumiram as questões referentes ao uso de amostragem de setores na coleta dos dados discutidas por ocasião do planejamento dos Censos de 1980 e 1991 (Ver IBGE, 1983). As vantagens e desvantagens de cada alternativa apresentadas anteriormente continuam plenamente válidas. Além disso, são apresentados alguns resultados adicionais que evidenciam as desvantagens da amostragem de conglomerados em função do efeito de conglomeração e da conseqüente perda na precisão das estimativas, em relação ao plano amostral tradicional. São tecidas considerações sobre a utilidade de informações da amostra para todos os setores, para o atendimento da demanda por informações em níveis geográficos bastante detalhados e da necessidade de se contar com informações amostrais em todos os setores censitários no planejamento de amostras para pesquisas domiciliares. Como conseqüência imediata foi recomendado que o plano de amostragem para o Censo 2000 fosse o mesmo adotado nos censos demográficos anteriores, que não utiliza amostragem de setores.
Em conseqüência, foi tomada a decisão pela manutenção do plano amostral para o Censo 2000, qual seja: em cada setor, seleção sistemática e com equiprobabilidade, de domicílios particulares ocupados e de unidades (famílias e pessoas sós residentes) em domicílios coletivos, de acordo com a fração amostral definida.
Cabe acrescentar que esse plano amostral é semelhante aos planos amostrais adotados na coleta dos dados do censo dos Estados Unidos, desde 1940, e do Canadá, desde 1971.
O Tamanho da Amostra
Outro aspecto de grande relevância diz respeito à definição da fração amostral a ser adotada. Nos censos demográficos de 1960, 1970 e 1980, a fração amostral era de 25% para todos os setores dos municípios brasileiros. Em 1991, uma revisão amostral com grande impacto foi o emprego de duas frações amostrais diferentes de acordo com o tamanho do município, medido em função da projeção de população para a data de referência do Censo: 20% para os setores de municípios com até 15.000 habitantes e 10% para os setores dos demais municípios. (Ver Pinheiro e Lima (1990) e Silva e Bianchini (1990) ).
A complexidade das questões que envolvem a adoção da amostragem na coleta dos dados do Censo fica bastante clara quando se verifica que a decisão sobre uma dada fração amostral ou frações amostrais distintas depende da definição de um conjunto de questões técnicas, operacionais e de custo, tais como: quesitos a serem investigados, nível de precisão aceitável para as estimativas, nível de divulgação mínimo desejável, método de seleção, facilidade da coleta, tempo necessário à execução das várias etapas, infra-estrutura física e de recursos humanos requerida e custos da operação, frente à natureza e à qualidade dos dados obtidos.
Uma avaliação das discussões e estudos realizados quando do planejamento dos censos passados e o estabelecimento dos objetivos (ou das premissas) para o próximo censo servem de base para a definição da fração amostral a ser utilizada para a investigação do questionário mais detalhado no Censo de 2000.
Albieri (1998) reúne as questões referentes à fração amostral usada na coleta dos dados dos Censos Demográficos do Brasil e revisa as discussões ocorridas por ocasião do planejamento dos Censos de 1980 e 1991, de onde se destaca:
"Apesar de passados 20 anos desde o planejamento do Censo Demográfico de 1980, continuam válidas as considerações apresentadas sobre vantagens e desvantagens de cada alternativa para o tamanho da amostra consideradas naquela época. Continuam também válidos, talvez de forma reforçada, os argumentos técnicos (envolvendo precisão de estimativas) e operacionais (custo e prazo) apresentados quando do planejamento do Censo 91."
Apesar dessa constatação, foram realizados novos estudos utilizando os dados do Censo Demográfico de 1991 e considerando frações alternativas de acordo com a população dos municípios. É sob essa ótica que Bianchini e Albieri (1999) apresentam um estudo de alternativas para as frações de amostragem do Censo Demográfico 2000, visando a avaliação dos efeitos da alteração das frações amostrais sobre a precisão das estimativas e a avaliação da redução de custos e de tempo associadas com os aspectos operacionais da coleta.
Ao todo, foram analisadas 6 propostas de composição das frações amostrais, de acordo com os cortes populacionais definidos considerando a população dos municípios projetada para o ano 2000 e o número de municípios existentes em 1997. A Comissão Consultiva do Censo 2000 recomendou a manutenção das frações adotadas em 1991 e sugeriu a avaliação do aumento da fração de 20% para 50% nos municípios menos populosos. No entanto, restrições orçamentárias levaram o IBGE para outra direção: a de calcular os efeitos da redução da fração de 10% para 5% nos municípios com mais de 100.000 habitantes.
Verificou-se que tal redução não causaria perda expressiva de precisão para as estimativas no nível de município. Comparando com as frações usadas em 1991, o novo critério acarretaria uma redução de 23,3% de domicílios e de 15,1% de pessoas a serem investigadas na amostra e um aumento de 3% de domicílios e de 2% de pessoas a serem investigadas com o "questionário básico". A principal desvantagem seria a utilização de três frações: 20% para os municípios com menos de 15.000 habitantes; 10% para os que possuem mais de 15.000 e menos 100 000 habitantes, e 5% para os municípios com população projetada igual ou maior que 100.000 pessoas. Isso exigiria maior controle da operação de coleta e alguma perda de detalhamento geográfico das estimativas para os municípios maiores.
A decisão final foi a de manter as mesmas frações usadas em 1991: 20% para os municípios com até 15.000 habitantes e de 10% para os municípios com mais de 15.000 habitantes, o que corresponde à primeira alternativa apresentada nas tabelas 1 e 2.
As tabelas 1 e 2 apresentam, respectivamente, o número esperado de domicílios e de pessoas com questionários da amostra e básico para o Censo 2000, de acordo com os cortes populacionais definidos considerando a população dos municípios projetada para o ano 2000 e o número de municípios existentes em 1997. Nessas tabelas não estão incluídas as informações relativas a duas alternativas também estudadas, e que foram descartadas logo no início dos estudos, a saber: a utilização de fração amostral única de 10% para todos os municípios e a redução pela metade da fração amostral usada no Censo de 1991, ou seja, 10% para os municípios com até 15.000 habitantes e 5% para os demais municípios. Essas alternativas foram descartadas por acarretarem perda de precisão de forma acentuada nos municípios menos populosos.
Tabela 1 - Número esperado de domicílios com questionários de amostra e básico para o Censo 2000, considerando frações amostrais alternativas de acordo com a população dos municípios
|
|
|
|
|
|
Frações amostrais alternativas para o Censo 2000 |
|
|
|
|
|
|
|
Mesmas frações de 91 (20% e 10%) |
|
|
|
Municípios com até 15000 hab. (f = 20%) |
|
|
|
Municípios com mais de 15000 hab. (f = 10%) |
|
|
|
|
|
|
|
|
|
|
|
3 frações (20%, 10% e 5%) |
|
|
|
Municípios com até 15000 hab. (f = 20%) |
|
|
|
Municípios com 15001 a 100000 hab. (f = 10%) |
|
|
|
Municípios com mais de 100000 hab. (f = 5%) |
|
|
|
|
|
|
|
|
|
|
|
Variação (frações 20%, 10% e 5% / frações de 91) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Municípios com até 15000 hab. (f = 50%) |
|
|
|
Municípios com mais de 15000 hab. (f = 10%) |
|
|
|
|
|
|
|
|
|
|
|
Variação (frações 50% e 10% / frações de 91) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 frações (50%, 10% e 5%) |
|
|
|
Municípios com até 15000 hab. (f = 50%) |
|
|
|
Municípios com 15001 a 100000 hab. (f = 10%) |
|
|
|
Municípios com mais de 100000 hab. (f = 5%) |
|
|
|
|
|
|
|
|
|
|
|
Variação (frações 50%, 10% e 5% / frações de 91) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tabela 2 - Número esperado de pessoas com questionários de amostra e básico para o Censo 2000, considerando frações amostrais alternativas de acordo com a população dos municípios
|
|
|
|
|
|
Frações amostrais alternativas para o Censo 2000 |
|
|
|
|
|
|
|
Mesmas frações de 91 (20% e 10%) |
|
|
|
Municípios com até 15000 hab. (f = 20%) |
|
|
|
Municípios com mais de 15000 hab. (f = 10%) |
|
|
|
|
|
|
|
|
|
|
|
3 frações (20%, 10% e 5%) |
|
|
|
Municípios com até 15000 hab. (f = 20%) |
|
|
|
Municípios com 15001 a 100000 hab. (f = 10%) |
|
|
|
Municípios com mais de 100000 hab. (f = 5%) |
|
|
|
|
|
|
|
|
|
|
|
Variação (frações 20%, 10% e 5% / frações de 91) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Municípios com até 15000 hab. (f = 50%) |
|
|
|
Municípios com mais de 15000 hab. (f = 10%) |
|
|
|
|
|
|
|
|
|
|
|
Variação (frações 50% e 10% / frações de 91) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 frações (50%, 10% e 5%) |
|
|
|
Municípios com até 15000 hab. (f = 50%) |
|
|
|
Municípios com 15001 a 100000 hab. (f = 10%) |
|
|
|
Municípios com mais de 100000 hab. (f = 5%) |
|
|
|
|
|
|
|
|
|
|
|
Variação (frações 50%, 10% e 5% / frações de 91) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A Seleção da Amostra
O princípio fundamental da amostragem probabilística é o de ter as suas unidades selecionadas aleatoriamente. A seleção das unidades investigadas por amostragem constitui uma fase importante da coleta do Censo, pois durante a mesma podem ocorrer sérios inconvenientes nas informações coletadas, conduzindo a diversos tipos de tendenciosidades. Utilizando-se o domicílio como unidade de amostragem, e sendo realizada a seleção pelos recenseadores, durante a coleta, as regras de seleção devem ser simples e de fácil aplicação. Por esse motivo, são adotados processos sistemáticos de seleção, estabelecidos de forma a quebrar ou interromper seqüências cíclicas do universo, de modo a obter bastante variação nas séries sistemáticas de seleção e a evitar o surgimento de tendenciosidades cometidas durante a coleta.
A amostragem sistemática prescinde da existência prévia de cadastro e permite que ele seja construído simultaneamente à seleção da amostra, de tal forma que a operacionalização do processo de seleção (por intervalos pré-fixados), dentro de cada setor é simples e de fácil aplicação pelos recenseadores.
O cadastro para a seleção da amostra de cada setor é construído a partir do registro nas Folhas de Coleta de cada unidade visitada identificada, conforme a espécie da unidade: domicílio particular ocupado, domicílio particular fechado, domicílio particular de uso ocasional, domicílio particular vago, domicílio coletivo e não residencial.
Nas Folhas de Coleta de cada setor são numerados, em ordem crescente, todos os domicílios particulares permanentes relacionados, quer sejam ocupados, fechados, de uso ocasional ou vagos e os domicílios particulares improvisados, constituindo o cadastro para a seleção dos domicílios particulares.
Para cada domicílio coletivo registrado nas Folhas de Coleta, de cada setor, são preparadas Folhas de Domicílio Coletivo, com o registro e numeração das unidades (famílias e pessoas sós residentes) ocupadas por moradores, constituindo o cadastro para a seleção das unidades em domicílios coletivos, independente do cadastro de seleção dos domicílios particulares.
Embora algumas tendenciosidades cometidas durante a coleta possam ser atenuadas através de processo de estimação, esforços e controles devem ser previstos e seguidos rigorosamente durante a coleta, a fim de que essas tendenciosidades não prejudiquem significativamente as demais fases de apuração do Censo.
A Estimação
Os dados coletados exclusivamente no questionário da amostra alimentam um processo de estimação que permite generalizar a informação da amostra para a população da qual foi extraída, dando origem às estimativas das características de domicílios, famílias e de pessoas investigadas por amostragem.
Nos censos anteriores a metodologia adotada para a expansão da amostra fez uso das informações disponíveis para o total da população para o emprego de estimadores mais apropriados (e complexos) que os estimadores naturais do desenho amostral e foi aplicada separadamente para cada área de ponderação. Área de ponderação é a menor área geográfica para a qual são calculadas estimativas baseadas nas informações do questionário da amostra. É o nível geográfico definido para a aplicação dos procedimentos de calibração das estimativas com as informações conhecidas para a população como um todo. Uma área de ponderação é sempre um conjunto de setores e cada setor pertence a uma única área de ponderação.
O conhecimento de totais da população para um subconjunto de características investigadas (as quais são pesquisadas a 100%) torna viável a aplicação de metodologias de estimação para a obtenção de pesos ou fatores de expansão para a amostra do Censo Demográfico, as quais procuram, entre outras finalidades, satisfazer os seguintes objetivos principais:
a) buscar a consistência das estimativas a partir da amostra com os totais conhecidos da população para as características investigadas a 100%;
b) obter estimativas mais precisas para as características investigadas por amostragem;
c) controlar, na estimação, possíveis tendências ocorridas durante a coleta dos dados, especialmente na aplicação do mecanismo de seleção da amostra de domicílios e pessoas.
A metodologia de estimação adotada para a expansão da amostra do Censo Demográfico de 91 baseou-se num procedimento de estimação por mínimos quadrados generalizados em duas etapas. Essa metodologia foi adotada em função dos estudos e da pesquisa conduzidos pela equipe de metodologia, e trata-se de um procedimento desenvolvido pelos técnicos do Statistics Canada e aplicado na expansão da amostra do Censo de População canadense em 1991 e 1996, que, em sua essência, é parecido com o Censo Demográfico brasileiro.
A metodologia utilizada em 1991 consistiu em determinar os pesos ou fatores de expansão ajustados para as unidades amostrais tais que são satisfeitas certas restrições. Primeiro, é minimizada a distância entre os pesos finais ajustados e os pesos iniciais, sujeito às restrições que buscam igualar estimativas amostrais aos valores conhecidos do universo para um conjunto de variáveis auxiliares comuns à amostra e universo de cada área de ponderação. Para o Censo 2000, estão sendo pesquisados/estudados novos métodos de ponderação e estimação para selecionar e incorporar as variáveis auxiliares cujos totais são conhecidos para 100% da população.
Em 1991, as áreas de ponderação foram definidas por grupos mutuamente exclusivos de setores, considerando os níveis geográficos mais detalhados da base operacional, como forma de atender a demandas por informações em níveis geográficos menores que os municípios. Para o Censo 2000, estão sendo estudados métodos e sistemas automáticos de formação de áreas de ponderação que conjuguem critérios tais como tamanho (áreas geográficas pequenas), contiguidade (no sentido de serem constituídas por conjuntos de setores vizinhos) e homogeneidade (em relação a um conjunto de características populacionais e de infra-estrutura conhecidas).
Referências
Albieri, S. Uma discussão sobre a fração amostral na coleta dos dados dos Censos Demográficos Brasileiros. Rio de Janeiro: IBGE, Departamento de Metodologia, 1998. 12p.
Albieri, S. e Bianchini, Z.M. Sobre o uso de amostragem de setores na coleta dos dados dos Censos Demográficos Brasileiros. Rio de Janeiro: IBGE, Departamento de Metodologia, 1998. 12p.
Bianchini, Z.M. e Albieri, S. Estudo de alternativas para as frações de amostragem do Censo Demográfico 2000. Rio de Janeiro: IBGE, Diretoria de Pesquisas, 1999.
Costa, L.N. Aplicação da amostragem na coleta dos censos demográficos no Brasil. Rio de Janeiro: Revista Brasileira de Estatística, v.48 n.189/190. pp. 35-64. 1987.
IBGE. Metodologia do Censo Demográfico de 1980. Rio de Janeiro: IBGE, 1983. (Série Relatórios Metodológicos, vol. 4) .
Pinheiro, J.C.R.C. e Lima, J. M. Avaliação dos efeitos de redução da fração de amostragem no Censo Demográfico. Revista Brasileira de Estatística, Rio de Janeiro, v.5, n. 195, pp 53-84, 1990.
Silva, L.F. e Bianchini, Z.M. A redução da amostra e a utilização de duas frações amostrais no censo demográfico de 1990. Rio de Janeiro: IBGE, 1990. (Textos para Discussão, nº 33)
Silva, P.L.N.; Bianchini, Z.M. e Albieri, S. Uma proposta de metodologia para a expansão da amostra do Censo Demográfico de 1991. Rio de Janeiro: IBGE, 1993, 106p. (Textos para Discussão, n.62).