O Curioso caso do Censo de 1960

Imprimir

O processamento da amostra do Censo de 1960 sofreu algumas intempéries e não se deu dentro do período planejado (ver BARBOSA et al, 2013). Com vistas a acelerar a divulgação dos dados, em 1965, uma sub-amostra probabilística de aproximadamente 1,27% da população foi extraída a partir dos lotes de questionários da amostra de 25%. 

A amostra de 25% era sistemática: 1 a cada 4 domicílios respondiam o questionário maior. Depois da coleta, esses questionários ficaram guardados em "pastas" (com aproximadamente 250 unidades) no IBGE, organizadas com indicativo dos setores censitários que continham. Havia então como diferenciar por UF, urbano/rural e tamanho de município. A amostra de 1,27% é uma amostra estratificadas desses conglomerados (pastas). O procedimento de amostragem e os resultados produzidos a partir desse banco estão descritos no Volume 2 dos resultados preliminares do Censo de 1960 (veja aqui). Esse banco de dados possui 869.861 registros de indivíduos. Se assumimos que a população em 1960 era de 70.992.343  (de acordo com o documento "Sinopse do Censo Demográfico 2010"), então temos uma fração amostral de 1,268% -- o que o IBGE denominava "aproximadamente 1,27%". 

 O banco de dados do Censo de 1960 que o Censo de Estudos da Metrópole disponibiliza refere-se a esta amostra. O próprio IBGE não a disponibiliza para venda em sua loja virtual. Esta versão nos foi concedida por meio de uma doação do professor e pesquisador Carlos Antônio Costa Ribeiro (IESP/UERJ), que por sua vez a obteve como doação do professor Nelson do Valle Silva que havia, entre 1973 e 1980, trabalhado na Diretoria de Informática e no Departamento de Estudos de População do IBGE e teve acesso direto aos dados -- que acabou por utilizá-los em sua tese de doutorado, defendida na Universidade de Michigan. 
 
Ocorre, no entanto, que o sistema de gravação das informações, na época, se dava por fitas, cujo sistema de leitura e gravação era serial e muito menos confiável. Por esta razão, alguns registros apresentam problemas, que possivelmente decorrem do "descarrilhamento" na gravação da fita -- um indício de que teria sido esse o caso reside no fato de que os registros (linhas do banco de dados) com valores inválidos ou improváveis numa variável apresentam valores inválidos ou absurdos também noutras variáveis. Acreditamos, no entanto, que a quantidade de linhas com problemas não ultrapasse 0,2% do total -- ou seja, seriam seriam menos de 200 registros.
 
As discrepâncias dos resultados descritivos produzidos a partir desses dados e aqueles apresentados no Volume 2 dos Resultados Preliminares do Censo de 1960 são mínimos -- o que nos leva a crer que os problemas existentes não têm grande impacto. 
 
 
Referências: 

BARBOSA, Rogério J.; MARSCHNER, Murillo; FERRARI, Diogo; SILVA, Patrick; PRATES, Ian A.; BARONE, Leonardo S. “Ciências Sociais e Informação Quantitativa no Brasil: Entrevista com Elza Berquó e Nelson do Valle Silva”. Novos Estudos Cebrap, n.95, 2013.