Pesos amostrais e fatores de expansão: viéses nos testes de hipótese
Todas as análises com as amostras dos Censos Demográficos que tiverem como propósito fazer inferências para toda a população devem ser realizadas com o uso de pesos amostrais. Ocorre, no entanto, que os pesos amostrais, por conterem fatores de expansão (e não apenas atuarem como correções contra desproporcionalidades amostrais), acabam por "enganar" os softwares de análise de dados no momento da realização de Testes Estatísticos de Hipótese.
Os resultados desses testes são uma avaliação sobre a capacidade das amostras de dizerem algo sobre a população ou universo. Ou seja, trata-se de uma averiguação da precisão da amostra para distinguir tendências e diferenças que podem estar ocorrendo na população. Quanto maior uma amostra -- isto é, quanto mais seu tamanho se aproxima do tamanho da população -- maior sua precisão; afinal, mais semelhante à própria população vai ter se tornado.
O uso de pesos amostrais com fatores de expansão faz com que os softwares de análise assumam que o banco de dados seria, na realidade, muito maior -- consequentemente, também a precisão amostral seria maior. Os erros-padrão das estimativas são inversamente proporcionais ao tamanho das amostras. Por exemplo, no caso do erro-padrão da média, temos:
Quando usamos a ponderação com fatores de expansão, ao invés de utilizar n (minúsculo, o número de linhas no banco de dados), os softwares assumem que estão trabalhando com N (maiúsculo, o número de indivíduos na população). Consequentemente, na fórmula acima, o valor do denominador será muito maior; fazendo com que o resultado final, o erro da estimativa, seja muito menor. Ou seja, o uso de pesos com fator de expansão gera testes de hipótese enviesados, que seriam muito mais precisos (isto é, apontam significância estatística) do que de fato são.
Pesos analíticos
Não podemos, contudo simplesmente abandonar o uso dos pesos amostrais -- uma vez que têm a função de corrigir também as desproporcionalidades introduzidas pelos desenhos amostrais. O que podemos fazer é construir uma nova variável de pesos, que apenas cumpra essa função -- e que não contenha o fator de expansão.
Fazemos isso da seguinte maneira: