6 DRØFTING
6.1 Risiko og barrierestyring
6.1.1 Barrierer, et sammensatt begrep
2.5.1 Características gerais das pesquisas domiciliares
Segundo Deaton (1997), a construção de amostra de pesquisas domiciliares pode ser feita de duas formas, ambas tomando como referência os dados do Censo. Na primeira, a seleção de domicílios é feita de forma aleatória diretamente a partir dos dados brutos do Censo. Na segunda e mais comum, a seleção envolve dois estágios, a seleção de localidades e a seleção
88
de domicílios48. O primeiro estágio é crucial na definição das características da pesquisa domiciliar. Tendo em vista as dimensões relativas ao consumo e aos rendimentos domiciliares, o desenho das pesquisas amostrais lida com quatro fatores que induzem a subdeclaração e, posteriormente, subestimação: imputação; viés de recall; sazonalidade e tamanho de questionários. Por fim, em sua clássica caracterização, Deaton (1997:30) argumenta que os desenhos das pesquisas de amostras domiciliares têm dificuldades de capturar os rendimentos oriundos de negócios familiares.
A pesquisa com amostra de domicílios no México (Encuesta Nacional de Ingreso-Gasto
de los Hogares, ENIGH) é realizada pelo Instituto Nacional de Estadística, Geografía e Informática (INEGI), órgão do governo federal. Em termos específicos, as pesquisas buscam
captar informações sobre as características dos domicílios, da situação socioeconômica das famílias e dos indivíduos que neles habitam. A unidade de amostra é a residência, enquanto a unidade de análise é a família.
Segundo o INEGI (2004) a amostra da ENIGH de 2004 foi composta por 25.115 residências, das quais 18.428 distribuídas em todo território nacional, 3.245 residências do Distrito Federal (Cidade do México) e 3.442 residências no estado de Nuevo León. Dentro da amostra estão contempladas regiões com menos de 2.500 habitantes, definidas como rurais, enquanto as regiões urbanas correspondem àquelas cuja população é superior a esse número. A seleção de municípios segue critérios probabilísticos, pois o objetivo é que os dados sejam representativos da realidade nacional.
Em termos quantitativos, a ENIGH de 2006 foi composta por uma amostra de 25.443 residências, das quais 18.490 em regiões urbanas e 6.953 em regiões rurais (INEGI, 2006). A seleção de municípios manteve os critérios probabilísticos adotados na Enigh de 2004, bem como foram mantidos os procedimentos para captura e processamento da informação.
O processo de composição da amostra da ENIGH 2008 passou por mudanças significativas (INEGI, 2008). Dentre as principais mudanças, destaca-se a introdução da possibilidade de desagregar os dados através dos índices de marginalização regional, desenvolvido pelo Consejo Nacional de Poblacion (CONAPO). Além disso, os pesos de estados, municípios foram recalculados para regiões metropolitanas49. A ENIGH de 2008 foi
48 Deaton (1997) destacou que a definição de domicílio não é consensual, no mesmo sentido, e de forma mais atual, Januzzi et alii (2013) ressaltam que um dos desafios atuais nas pesquisas amostrais é estabelecer um critério homogêneo de demarcação entre domicílio e família. Em termos práticos, a unidade domiciliar pode comportar mais de uma família, desse modo, as variáveis domiciliares apresentam, potencialmente, superestimação.
49
Os estados e regiões metropolitanas que tiveram a representatividade modificadas foram: México, Distrito Federal, Jalisco, Guanajuato, Querétaro, Sonora e Yucatán.
89 composta por 29.468 residências, das quais 22.734 em regiões urbanas e 6.734 em regiões rurais. A despeito das mudanças nos critérios probabilísticos, foram mantidos os procedimentos para captura e processamento da informação.
Por fim, a ENIGH 2010 manteve o modelo introduzido em 2008, estando a única alteração na composição da amostra, que operou com 30.169 residências, dentre as quais 23.320 estavam em regiões urbanas e 6.849 em regiões rurais (INEGI, 2010).
O processo de tratamento dos dados também envolve três etapas: a primeira consiste na aplicação dos questionários com as equipes em campo, para captura e posterior tratamento; a segunda é a aplicação de filtros para checagem das possíveis inconsistências com o questionário original; por fim, os técnicos do INEGI calculam as frequências por questão, com os últimos ajustes e exclusões.
O questionário está organizado em três campos: informações da residência; informações socioeconômicas da(s) família(s) que habita(m) a residência; percepção do ingresso de renda monetária e não monetária. A partir dessas informações, são gerados arquivos temáticos, os quais permitem alcançar as questões específicas, além de um arquivo que agrega características dos três campos.
Com relação ao PTC brasileiro, a Pesquisa Nacional por Amostra de Domicílios é realizada anualmente pelo Instituto Brasileiro de Geografia e Estatística (IBGE), exceto em anos censitários. Segundo Medeiros (2001:37), o desenho amostral da PNAD é realizado em três estágios: no primeiro, ocorre a seleção de municípios com grande população, sobretudo as capitais e aqueles inseridos em regiões urbanas; a segunda etapa consiste em nova seleção de municípios, dessa vez, para cada município atribui-se uma probabilidade proporcional ao número de domicílios à época do último Censo; a terceira e última etapa consiste na seleção de domicílios.
No plano analítico, Medeiros (2001:39) argumenta que a literatura registra três tipos de erros recorrentes nos estudos a partir da PNAD: o primeiro consiste na elaboração de comparações baseadas em valores absolutos, em especial em análises longitudinais; o segundo ocorre quando os pesquisadores consideram o efeito de pequenas variações, as quais, geralmente, podem ser explicadas pelas diferenças na composição amostral dentro do intervalo analisado; o terceiro erro está nas comparações de valores entre décadas diferentes, as quais não se sustentam, uma vez que toda PNAD é desenvolvida a partir da base populacional do Censo.
90
A partir de 2004 a PNAD passou a incorporar os municípios rurais da região norte do país, fato que aprimorou o desenho amostral dessa pesquisa, pois definiu um novo conjunto formado por todas as unidades federativas do Brasil (IBGE, 2004). Em termos específicos, a amostra de 2004 foi composta por 139.157 unidades domiciliares, a amostra de 2006 por 145.547 domicílios, enquanto em 2008 a amostra reuniu 150.591 domicílios, durante o período 2004-2008 o IBGE adotou o mesmo critério para o desenho das amostras domiciliares (IBGE, 2004, 2006, 2008).