• No results found

Hvordan grunnverdier kommer til uttrykk i dokumentene jeg har analysert

Del V Drøfting

5.1 Hvordan grunnverdier kommer til uttrykk i dokumentene jeg har analysert

O método de Propensity Score Matching (PSM), ou pareamento por escore de propensão, é uma tentativa de se imitar as características da estimação da relação causal de um experimento aleatório. Esse método requer que seja satisfeita a hipótese de independência condicional (HIC), descrita anteriormente, para que os estimadores do pareamento apresentem uma interpretação causal. Colocando em outros termos, ao utilizar o método PSM supõe-se

36 que a designação do tratamento às unidades de estudo depende apenas das variáveis observáveis, .

De forma geral, o pareamento é um método em que é construído um grupo de controle similar ao grupo de tratamento tomando como base a distribuição de variáveis observadas. Angrist e Pischke (2009) chamam a atenção para a similaridade entre os estimandos do método de pareamento por observáveis e os estimandos obtidos por regressão. Segundo os autores, a diferença entre os dois estimandos se dá apenas quanto aos pesos que são utilizados para combinar os efeitos específicos das variáveis observadas em um único efeito médio de tratamento. Enquanto que o pareamento coloca mais peso nas células em que são mais prováveis de serem tratadas, a regressão coloca mais peso nas células em que a variância condicional da variável de tratamento é maior. Além disso, os autores observam que nenhum dos dois métodos, regressão e pareamento, coloca qualquer peso nas células em que não são contidas tanto observações de unidades do grupo de controle quanto observações de unidades do grupo de tratamento. Essa é a segunda hipótese auxiliar que permite a estimação da relação causal do método de pareamento: condição de suporte comum. Formalmente,

Essa condição assegura que as observações do grupo de tratamento tenham observações comparáveis do grupo de controle quanto às características . Como é apenas na área em que existe suporte comum que é possível realizar inferências causais, em contextos em que essa condição é fracamente satisfeita pode ser necessário eliminar as observações que não pertencem a esse conjunto. Ou seja, eliminam-se observações de unidades de controle que não sejam comparáveis, quanto a distribuição das variáveis observadas, às unidades de tratamento e/ou eliminam-se observações de unidades de tratamento que não sejam comparáveis às observações das unidades do grupo de controle. Deve-se ter cuidado quanto a esse último procedimento, pois como afirma Ravaillon (2008) isso implica em um trade-off entre duas fontes de viés: “por um lado existe a necessidade de se assegurar comparabilidade nas características observadas, por outro (esse procedimento) cria um possível viés de amostragem na inferência sobre o impacto”. Dessa forma, como observa Khander et al. (2010), nessas situações, é necessário examinar as características das observações eliminadas para interpretar o viés potencial nos efeitos de tratamento estimados.

De uma forma geral, o pareamento se torna inviável quando são muitas as variáveis que devem ser correspondidas entre o grupo de tratamento e o grupo de controle. O Teorema do Escore de Propensão, proposto por Rosenbaum e Rubin (1983), torna prático o pareamento

37 ao reduzir o número de variáveis do vetor a um único escalar, a probabilidade de recebimento do tratamento, dado as características observadas. Como mostra Angrist e Pischke (2009), o teorema do escore de propensão pode ser enunciado da seguinte forma:

Teorema do Escore de Propensão: Suponha que a Hipótese de Independência Condicional (HIC) é satisfeita tal que { } então { }

Esse teorema afirma que se os resultados potenciais são independentes da variável de tratamento condicionada a um vetor multivariado , então os resultados potenciais são independentes da variável de tratamento condicionada a uma função escalar desse mesmo vetor, que é o escore de propensão, definido como [ ] [ ].

Outra hipótese necessária para a estimação dos efeitos de tratamento utilizando métodos de pareamento é o critério de balanceamento. Lee (2006) afirma que o critério de balanceamento é satisfeito quando para cada valor do escore de propensão, tem a distribuição similar para os grupos de tratamento e controle. Formalmente,

Como alerta Lee (2006), a hipótese de independência condicional é distinta da hipótese de balanceamento. Uma não implica na outra. Por exemplo, “mesmo que a HIC seja satisfeita, a propriedade de balanceamento pode não ser válida porque pode ser um escore inadequado, talvez pelo fato de a forma funcional de não estar representada corretamente ao se estimar ”.

Sendo válidas todas as hipóteses apresentadas, para a estimação do efeito causal da política em estudo é necessário apenas comparar as unidades do grupo de controle e do grupo de tratamento que apresentam a mesma probabilidade de recebimento do tratamento. Angrist e Pischke (2009) apontam que a estimação por escore de propensão se dá em dois passos: “primeiro estima-se com algum modelo paramétrico, como probit ou logit. Em seguida, a estimação do efeito do tratamento pode ser computada ou pelo pareamento do valor encontrado no primeiro passo ou utilizando algum esquema de pesos”.

Anteriormente foi visto que o efeito médio de tratamento nos tratados (ATT), quando se supõe a hipótese da independência condicional (HIC), é [ ]. Pelo teorema do

escore de propensão e supondo a HIC, o ATT resultante do pareamento direto dos valores de propensão entre tratados e não tratados, aplicando a lei de expectativas iteradas sobre , é:

38 Smith e Todd (2005) apontam que o estimador típico do pareamento por escore de propensão tem a seguinte forma:

[∑

]

Onde é o número de indivíduos tratados pertencentes à região de suporte comum e é o esquema de pesos utilizado para agregar o resultado potencial dos indivíduos do grupo de controle e depende do escore de propensão do participante i, , e do escore de propensão do não-participante j, ( ).

Quanto às abordagens que utilizam esquemas de pesos, Ravaillon (2008) indica que os grupos de comparação são formados ao selecionar os “vizinhos mais próximos” de cada unidade do grupo de tratamento. Esses “vizinhos” são aquelas unidades do grupo de controle que minimizam a expressão ( ) . Na literatura foram identificadas diversas metodologias de pesos para a estimação do ATT utilizando propensity score matching:

nearest-neighbor, radius, stratification, kernel e local linear matching. Becker e Ichino

(2002) apresentam uma visão geral dos métodos focando no trade-off entre a qualidade e a quantidade de pareamentos:

O método de estratificação consiste em dividir a distribuição de escore de propensão estimada em intervalos tal que em cada bloco unidades de tratamento e unidades de controle tenham em média o mesmo escore de propensão. Em seguida, dentro de cada intervalo, é computada a diferença das médias das variáveis de efeito de tratados e não-tratados. O ATT do tratamento é obtido como uma média dos ATTs de cada bloco ponderada pelos pesos dados pela distribuição dos tratados em cada bloco. Pelo método de estratificação, caso haja blocos que não contenha observações de tratados e de não-tratados, ou seja, caso contenha observações de apenas um dos grupos, esse bloco é descartado.

Esse problema é, em parte, resolvido pelo método de nearest-neighbor, vizinho mais próximo, que consiste em comparar cada unidade de tratamento com a unidade de controle com o escore de propensão mais próximo. Assim que cada unidade de tratamento é pareada com uma unidade de controle, o ATT é obtido pela média das diferenças nas variáveis de interesse entre tratados e não-tratados. Por esse método, toda unidade de tratamento é pareada com uma unidade de controle, mas esse pareamento pode acabar ocorrendo entre valores muito distantes de escore de propensão, não representando um contrafactual bem construído. Esse é um problema solucionado pelos métodos de pareamento radius e kernel.

39 O método radius consiste em determinar uma vizinhança do escore de propensão de cada unidade de tratamento e parear com unidades de controle que pertençam a essa vizinhança. Quanto menor o raio da vizinhança, o pareamento é feito com melhor qualidade. No entanto, com o raio menor, mais provável que algumas unidades de tratamento não sejam pareadas, já que pode não haver nenhuma unidade de controle pertencente à vizinhança determinada.

Pelo método kernel, todas as unidades de tratamento são pareadas com uma média ponderada de todas as unidades de controle, em que os pesos utilizados são inversamente proporcionais à distância entre os valores do escore de propensão dos tratados e dos não- tratados:

(

) ∑ ( )

Onde representa uma função kernel e é o um parâmetro denominado janela. Outro ponto importante a ser analisado é quanto às quais variáveis incluir no vetor de controle, . Segundo Ravaillon (2008), elas devem ser relevantes para a designação e participação no tratamento, levando em consideração os fatores econômicos, sociais e políticos do programa e do contexto, e devem ser correlacionadas aos resultados do contrafactual.

Dessa forma, o método de pareamento por escore de propensão depende do grau em que as características observadas explicam a participação no programa. Esse método pode fornecer uma boa estimação do efeito causal do tratamento se se puder considerar insignificante o viés gerado pelas características não-observáveis.

40 3 O Programa de Regularização Fundiária no Distrito Federal