• No results found

Em um processo de avaliação de uma política pública, deseja-se determinar o impacto da mesma, bem como verificar se existe uma relação de causalidade da política sobre uma variável de interesse qualquer. As estimativas do impacto da política de crédito rural para agricultores familiares sobre as produtividades da terra e do trabalho, utilizando dados observacionais, foram calculadas a partir da comparação baseada no escore de propensão. De acordo com Angrist e Pischke (2008), ao realizar o pareamento com dados observacionais, as estimativas poderão não ter uma interpretação causal. A interpretação causal das estimativas calculadas pelo escore de propensão se baseia no pressuposto estatístico de independência condicional (Conditional Independence Assumption – CIA).

As primeiras estimativas do impacto de políticas públicas foram feitas utilizando regressão múltipla. Dessa forma, tem-se que:

= + + + (1)

Sendo , por exemplo, a produtividade da terra ou do trabalho do estabelecimento agropecuário ; a variável binária que indica a participação em um programa de crédito rural; e o conjunto de covariáveis. e são os parâmetros; é o termo do erro aleatório; e mensura o valor estimado do impacto do tratamento para o estabelecimento .

Então, de acordo com Angrist e Pischke (2008), para avaliar a esperança condicional da equação 1 na situação = (tratamento) e = controle), tem-se:

[ | = ] = + + [ | = ] (2)

Então, para dado ,

[ | = ] − [ | = ] = + [ | = ] − [ | = ] (3)

Nesta expressão, é o efeito tratamento e [ | = ] − [ | = ], o viés de seleção. O viés de seleção corresponde à correlação entre e , considerando que:

[ | = ] − [ | = ] = [ | = ] − [ | = ] (4)

[ | = ] representa o contrafactual, ou seja, o que teria acontecido com a produtividade da terra e do trabalho dos estabelecimentos pertencentes ao grupo de controle caso eles fossem beneficiários; e [ | = ] simboliza a média das produtividades do grupo de controle dado que ele não recebeu montante algum de crédito. Se fosse definido aleatoriamente, a regressão de sobre estimaria o efeito causal de interesse . Para se obter uma boa estimativa de , a variável de interesse deve ser independente dos resultados potenciais . Essa pressuposição garante a hipótese de independência condicional, permitindo a interpretação causal dos parâmetros estimados. Nessa condição, os grupos de tratamento e controle que estão sendo comparados são, de fato, comparáveis.

De acordo com Angrist e Pischke (p.11, 2008), a diferença observada é composta por um efeito causal do tratamento e um viés de seleção:

[ | = ] − [ | = ] = [ − | = ] + [ | = ] − [ | = ] (5) O termo [ − | = ] mensura o efeito médio causal da política de crédito rural nas produtividades da terra e do trabalho dos estabelecimentos agropecuários. Quando o experimento é realizado de forma aleatória, o viés de seleção é nulo. Assim:

[ ] = [ | = ] = [ | = ]

{ , } ⊥ (6)

[ ] = [ | = ] = [ | = ]

Quando não é possível obter os dados experimentais, pode-se utilizar o método de pareamento sobre as covariáveis (Exact Matching on Covariates), de acordo com Dehijaa e Wahba (2002). A partir desse método, consegue-se substituir a ausência de um grupo de

controle experimental, estimando-se a partir de dados observacionais, desde que a hipótese de independência da variável de interesse com os resultados potenciais seja respeitada.

Angrist e Pischke (2008) afirmam que é possível corrigir o problema de viés de seleção ao selecionar, na amostra, estabelecimentos com características observáveis idênticas, sendo a única diferença entre elas o fato de serem ou não beneficiárias. Assim, a correção do viés pode ser feita incluindo o vetor de características observáveis na equação 3:

{ , } ⊥ |�� (H-1)

[ |��, = ] − [ |��, = ] = [ − |��] + [ |��, = ] −

[ |��, = ] (7)

De acordo com a hipótese (H-1) apresentada por Heckman et al. (1998), ao selecionar um grupo de comparação ele será semelhante a um grupo de controle experimental. Condicional em , a distribuição de dado = terá a mesma distribuição de dado = , de forma que a convergência da média em tornará o viés igual a zero.

De acordo com Dehejia e Wahba (2002) e Angrist e Pischke (2008), na aplicação do pareamento pelas covariáveis, deve-se observar, para cada uma das unidades de tratamento e controle, um vetor de covariáveis e ⊥ |�, ∀ , sendo que o efeito do tratamento para os tratados será:

���� = { [ |��, = ] − [ |��, = ]| = } (8)

Onde ��� representa o efeito do tratamento sobre os tratados = , condicional em ��.

Todavia, a tarefa de se comparar indivíduos com as mesmas características observáveis dificulta a aplicação desse modelo. Faz-se necessário que haja um grupo de controle com muitas informações, com o intuito de encontrar um indivíduo com as mesmas características no grupo de tratamento. Rosenbaum e Rubin (1983) propuseram o método de pareamento por escore de propensão (propensity score matching – PSM) para resolver o problema de suporte comum.

Nesse método, o grupo de controle será baseado na probabilidade de o estabelecimento agropecuário ser beneficiário a partir do vetor de covariadas. Dessa forma, o grupo de tratamento será composto por estabelecimentos agropecuários com características semelhantes ao de grupo de tratamento, exceto no recebimento do programa.

O escore de propensão, segundo Rosenbaum e Rubin (1983), compara indivíduos baseando-se na propensão � � ≡ Pr = | = | . Voltando à hipótese (H-1), se ela for satisfeita, então:

{ , } ⊥ |� �� , ∀ ∈ �� (H-2)

De forma que < � � < para todo ∈ � pertencente a um conjunto . A afirmação em (H-2) será verdadeira se �[ = | , � ] não depender de .

O efeito médio do tratamento sobre os tratados (ATT – Average Effect of Treatment on the Treated) pode ser escrito da seguinte forma, de acordo com Becker e Ichino (2002):

� ≡ { − | = }

� = [ { − | = , �� }]

� = [ { | = , �� } − { | = , �� }| = ] (9)

Sendo e os resultados potenciais do grupo de tratamento e de controle, respectivamente.

O primeiro passo para calcular o efeito do tratamento é estimar o escore de propensão. Isso poderá ser feito utilizando-se um modelo de probabilidade, um lógite ou próbite. A variável dependente será uma binária que indicará a participação ou não no programa de crédito rural. Para o modelo lógite, tem-se:

Pr = | =

+� −�′� (10)

De acordo com Rosenbaum e Rubin (1983), ao estimar-se o escore de propensão através do modelo lógite, o algoritmo utilizado para o seu cálculo será baseado no pressuposto de independência condicional:

⊥ | �� (11)

Já a probabilidade de uma unidade pareada receber o tratamento será definida pela equação 12 abaixo:

Após a estimação do escore de propensão, seguindo o pressuposto ⊥ | � , a distribuição das covariáveis deverá ser similar entre os grupos de tratamento e controle. Por essa razão, após o cálculo do escore de propensão, deverá ser feito um teste t para averiguar se a média das diferenças entre os grupos não são estatisticamente diferente de zero após realizado o pareamento.

Uma vez calculado o o efeito do tratamento �| = será:

�| = = � [(�| = ,� | = )] (13)

No caso da avaliação da política pública de crédito rural no Brasil, pretende-se responder à seguinte pergunta: os recursos disponibilizados para auxílio na produção agropecuária através de credito rural causam impactos nos indicadores de produtividade da terra e do trabalho dos estabelecimentos beneficiários? Como é possível afirmar que, em decorrência dessa política, esses estabelecimentos aumentaram ou reduziram suas produtividades, dado que nenhum dos recursos disponibilizados foi distribuído aleatoriamente entre os seus participantes?

Essa relação de causalidade é possível de resposta a partir do cálculo de diferença de médias apenas quando a política for implementada de forma aleatória ou quando a variável de interesse for independente dos resultados potenciais. Mas, como o atual modelo de política de crédito rural adotado não é implantado de forma aleatória, o viés de seleção não será nulo. Tem- se o “problema fundamental da inferência causal” (Holland, 1986); isto porque não é possível observar empiricamente o que teria acontecido aos estabelecimentos agropecuários participantes da política de crédito caso eles não tivessem participado | = ou, caso contrário, o que teria acontecido aos estabelecimentos agropecuários não participantes caso eles tivessem participado | = .

Para estimar os efeitos da política de crédito rural para os agricultores familiares sobre a produtividade da terra e do trabalho dos estabelecimentos beneficiários, o grupo de tratamento será composto pelos estabelecimentos que recebem algum montante de crédito. Já o grupo de controle será composto pelos estabelecimentos não beneficiários. De acordo com a equação 1, é a variável de interesse (produtividade da terra e do trabalho ) e é a variável binária que indica se o estabelecimento é participante do programa, sendo = para participantes e =

trabalho dos estabelecimentos pertencentes ao grupo de tratamento e a variável mensura as mesmas variáveis, porém pertencentes ao grupo de controle.

Existem diferentes metodologias para realizar o pareamento do escore de propensão e cada uma delas adota um sistema de peso específico, o que será abordado na próxima seção.