O efeito de receber o benef´ıcio do Programa Bolsa Fam´ılia sobre a oferta de trabalho ser´a estimado atrav´es do m´etodo diferen¸cas em diferen¸cas (DD). A ideia ´e basicamente comparar dois grupos, um dos quais foi afetado por uma determinada mudan¸ca de pol´ıtica (grupo de tratamento), e o outro que n˜ao foi afetado mas que possui caracter´ısticas simi- lares ao anterior (grupo de controle). Assume-se que o segundo grupo ‘imite’ o ambiente do grupo que recebeu o tratamento. O problema reside em criar o ambiente de controle.
5..1 O problema de avalia¸c˜ao
Um dos grandes desafios de se verificar o efeito de um tratamento sobre uma vari´avel de interesse ´e responder o que aconteceria com a unidade de observa¸c˜ao, que neste caso ´e o indiv´ıduo, se uma situa¸c˜ao diferente da que ela se encontra fosse observada, o chamado problema do contrafactual. Em outras palavras, para estimar o verdadeiro impacto de um programa sobre a vari´avel de interesse seria necess´ario observ´a-la em duas circunstˆancias: uma em que recebeu o tratamento do programa e outra em que n˜ao o recebeu. No entanto, isto ´e imposs´ıvel, pois n˜ao ´e poss´ıvel observar para o mesmo indiv´ıduo os dois resultados potenciais de uma determinada pol´ıtica: o resultado com tratamento e o resultado sem tratamento.
Para este estudo de caso, a situa¸c˜ao acima pode ser exemplificada da seguinte maneira: suponha um indiv´ıduo i, cuja vari´avel de interesse Y ´e a sua oferta de trabalho. Utiliza-se uma vari´avel dummy que associa o valor 1 para os indiv´ıduos benefici´arios do PBF e 0 caso contr´ario. Y1
i ´e a oferta de trabalho do indiv´ıduo i na presen¸ca do benef´ıcio e Y 0 i ´e
a oferta de trabalho desse mesmo indiv´ıduo na ausˆencia do benef´ıcio. O impacto de ser benefici´ario na oferta de trabalho do indiv´ıduo i ´e mensurado por:
τi = Y 1 i − Y
0
i (5.6)
E o impacto m´edio sobre todos os participantes ser´a dado por:
τi = E(Y 1 i − Y
0
i |Di = 1) (5.7)
τi ´e o parˆametro de interesse. A Equa¸c˜ao 5.7 ´e denominada na literatura de avalia¸c˜ao
de ATT (Average Treatment Effect on the Treated ), o efeito m´edio do tratamento sobre os tratados. Isto ´e:
τAT T = E(τ |Di) = E(Y 1
i |Di = 1) − E(Y 0
i |Di = 1) (5.8)
Contudo, como n˜ao ´e possivel observar o resultado contrafactual, E(Y0
i |Di = 1), pois um mesmo indiv´ıduo nunca apresenta os dois status ao mesmo tempo,
´e necess´ario encontrar um substituto para este resultado. De acordo com Caliendo e Ko- peinig (2005), quando se utiliza E(Y0
i |Di = 0) como substituto surge o problema do vi´es
de sele¸c˜ao, como ´e demonstrado a seguir:
E(Y1 i |Di = 1) − E(Y 0 i |Di = 0) = E(Yi1|Di = 1) − E(Y 0 i |Di = 1) + E(Y 0 i |Di = 1) − E(Y 0 i |Di = 0) = τAT T + E(Y 0 i |Di = 1) − E(Y 0 i |Di = 0) (5.9)
O vi´es de sele¸c˜ao ´e justamente a diferen¸ca entre o lado direito da Equa¸c˜ao 5.9 e o τAT T.
Portanto, as estimativas do verdadeiro efeito m´edio do tratamento sobre os tratados, ATT, seriam viesadas.
Uma das t´ecnicas utilizadas para solucionar o problema de n˜ao-observabilidade ´e bus- car grupos que n˜ao tenham recebido tratamento e que possam servir de contrafactual. O procedimento menos viesado para se criar o contrafactual ´e a aleatoriza¸c˜ao do programa. De acordo com Foguel et al. (2012) este m´etodo, muitas vezes chamado de m´etodo ex- perimental, quando bem implementado fornece o balanceamento necess´ario tanto das caracter´ısticas observadas quanto das n˜ao observadas das unidades que comp˜oem os dois grupos. Desta forma, a sele¸c˜ao aleat´oria cria uma situa¸c˜ao na qual n˜ao h´a correla¸c˜ao entre ser ou n˜ao ser tratado e as caracter´ısticas das unidades de observa¸c˜ao. Ou seja, a aleato- riza¸c˜ao torna Di independente do resultado potencial, E(Y
0 i |Di = 0) = E(Y 0 i |Di = 1), de modo que: E(Yi1|Di = 1) − E(Y 0 i |Di = 0) = E(Y 1 i |Di = 1) − E(Y 0 i |Di = 1) = E(Y1 i − Y 0 i |Di = 1) = E(Y 1 i − Y 0 i ) (5.10)
No entanto, a participa¸c˜ao no PBF n˜ao ´e aleatorizada, de modo que para a avaliar o impacto do programa nas vari´aveis de interesse precisa-se de uma estrat´egia de identifica- ¸c˜ao do parˆametro τAT T que elimine o potencial vi´es de sele¸c˜ao da amostra. Segundo Pel-
legrina (2010) este vi´es ´e gerado, primeiramente, pelo pr´oprio crit´erio de elegibilidade do programa. O governo estabelece crit´erios como medidas de pobreza para identificar quem ´e ou n˜ao eleg´ıvel ao benef´ıcio do programa. Al´em disso, as fam´ılias se auto-selecionam
para o programa com base nesses crit´erios, podendo existir caracter´ısticas n˜ao observadas correlacionadas ao recebimento do tratamento que tamb´em estejam afetando a vari´avel de interesse. Diversos m´etodos n˜ao-experimentais permitem contornar o problema do vi´es de sele¸c˜ao, neste trabalho faz-s uso de um deles, o chamado m´etodo de diferen¸cas em diferen¸cas.
5..2 Diferen¸cas em diferen¸cas
A estrutura mais b´asica do m´etodo de DD ´e aquela em que a vari´avel de interesse ´e observada para dois grupos por dois per´ıodos de tempo. Um dos grupos ´e exposto ao tratamento no segundo per´ıodo mas n˜ao no primeiro per´ıodo. O segundo grupo n˜ao ´e exposto ao tratamento em nenhum per´ıodo. Ou seja, para se analisar as diferen¸cas entre os dois grupos necessita-se de dados anteriores ao evento e posteriores ao evento para os dois grupos. A premissa b´asica ´e examinar o efeito do programa ao subtrair da mudan¸ca ocorrida no primeiro grupo (tratados) a mudan¸ca ocorrida no segundo grupo (controle).
Este procedimento remove o vi´es das compara¸c˜oes no segundo per´ıodo entre os dois grupos que seriam resultantes de diferen¸cas permanentes entre os grupos, bem como o vi´es das compara¸c˜oes entre os dois per´ıodo de tempo que o grupo de tratamento presen- ciou e que s˜ao resultantes de tendˆencias e de caracter´ısticas fixas no tempo para os dois grupos. Para apresentar este argumento formalmente, considere a seguinte estrutura para o impacto do programa:
Yit= β0+ β1Trati+ β2P´ost+ γi(TratiP´ost) + eit (5.11)
Onde Yit ´e a vari´avel de interesse, Tratit´e um indicador igual a 1 quando o indiv´ıduo
recebe tratamento e 0 caso contr´ario, essa vari´avel captura as poss´ıveis diferen¸cas entre o grupo de tratamento e de controle antes da mudan¸ca de pol´ıtica. P´osit ´e um indicador
igual a 1 caso o indiv´ıduo esteja no segundo per´ıodo e 0 caso esteja no per´ıodo base, essa vari´avel captura os fatores agregados que teriam causado altera¸c˜oes em Yit mesmo
que a mudan¸ca de pol´ıtica n˜ao tivesse acontecido. E eit s˜ao as vari´aveis n˜ao observadas
do indiv´ıduo que podem afetar tanto a vari´avel dependente quanto o tratamento. Neste modelo, γi mede o impacto do programa sobre a vari´avel de interesse para cada indiv´ıduo,
β1 mede o efeito de grupo e β2 o efeito de tempo.
Al´em disso, ´e poss´ıvel incluir vari´aveis de controle adicionais na equa¸c˜ao de estima¸c˜ao por diferen¸cas em diferen¸cas. Isto faz com que poss´ıveis diferen¸cas sistem´aticas nas amos- tras dentro de um grupo nos diferentes per´ıodos de tempo n˜ao sejam confundidas com um poss´ıvel efeito do tratamento. A equa¸c˜ao da regress˜ao ajustada, que inclui vari´aveis de controle, pode ser escrita como:
Yit = β0+ β1Trati+ β2P´ost+ γi(TratiP´ost) + β3Xi+ eit (5.12)
O coeficiente no termo de intera¸c˜ao (γi) ´e o estimador diff-in-diff do efeito do trata-
mento e pode ser obtido atrav´es da solu¸c˜ao de m´ınimos quadrados ordin´arios (MQO) de γ na seguinte equa¸c˜ao:
Yi1− Yi0= γiTrati+ ei1− ei0
Note que nesta especifica¸c˜ao, o estimador MQO ˆγ pode ter a seguinte interpreta¸c˜ao. Denote YC0 a m´edia amostral de y para o grupo de controle antes da implementa¸c˜ao do
programa, e YC1 a m´edia amostral de y para o grupo de controle depois da implementa¸c˜ao
do programa. Defina YT0 e Y T
1 de maneira similar para o grupo de tratamento. Deste
modo, ˆγ ser´a expressado como:
ˆ γ = (YC1 − Y C 0) − (Y T 1 − Y T 0)
De acordo com Wooldridge (2010), para ver o qu˜ao efetivo ˆγ ´e para estimar o efeito de pol´ıticas deve-se comparar este com alguns estimadores alternativos. Uma possibilidade ´e ignorar o grupo de controle completamente e utilizar a mudan¸ca na m´edia que ocorre no tempo para o grupo de tratamento, YT1 − Y
T
0, para medir o efeito da pol´ıtica, como pode
ser visto na Figura 2(a). O problema com este estimador ´e que a resposta m´edia pode mudar no tempo por raz˜oes n˜ao relacionadas a mudan¸ca de pol´ıtica. Outra possibilidade ´e ignorar o primeiro per´ıodo, como na Figura 2(b), e estimar a diferen¸ca nas m´edias entre os grupos de tratamento e controle no segundo per´ıodo de tempo, YT1−Y
C
1. O problema com
este procedimento ´e que devem haver diferen¸cas entre os grupos que n˜ao est˜ao relacionadas com o tratamento. Desta forma, ao controlar por mudan¸cas temporais nas m´edias para os grupos de tratamento e de controle, tal como na Figura 2(c), o estimador ˆγ permite tanto os efeitos espec´ıficos de grupo quanto os de tempo.
Contudo, para que a a tendˆencia temporal do grupo de controle se torne um contra- factual v´alido para a do grupo tratado, ´e necess´ario assumir a seguinte hip´otese:
E(ei1− ei0|Di = 1) = E(ei1− ei0|Di = 0)
Essa condi¸c˜ao ´e conhecida como hip´otese da tendˆencia paralela. A ideia ´e que uma trajet´oria temporal semelhante indica que ambos os grupos vinham reagindo de forma similar a todo e qualquer fator que afeta a vari´avel de interesse antes da interven¸c˜ao, como afirma Foguel et al. (2012). Desta forma, sup˜oe-se que o que quer que tenha acontecido
(a) (b)
(c)
Figura 2: Diferen¸cas em diferen¸cas
com o grupo de controle depois da interven¸c˜ao ´e o que teria acontecido com o grupo de tratamento na ausˆencia do programa. Note que esta condi¸c˜ao n˜ao exige que os grupos partam exatamente do mesmo ponto antes do programa, e sim que tenham a mesma tendˆencia temporal.
Contudo, essa condi¸c˜ao n˜ao ´e diretamente test´avel, pois n˜ao ´e poss´ıvel saber se a evolu¸c˜ao da vari´avel de interesse para o grupo de controle representa bem o contrafactual dessa vari´avel para o grupo tratado ap´os o programa. Suponha que Y segue uma tendˆencia diferente para o grupo de tratamento e de controle, de modo que a tendˆencia do grupo de controle ´e βC
2 = β2, enquanto que a tendˆencia do grupo de tratamento ´e β T
2 = β2+ ∆.
Neste caso o estimador de diferen¸cas em diferen¸cas ser´a viesado. Um jeito de evitar este problema ´e utilizar dados de outros per´ıodos de tempo, antes e depois do tratamento, para verificar se h´a alguma diferen¸ca nas tendˆencias. Outra solu¸c˜ao poss´ıvel seria encontrar outros grupos de controle que possam fornecer uma tendˆencia adicional.
Al´em da hip´otese da tendˆencia paralela, o m´etodo DD requer tamb´em que entre os per´ıodos antes e depois do programa, a composi¸c˜ao dos grupos de tratamento e de controle n˜ao tenham se alterado de forma significativa, e nem que estes grupos sejam afetados de forma diferente por mudan¸cas de quaisquer natureza que tenham ocorrido entre o intervalo de tempo analisado.