• No results found

Results and Discussion

8.1 Future Work

bons resultados, mesmo que seja poss´ıvel de obtˆe-los. Dessa forma, a utiliza¸c˜ao de algoritmo do tipo MCMC ´e uma alternativa bastante ´util principalmente no ajuste de modelos complexos.

Outros trabalhos que utilizam a metodologia de dados aumentados com MCMC na TRI, s˜ao Baz´an (2005), B´eguin and Glas (2001), Fox and Glas (2001), Fox and Glas (2003) e Sahu (2002). Uma vez que a verossimi- lhan¸ca, para a abordagem de dados aumentados, requer especial aten¸c˜ao, apresenta-la-emos na pr´oxima se¸c˜ao com detalhes.

2.5

Verossimilhan¸ca de dados aumentados

´

E sabido que a verossimilhan¸ca desempenha papel fundamental em qualquer an´alise estat´ıstica, vide Cordeiro (1992). Na inferˆencia bayesiana, ela ´e a respons´avel pela liga¸c˜ao entre a priori e a posteriori. Qualquer que seja a verossimilhan¸ca considerada na an´alise, ´e necess´ario lan¸car m˜ao de algumas suposi¸c˜oes de forma a permitir sua constru¸c˜ao de modo conveniente. Com rela¸c˜ao `a modelagem proposta no presente cap´ıtulo e que se assume, em geral, para a grande maioria dos MRI, tais suposi¸c˜oes s˜ao

• As informa¸c˜oes necess´arias para modelar a probabilidade de resposta s˜ao somente os tra¸cos latentes e os parˆametros dos itens.

• Apenas uma dimens˜ao do tra¸co latente ´e necess´aria para se modelar tal probabilidade (unidimensio- nalidade).

• O tempo dispon´ıvel para se responder o teste ´e suficiente.

• Dado omissos (“missing data”) s˜ao gerados por uma mecanismo de n˜ao-reposta n˜ao-informativo, veja Little and Rubin (2002).

As duas primeiras suposi¸c˜oes est˜ao associadas `a correta especifica¸c˜ao do modelo (2.1). Al´em disso, elas implicam que as respostas de cada indiv´ıduo, aos diferentes itens, s˜ao condicionalmente independentes dado os tra¸cos latentes e os parˆametros dos itens. Em outras palavras, nenhuma outra informa¸c˜ao ´e necess´aria para o c´alculo de tais probabilidades. As duas ´ultimas garantem que o mecanismo gerador dos dados faltantes possui distribui¸c˜ao ignor´avel. Tal estrutura ´e conhecida como MAR (“missing at random”),veja Little and Rubin (2002). Dessa forma, ela pode ser desconsidereda na an´alise, sem se alterar, de modo significativo, os resultados.

A raz˜ao para utilizarmos o esquema de dados aumentados ´e que este permite obter distribui¸c˜oes condicionais completas, veja Gamerman and Lopes (2006) por exemplo, com forma funcional mais simples, vide Albert (1992). Al´em disso, ao se considerar um esquema de dados aumentados, introduzimos um modelo mais geral. Um tercerio aspecto ´e que tal abordagem permite construir mecanismos de ajuste do modelo de modo mais

direto, veja Fox (2001). A id´eia geral por tr´as do esquema de dados aumentados ´e definir um conjunto de vari´aveis n˜ao-observ´aveis baseado nos dados observados (respostas ao itens). Mais especificamente, o objetivo ´e o de utilizar a verossimilhan¸ca gerada por esses dados aumentados ao inv´es da verossimilhan¸ca original. Isto se traduz, por sua vez, em utilizar a distribui¸c˜ao condicional das vari´aveis aumentadadas dada as vari´aveis observadas e os parˆametros, vide Tanner and Wong (1987). O processo de inferˆencia ent˜ao ´e baseado na verossimilhan¸ca aumentada e n˜ao mais na verossimilhan¸ca original, vide Tanner and Wong (1987). No presente contexto, utilizando a FRI dada em (2.1), as vari´aveis aumentadas s˜ao, essencialmente, as mesmas definidas por Albert (1992). Estas s˜ao dadas por

Zijk|(θjk, ζi, yijk) =

(

N (aiθjk− bi, 1)11(zijk≥0), se Yijk= 1, N (aiθjk− bi, 1)11(zijk<0), se Yijk= 0,

(2.3)

em que 11(zjik≥0) ´e a fun¸c˜ao indicadora usual, isto ´e, ´e igual a 1 se o argumento for verdadeiro e 0 caso contr´ario. As suposi¸c˜oes descritas anteriormente garantem que estas vari´aveis s˜ao mutuamente independentes, condicionadas aos tra¸cos latentes, aos parˆametros dos itens e as respostas.

Note que se escrevermos

Yijk= 11(zijk≥0), (2.4)

vem que

P (Yijk = 1|θjk, ζi) = P (11(zijk≥0)= 1|θjk, ζi) = P (Zijk ≥ 0|θjk, ζi)

= Φ(aiθjk− bi) , (2.5)

o qual ´e o mesmo modelo dado em (2.1). A ´ultima igualdade em (2.5) segue da propriedade de simetria da normal sim´etrica padr˜ao. Dessa forma, as verossimilhan¸cas dos dados aumentados condicionado aos dados observados e aquela oriunda somente dos dados observados s˜ao equivalentes. Entretanto, inferˆencias baseadas nelas podem ser diferentes sendo esperado resultados pr´oximos por conta da rela¸c˜ao expressa em (2.5). Cha- mamos aten¸c˜ao para o fato de que as nota¸c˜oes relacionadas aos dados aumentados s˜ao equivalentes `aquelas definidas para os dados observados no come¸co da Se¸c˜ao 2.3.

´

E bastante usual, na presen¸ca de v´arias popula¸c˜oes, aplicar-se testes diferentes mas com itens em comum. Esse tipo de situa¸c˜ao gera o que Tavares (2001) nomeou de ausˆencia de resposta pelo planejamento.

2.5 Verossimilhan¸ca de dados aumentados 21 Os dados omissos gerados por esse mecanismo s˜ao n˜ao-informativos, ou seja, s˜ao regidos por mecanismos de ausˆencia por acaso MAR, veja Little and Rubin (2002). Portanto, tal mecanismo n˜ao ´e relevante para o processo de inferˆencia. Al´em disso, os indiv´ıduos podem n˜ao responder aos itens por outros motivos, como “stress”, falta de tempo, negligˆencia etc. No entanto, n˜ao importa o motivo da ausˆencia de resposta, ele ser´a considerado como MAR. Sendo assim, definiremos um conjunto de vari´aveis observ´aveis, que denotam se, para determinado indiv´ıduo, observou-se resposta ou n˜ao para determinado item. Estas s˜ao dadas por:

Vijk =

(

1, se para o item i foi observada resposta do indiv´ıduo j pertencente ao grupo k

0, caso contr´ario. (2.6)

De modo similar `as vari´aveis aumentadas, as vari´aveis indicadoras de resposta s˜ao condicionalmente indepen- dentes, entre indiv´ıduos, itens e popula¸c˜oes, dado os parˆametros que regem sua distribui¸c˜ao de probabilidade. Em outras palavras, p(v...|δ) = K Y k=1 nk Y j=1 I Y i=1 p(vijk|δ).

Posto os argumentos acima, temos que a verossimilhan¸ca ´e dada por

L(θ.., ζ, ηθ, δ|z..., y..., v...) ∝ p(v..., z...|θ.., ζ, ηθ, δ, y...) = p(v...|z..., θ.., ζ, ηθ, δ, y...)p(z...|θ.., ζ, ηθ, δ, y...) = p(v...|δ)p(z...|θ.., ζ, y...) (2.7) ∝ p(z...|θ.., ζ, y...) (2.8) ∝ K Y k=1 nk Y j=1 Y i∈Ijk expn−0.5 (zijk− aiθjk+ bi)2 o 11(zijk,yijk), (2.9)

em que Ijk´e o conjunto de itens apresentados ao indiv´ıduo j da popula¸c˜ao k e 11(zijk,yijk) representa a fun¸c˜ao indicadora 11(Yijk=0,Zijk<0) + 11(Yijk=1,Zijk≥0). Note que (2.7) vem do fato de que ηθ depende somente da distribui¸c˜ao de θ... Al´em disso (2.8) segue do fato de que V...´e regido por um processo MAR.

Por outro lado, podemos redefinir a estrutura dada por (2.1) e (2.2) em termos dos dados aumentados (2.3), tal como

Zijk|yijk = aiθjk− bi+ ξ(Z)ijk (2.10)

θjk = µθjk + ξ (θ)

jk , (2.11)

em que ξijk(Z) ∼ N(0, 1), mutuamente independentes e independentes de ξ (θ)

jk ∼ N(0, ψθk).Liu and Hedeker (2006), por exemplo, utilizaram uma estrutura similar `a (2.10) para apresentar o modelo desenvolvido no trabalho deles. Podemos notar, ent˜ao, que o modelo estabelecido em (2.10) pode ser visto como um MRI cont´ınuo ou mesmo, um modelo de regress˜ao no qual as vari´aveis resposta seguem distribui¸c˜ao normal truncada. Isto ´e, nossos desenvolvimentos tamb´em se aplicam em tais casos.