• No results found

Determining page layout

N o trabalho apresentado, utiliza-se a abordagem de modelos lineares genera­ lizados de efeitos mistos para lidar com conjuntos de dados quando a suposição de norm alidade não é atendida e, ainda, para os quais há algum tipo de depen­ dência entre as observações. C om o caso geral, quando se têm dados multivariados longitudinais, isto é, vetores de variáveis resposta observados ao longo do tem po, apresenta-se o que pode ser considerada uma extensão natural do caso univariado de m odelos lineares generalizados mistos. No caso mais simples, quando se especifica

um vetor de efeitos aleatórios de indivíduo (ou clu ster) referentes a cada variável

resposta, passa-se a ter a possibilidade de analisar as correlações entre as variáveis de interesse de form a mais direta, uma vez que os efeitos de tratamentos e outras covariáveis são, ao menos em parte, capturados pelos efeitos fixos.

Além da interpretabilidade, a form ulação abordada permite tam bém que as ferra­ mentas com putacionais existentes para casos univariados - que são mais freqüentes e para os quais há maior disponibilidade de implementações - possam ser utilizadas na estim ação dos m odelos, bastando a especificação adequada dos mesmos. Entre­ tanto. existem duas limitações a serem notadas neste caso: A primeira refere-se à especificação do preditor linear, uma vez que este será com um para todas as variáveis resposta; a segunda, diz respeito à distribuição do vetor de variáveis resposta, já que apenas um a única distribuição é especificada. Para os casos em que se deseja maior

flexibilidade nestes aspectos, o pacote sabreR , por exemplo, oferece a possibilidade

dc especificar, para respostas trivariadas, diferentes preditores lineares c diferentes distribuições (normal, binom ial e /o u Poisson).

Em particular, tem-se interesse em tratar M LGs com efeitos mistos quando se supõe que as variáveis resposta de interesse têm distribuição Poisson com posta, com suporte em R + e que assume com o processo gerador uma mistura de distribuições

gama com número de com ponentes distribuídos de acordo com uma distribuição Poisson. Esta distribuição permite, portanto, que dados com o massa observada, por

exem plo, sejam m odelados sem a necessidade de procedimentos ad hoc para lidar

com a presença de valores nulos.

Por não apresentar form a analítica fechada, porém, o cálculo da função de den­ sidade desta distribuição depende de m étodos numéricos de aproximação, fazendo com que sua im plem entação seja não trivial. Aliando-se a isso o fato de que m odelos lineares generalizados mistos também são de difícil implementação, o ajuste destes m odelos para dados com distribuição Poisson com posta atualmente é bastante res­

trito. D e fato, até o m om ento da elaboração deste trabalho, apenas o pacote cplm

do R tem este tipo de m odelo disponível.

C om o m otivação do uso de M LG s mistos com efeitos aleatórios multivariados,

foram analisados dados em que as variáveis de interesse são as massas (em 103/« /)

de três com postos bioquím icos, retirados de um conjunto de dados de 25 com postos. Na análise destes três com postos, faz-se uma avaliação da utilização do m odelo m ultivariado frente a m odelos mais simples, com suposições mais restritivas. Dessa maneira, foram ajustadas três variações de modelos para resposta com distribuição Poisson com posta: M LG univariado sem efeito aleatório, M LG misto univariado e M L G m isto multivariado. Para os com postos selecionados, verifica-se que os modelos de efeitos mistos - uni e multivariado - apresentam melhora no ajuste dos dados com relação ao M LG sem efeito aleatório. Além disso, na com paração entre os tratam entos, as duas abordagens de efeitos mistos apresentam resultados similares e são, de maneira geral, mais conservadoras que o M LG , mostrando que, ao não levar em consideração as dependências entre observações, m odelos mais simples podem levar a resultados enganosos.

Para aqueles casos em que se tem alta dimensionalidade do vetor de variáveis resposta, apresenta-se a m etodologia de pseudo-verossimilhança de estimação dos

parâmetros do m odelo multivariado. A m etodologia, introduzida por Fieuws et al.

(2006) e que se caracteriza pela estim ação dos parâmetros via ajuste de modelos bivariados, tem com o principal atrativo a redução do custo com putacional associado à estim ação dc parâmetros dc m odelos lineares generalizados mistos via integração multivariada em grandes dimensões.

De fato, conform e observado no Capítulo 5, a abordagem de pseudo-verossimilhança apresenta redução no tem po de com putação e se mostra vantajosa mesmo em m o­ delos com vetores de resposta de dimensão 3. A m etodologia par-a-par foi imple­

m entada com o pacote estatístico R (R Development Core Team, 2012), tom ando-se

bivariados, e explorando as possibilidades de paralelização para redução do tem po de estimação.

C om o aplicação da estim ação de m odelos multivariados via pseudo-verossimilhança, foram analisados dados de experimento agronôm ico com plantas de algodão, sub­

metidas a um de cinco tratamentos (Controle, A . grandis, E . heros, S. frugiperda e

dano m ecânico) e as massas de 25 com postos observadas em 4 tem pos distintos (24, 48. 72 e 96 horas após aplicação do tratam ento).

N o ajuste dos dados, verificaram-se problemas numéricos de convergência envol­ vendo dois com postos. Uma vez retirados estes dois com postos, o m odelo multiva­ riado pôde ser ajustado, e permitiu verificar que, dos 23 com postos analisados, cm 10 são verificadas diferenças significativas entre efeitos de tratamentos ou de tem po. Há

indicação de que para 8 com postos o tratamento A . grandis é superior ao tratamento

controle.

De form a geral, m odelos lineares generalizados de efeitos mistos, com efeitos aleatórios multivariados se mostram uma ferramenta importante na análise de da­ dos longitudinais com respostas multivariadas, uma vez que a partir desta classe de m odelos, é possível capturar o efeito de dependências entre observações, caracterís­ tico de estudos longitudinais, bem com o o efeito das possíveis correlações entre as variáveis de interesse. C om o advento do m étodo de pseudo-verossimilhança na esti­ m ação dos parâmetros, há um ganho com putacional que permite que esses m odelos possam ser utilizados para dados com dimensionalidade elevada.

A bram ow itz, M; Stegun, I. H an d book o f M athem atical Functions w ith For­ m ulas, G rap h s, and M ath em atical Tables. Now York: Dover Publications,

1972. 470p.

Aitkinson, A .C . P lo ts, Transform at ions and Regression: A n Introduction to

G raphical M eth o d s o f D iagnostic Regression Analysis. New York: Oxford

University Press, 1985.

Bates, D. M. Linear M ix ed M o d e l Im plem entation in lm e4. 2011. h t tp ://c r a n .r -

p r o je c t.o r g /w e b /p a c k a g e s /lm e 4 /v ig n e tte s /I m p le m e n ta tio n .p d f

Besag, J. Statistical analysis o f non-lattice data. Statistician 24 (1975), 179-

195.

B ox, G .E .P.; C ox, D .R . A n analysis o f transform ations. Journal o f the R oyal

Statistical S ociety, S eries B 26 (1964), 211-252.

Breslow, N.E.; Clayton, D .G . A p proxim ate Inference in Generalized Linear