As aplicações dos testes mencionados anteriormente, para a verificação das pressuposições do modelo matemático, serão realizados sobre os dados referentes a um ensaio de competição de 13 genótipos de milho de ciclo super precoce (Tabela 1), conduzidos no ano agrícola de 2001/2002 no departamento de Fitotecnia, Universidade Federal de Santa Maria, segundo o delineamento blocos ao acaso com três repetições. A
-1 variável observada foi o rendimento de grãos (kg ha ).
1. Teste de não aditividade de Tukey
O teste de não aditividade de Tukey foi apresentado originalmente por Tukey em 1949. Posteriormente, alguns autores como Snedecor & Cochran (1989) e Stell et al. (1997) apresentam a descrição dos testes e exemplos da aplicação. O teste de não aditividade de Tukey é um teste paramétrico, que verifica se os efeitos do modelo matemático (m, b , t e e ) se somam. Os objetivos propostos pelo teste de não j i ij aditividade de Tukey são quanto à necessidade de haver a transformação dos dados e, também, sugerir o tipo de transformação mais apropriada para os dados e analisar se a transformação dos dados foi bem sucedida, isto é, se produziu aditividade ao modelo.
Quando os parâmetros do modelo matemático não assumem uma forma aditiva, outras formas, como a multiplicativa, podem ser verificadas. Quando, no caso da verificação da forma multiplicativa, os logaritmos dos dados mostram os efeitos do modelo aditivo adequado para proceder à análise de variância. Os logaritmos dos dados originais são chamados de dados transformados e a este processo designa-se de transformação. Para outros tipos de casos de não aditividade existem outros tipos de transformações disponíveis.
Se os parâmetros do modelo não forem aditivos significa que, também, não há homogeneidade das variâncias do erro. Os resultados junto com o erro da variância podem ser ineficientes para as estimativas do intervalo de confiança de efeitos do tratamento e podem apresentar um falso nível de significância para comparações específicas das médias de tratamentos.
A falta de aditividade resulta em heterogeneidade das contribuições das observações para variância residual, não sendo esta, portanto, uma estimativa eficiente da variância comum. De fato, a variância do erro é maior do que a que seria obtida se o modelo fosse aditivo. O erro experimental exige distribuir-se normalmente o que caracteriza o modelo paramétrico. Essa suposição é usada para testes de significância e não para a estimação de componentes da variância. Quando o erro experimental não se ajusta a função de distribuição normal, o componente de erro de um tratamento tende a ser uma função da média do tratamento, o que resulta também na heterogeneidade do erro. Se a função é conhecida, pode ser usada uma transformação que gera valores dos erros mais próximos da distribuição normal. Assim, pode ser feita uma análise das variâncias por tratamento, verificando a homogeneidade do erro. As transformações mais comuns são: logaritmo, raiz quadrada e o inverso.
onde Y = dados transformados; X = dados na escala original; P = valor que ij ij cause aditividade ao modelo. Assim, quando o valor de P for próximo a ½ a transformação adequada é a raiz quadrada, quando o valor de P for próximo a zero a transformação adequada deve ser a logarítmica, quando o valor de P for próximo a -1 (menos um) a transformação adequada é a recíproca, entre outras. O desenvolvimento teórico do teste pode ser consultado na página 332 de Snedecor & Cochran (1989).
APLICAÇÃO
Para demonstrar os cálculos do teste de não aditividade de Tukey, serão usados os dados de um experimento de 13 genótipos de milho, ciclo super precoce, conduzidos segundo o delineamento blocos ao acaso, na área experimental do Departamento de Fitotecnia, Universidade Federal de Santa Maria na safra 2001/2002 (Tabela 1).
-1
Tabela 1 - Produção de grãos (kg ha ) de 13 genótipos de milho em três blocos com os totais ( ) de genótipos, totais ( ) e média ( ) de blocos e total ( ) e média ( ) geral.i. Y Y.j Y.j Y.. .. Y Blocos (j) i Genótipo j = 1 j = 2 j = 3 . i Y Yi. 1 SHS4050 8.423 7.333 6.461 22.217 7.405,67 2 SHS5050 8.792 8.344 6.603 23.739 7.913,00 3 SHS5070 5.954 6.525 6.995 19.474 6.491,33 4 CO32 6.754 7.455 8.035 22.244 7.414,67 5 DAS766 8.072 8.401 10.339 26.812 8.937,33 6 DAS8330 10.358 8.345 8.729 27.432 9.144,00 7 DAS9560 8.989 8.608 8.366 25.963 8.654,33 8 SAVE394 4.874 6.373 7.406 18.653 6.217,67 9 AG6016 9.455 8.266 8.067 25.788 8.596,00 10 AG6018 7.370 8.322 6.586 22.278 7.426,00 11 AG9010 6.308 8.226 6.991 21.525 7.175,00 12 DKB440 6.907 8.912 6.823 22.642 7.547,33 13 DKB909 7.343 7.378 6.085 20.806 6.935,33 j Y. 99.599 102.488 97.486 Y =299.573 .. Y = 7.681,36 .. j Y. 7.661,46 7.883,69 7.498,92
Nota - com relação aos dados da Tabela 1:
iJ i i i J j ij i Y Y Y Y Y Y =
å
=++++ = ... . 1 2 3 1 = total do genótipo i;Para i=1 temos Y1. = (8.423+7.333+6.461) = 22.217
J Y
Yi. =i./ = média do genótipo i;
Para i=1 temos Y1. -1
= (8.423+7.333+6.461) / 3 = 7.405,67 kg ha
å
= i ij j Y Y . = j j Ij I i Yij=Y +Y ++Yå
=1 1 2 .. = total do bloco j; Para j=1 temos Y.1=8.423 +8.792 +5.954 +6.754 +8.072 +10.358 +8.989 +4.874 +9.455 +7.370 +6.308 +6.907 +7.343 = 99.599 = total do bloco 1;å
å
å
== = j j i i ijYij Y YY.. . . é o total geral do experimento e
P ij
ij X
Sistemas de Produção Agropecuária - Ano 2008 IJ
Y
Y.. =../ é a média geral do experimento ou seja:
..
Y = (8.423 + 7.333 + 6.461+…+ 7.378 + 6.085) / (13*3) = 7.681,36 kg ha-1
Inicialmente será procedida a análise de variância (Tabela 2) e, posteriormente, os procedimentos do teste de não aditividade.
Tabela 2 - Análise de variância com as fontes de variação (FV), graus de liberdade (GL), soma de quadrados (SQ) quadrados médios (QM), estatística F calculado (Fc) e tabelado (Ft).
FV GL SQ QM Fc Ft
Bloco GLb SQb QMb QMb/QMe Fá(GLb; GLe)
Genótipo GLg SQg QMg QMg/QMe Fá(GLg; GLe)
Erro GLe SQe QMe - -
Cálculo dos graus de liberdade: para blocos temos GLb = J-1 = 3-1 = 2; para genótipos temos GLg = I-1 = 13-1 = 12; para o erro temos Gle = (J-1)(I-1) = (3-1)(13-1) = 24
Cálculo das somas de quadrados (SQ): Soma de Quadrado Total = SQTo ijYij Y.. /IJ
2
2-
=
å
2 2 2 2
SQ = (8423 + 7333 + ... + 6085 ) – (299573 )/(13*3) = 53.575.196,97 To Soma de Quadrado de blocos = 1 .2 1Y..2
IJ Y I SQb=
å
j j- 2 2 2 2 Sqb = (1/13)(99599 + 102488 + 97486 ) – (299573 )/(13*3) = 970.028,05 Soma de Quadrado de genótipos = Y Y IJJ SQg i i . .. / 1 2 -2 =
å
2 2 2 2 SQg = (1/3)(22217 + 23739 + ...+ 20806 ) – (299573 )/(13*3) = 30.466.521,64 Soma de Quadrado do erro = SQe = SQ - SQb - SQg ToSQe = 53.575196,97 - 970.028,05 - 30.466.521,64 = 22.138.647,28
Os quadrados médios são obtidos dividindo as SQ pelos respectivos GL, ou seja: QMb=SQb/GLb; QMg=SQg/GLg; QMe=SQe/GLe
Para os testes de hipóteses são calculados os valores das estatisticas F: Fc=QMb/QMe para efeito de blocos; Fc=QMg/QMe para diferença entre os genótipos. As hipóteses referentes a blocos e genótipos são rejeitadas quando o valor do Fc é maior do que o valor de F tabelado (Ft), ao nível á de probabilidade especificado. Para o exemplo, os resultados estão apresentados na Tabela 3. Verifica-se que os blocos são homogêneos e que existem diferenças significativa entre os genótipos, em nível de 5% de probabilidade.
Tabela 3 - Análise de variância contendo as fontes de variação (FV), os graus de liberdade (GL), as somas dos quadrados (SQ), os quadrados médios (QM) e os valores para o F calculado (Fc).
FV GL SQ QM Fc F5% Blocos 2 970.028,05 485.014,02 0,52 3,40 Genótipos 12 30.466.521,64 2.538.876,80 2,75 2,15 Erro 24 22.138.647,28 922.443,63 --- -
Para estimar a Soma de Quadrado da não aditividade (SQna), referente a um grau de liberdade subtraído do erro experimental, adotamos uma sequência de cálculos com o acompanhamento dos resultados na Tabela 4.
Agora, como SQna tem um grau de liberdade subtraída do erro experimental, pode-se obter os valores ajustados para GLea = (I-1)(J-1)-1 = 12*2-1 = 23 e a Soma de Quadrado do erro ajustado (SQea) ou seja: SQea=SQe-SQna = 22.138.647,28 - 512.122,71 = 21.626.524,57 cujos valores podem ser vistos na Tabela 5. Também, QMna = SQna e QMea = SQea / Glea.
O teste de hipótese, H : o desvio de aditividade do modelo é nulo, pode ser 0 testado pela distribuição F ou seja Fc =QMna /QMea =512.122,71 /940.283,67 =0,54 com distribuição de F(1;GLea). Como F5%(1;23) = 4,28 é maior do que Fc=0,54 concluímos que o desvio da aditividade não é significativo. Nos casos em que Fc>Ft, a
..
.
Y
Y
d
i=
i-
= efeito de genótipo i ou média do genótipo i menos média geral;Para i=1,
=
1
d
7.405,67 – 7.681,36 = -275,69 (ver demais valores na Tabela 4);..
.
Y
Y
d
j=
j-
=efeito do bloco j ou média do bloco j menos média geral; Para j=1,d
1=7.661,46 - 7.681,36 = -19,8974 (ver demais valores na Tabela 4);j j
ij i Y d
W =
å
para i=1, 2, ..., 13Para i=1 temos W = (8423)(-19,8974) +(7.333)(202,330) +(6.461)(-182,436) = 1 137.395,90 (ver demais valores de W na Tabela 4);
å
=idiWi N N=(-275,6923)(137.395,90)+(231,64)(308.706,85)+... +(-746,03)(236.586,03) =- 622.957.326,5åå
=( 2)( 2) j i d d D = (10.155.507,21)(74.617,54) = 757.778.990.174,01Com as estimativas N e D pode-se estimar a Soma de Quadrados para não aditividade (SQna) como sendo:
D N
hipótese de aditividade torna-se insustentável e providência devem ser tomadas para uma análise de melhor qualidade.
Assim, nos casos em que o modelo matemático não é aditivo, deve-se, através de cálculos, verificar o melhor método para a transformação dos dados, ou seja, estimar o expoente de Y ij
Como no presente exemplo, verificou-se a aditividades dos efeitos do modelo matemático, através do teste de não aditividade de Tukey, o resultado encontrado não seguiu nenhuma das condições para realizar-se a transformação dos dados. Dessa forma, a pressuposição da aditividade do modelo matemático não foi violada.
..) 1 ( ˆ BY p=-em que ,B=N/D No exemplo: B= -622.957.326,5 / 757.778.990.174,01 = -0,000822083 = pˆ 1 – (-0,000822083)(7681,36) = 7,31 Se Se Se Se @ pˆ @ pˆ @ pˆ @ pˆ
0 deve-se usar a transformação logarítmica ;yt=log(y) 0,5 deve-se usar transformação raiz quadrada ;yt =y
-0,5 deve-se usar a transformação ;yt =1 y
-1 deve-se usar a transformação .yt=1 y
Tabela 4 - Estatísticas do teste de não aditividade de Tukey referentes aos ensaios de competição de genótipos de milho. Blocos (j) i GENÓTIPOS j = 1 j = 2 j = 3 . i Y Yi. di Wi 1 SHS4050 8.423 7.333 6.461 22.217 7.405,67 -275,69 137.395,90 2 SHS5050 8.792 8.344 6.603 23.739 7.913,00 231,64 308.706,85 3 SHS5070 5.954 6.525 6.995 19.474 6.491,33 -1.190,03 -74.383,44 4 CO32 6.754 7.455 8.035 22.244 7.414,67 -266,69 -91.864,72 5 DAS766 8.072 8.401 10.339 26.812 8.937,33 1.255,97 -347.014,51 6 DAS8330 10.358 8.345 8.729 27.432 9.144,00 1.462,64 -110.108,92 7 DAS9560 8.989 8.608 8.366 25.963 8.654,33 972,97 36.568,56 8 SAVE394 4.874 6.373 7.406 18.653 6.217,67 -1.463,69 -158.630,03 9 AG6016 9.455 8.266 8.067 25.788 8.596,00 914,64 12.646,69 10 AG6018 7.370 8.322 6.586 22.278 7.426,00 -255,36 335.651,08 11 AG9010 6.308 8.226 6.991 21.525 7.175,00 -506,36 263.471,62 12 DKB440 6.907 8.912 6.823 22.642 7.547,33 -134,03 421.002,95 13 DKB909 7.343 7.378 6.085 20.806 6.935,33 -746,03 236.586,03 j Y. 99.599 102.488 97.486 j Y. 7.661,46 7.883,69 7.498,92 N=åidiWi = -622.957.326,5 j d -19,897 202,330 -182,436 å2 i d = 10.155.507,21 Y = 299.573 .. å2 j d = 74.617,54 Y = .. 7.681,36 D = 757.778.990.174,01
Tabela 5 - Análise de variância contendo as fontes de variação (FV), os graus de liberdade (GL), as somas dos quadrados (SQ), os quadrados médios (QM) e os valores para o F calculado (Fc). FV GL SQ QM Fc Genótipos 12 30.466.521,64 2.538.876,803 2,75 Blocos 2 970.028,0513 485.014,0256 0,52 Erro 24 22.138.647,28 922.443,6368 --- Não Aditividade 1 512.122,71 512.122,71 0,54 Erro ajustado 23 21.626.524,57 940.283,67 --- NORMALIDADE
O teste de normalidade de dados foi introduzido por Lilliefors em 1967, como sendo uma modificação do teste de Kolmogorov-Smirnov (Campos, 1983; Sprent & Smeeton, 2007). O teste de normalidade de Lilliefors amplia a aplicação do teste de Kolmogorov-Smirnov, aplicando este teste aos casos em que a média e a variância não são previamente especificadas, mas sim estimadas a partir dos dados da amostra. A exigência da normalidade, na distribuição de freqüências de um caractere, é relacionada à validação dos testes de hipóteses. Quando os dados não possuem uma distribuição normal, o verdadeiro nível de significância torna-se usualmente maior (embora nem sempre) do que o nível crítico () especificado. Como conseqüência deste fato tem-se a rejeição da hipótese da nulidade H (quando H é verdadeira) com mais 0 0 freqüência do que a probabilidade especificada, ou seja, diferenças não reais são erroneamente consideradas significativas. Sendo assim erros Tipo I é cometido com probabilidade maior de que o especificado ou admitido pelo pesquisador (Nunes, 1998).
Usando os resultados de um experimento no delineamento blocos completos ao acaso, e considerando o modelo matemático (Y = m + b + t + e ), pode-se estimar os ij j i ij efeitos dos erros pela expressão = , para i=1 até I e j=1 até J, em que é a estimativa da média do tratamento i, é a estimativa da média do bloco j e é a estimativa da média do ensaio. O problema consiste em verificar a distribuição de freqüências dos IJ valores de ,ou seja, se os mesmos se ajustam a uma função de distribuição normal.