Através dos resultados das simulações dos cenários da distribuição normal para os diferentes valores de p e n observou-se que:
1. O teste de Mudholkar e Srivastava (2000b) possui a característica de apresentar o tamanho do teste inferior ao nível de significância nominal especificado. Esta característica se deve em parte ao fato de que a tomada de decisão considera o p-valor, e não o valor crítico de uma estatística de teste para um α especificado como é o caso dos outros testes apresentados nesta dissertação. Apenas quando as variáveis não são correlacionadas, o tamanho do teste é próximo ao nível de significância nominal, para qualquer tamanho de amostra. Este teste passa a competir com o teste 2
T de Hotelling se
igualando a este último em algumas situações, porém nunca o ultrapassando em termos de poder. Observa-se também que o teste de Mudholkar e Srivastava tem o poder influenciado pelo tipo de mudança ocorrida no vetor de médias, sendo que geralmente o poder é maior quando a mudança ocorre em mais de uma variável. Quando p=2, o aumento da variabilidade não resultou em diferença de poder, mas quando p=3, esse aumento em apenas uma variável causou mudança de comportamento nos métodos de combinação de p-valores; já o aumento da variabilidade em todas variáveis não resultou mudança no poder do teste. Quando p=5, o poder do teste de Mudholkar e Srivastava foi bem menor do que o do 2
T de Hotelling, inclusive para variáveis não
correlacionadas, isso significa que o teste stepwise é influenciado pelo número de variáveis.
2. Pelo artigo de Mudholkar e Srivastava (2000b), os autores dizem que seu teste compete com o teste T2_teo, mas não fornecem a estrutura de correlação das variáveis. Acreditamos que eles devem ter usado uma matriz de correlação nula ou quase nula, pois só nestas situações que o teste consegue competir com o teste T2_teo. Além disso, os autores simularam apenas situações com p=2 e 3 variáveis e em nosso estudo estendemos para o caso de p=5 variáveis, mostrando que, para esse valor, o teste de Mudholkar e Srivastava é inferior ao T2 de Hotelling em termos de poder.
3. Nota-se que, nos cenários da distribuição normal multivariada, é melhor não usar aparação, já que os métodos de combinação de p-valores mostram-se mais poderosos sem a aparação. Na área de controle de qualidade, por exemplo, é razoável que não se tenha
aparação, uma vez que os extremos são pontos importantes a serem detectados. Dentre os métodos de combinação de p-valores, no geral, o que apresentou melhor desempenho para p=2 foi o método de Tippett; para p=3 foi o de Liptak para menores distâncias e o método de Fisher para distâncias maiores; para p=5 o método de Fisher também apresentou bom desempenho.
4. Também podemos concluir que o teste HeT_am e HeT_teo tiveram bom desempenho para 2 e 3 variáveis com n>10 e mudanças pequenas no vetor de médias. Estes possuem maior poder quando a mudança no vetor de médias ocorre em mais de uma variável e apresentam um poder mais baixo para os casos em que apenas uma variável se altera. A mudança da estrutura de correlação das variáveis não influencia no poder do teste de Hayter e Tsui, tanto usando a matriz de covariâncias amostral como a teórica. O comportamento foi semelhante ao teste de Mudholkar e Srivastava quanto a variabilidade; quando p=2, o aumento da variabilidade não modificou o comportamento do teste, mas quando p=3, esse aumento em uma variável causou redução no poder e o aumento das variâncias das 3 variáveis não comprometeu a atuação do teste.
5. Os testes mais adequados para amostras de tamanho 10 são T2_teo e HeT_teo. O primeiro é mais apropriado quando as mudanças na média são grandes independentemente do tamanho da amostra. Além disso, este é o mais recomendado quando há 5 variáveis. O comportamento do teste T2_teo não modifica com o aumento da variabilidade, com a estrutura de correlação das variáveis e nem com o tipo de mudança ocorrida no vetor de médias. Não há um único teste que seja mais adequado para n>10, pois há situações em que um teste supera o outro em termos de poder (T2_teo, T2_dif, HeT_am).
6. O teste 2
T de Hotelling obtido através da estimação da matriz de covariâncias pelas
diferenças sucessivas (T2_dif) forneceu bons resultados para pequenas mudanças no vetor de médias quando n>10 para p=2 e p=3 e n>25 para p=5. Este só supera os demais em alguns cenários de pequenas mudanças que aconteciam em apenas uma das variáveis.
7. Para todos os 13 testes estudados, a medida em que n cresce o poder do teste aumenta. Os testes HeT_am e T2_dif ficam comprometidos nos casos em que n=10 para p=2 e
3 =
significância nominal. Vale ressaltar que, na área de controle de qualidade, grande parte dos estudos são realizados com amostras de tamanho pequeno, o que pode comprometer a qualidade dos resultados.
8. Em termos do uso do teste de Mudholkar e Srivastava na área de controle de qualidade, este não seria o mais adequado para dados provenientes da distribuição normal pelos resultados apresentados nesta dissertação, pois há três outros testes melhores T2_am, T2_dif e HeT_am que são mais poderosos para variáveis correlacionadas e são de fácil interpretação e entendimento. Além disso, levam a vantagem de serem fundamentados numa estatística de teste cuja distribuição sob a hipótese nula determina a região crítica para um valor de significância fixo, ou seja, há um valor crítico fixo para rejeição ou não da hipótese nula, o que permite fazer um gráfico no qual se pode observar o comportamento dos valores amostrais da estatística de teste em relação a esse valor crítico, algo que não pode ser feito no teste de Mudholkar e Srivastava. Ainda vale lembrar que os p-valores parciais do teste de Mudholkar e Srivastava dependem da ordem de entrada das variáveis (como visto na subseção 2.7.1, página 33), situação não muito agradável dado que impossibilita o uso desses p-valores para que se possa identificar as variáveis causadoras da rejeição da hipótese nula.
9. O uso do teste T2_dif em controle de qualidade pode fornecer bons resultados quando se deseja detectar pequenas mudanças no vetor de médias, já que este apresenta bom desempenho para pequenas mudanças. Mas é necessário que as amostras não sejam pequenas (n≤25), para não comprometer os resultados.