The problem of consultation and group representation

4.1 Culture Tourism as a Tool for Empowerment

4.2.4 The problem of consultation and group representation

Por meio dos resultados obtidos nesta dissertação podemos perceber que cada teste tratado em nosso estudo possui suas particularidades e características, e não há um que seja uniformemente mais poderoso, pois é possível ter-se um teste com melhor desempenho em uma dada situação mas com pior em outra. A Figura 5.1 ilustra um esquema de opção dos melhores testes para cada situação vista nesta dissertação. A situação não-normal simétrica depende do número de variáveis para a escolha do melhor teste, assim na Figura 5.1 esta apresenta a escolha de testes para o caso de p=3.

Normal Não - normal Simétrica ( p = 3) Não simétrica p= 2 p= 3 p= 5 n= 10 n= 50 n= 100 n 10 n= 10 n 10 n= 10 n 50 n= 25 HeT_teo; T2_teo

HeT_am; HeT_teo; T2_teo; T2_dif. HeT_teo; T2_teo

HeT_am; HeT_teo; T2_teo; T2_dif.

T2_teo; T2_dif T2_am

HeT_am; T2_dif.

HeT_am; T2_dif; Fis.5%; Tip.5% HeT_am

HeT_npar

n 25 n> 25

T2_teo

Figura 5.1 – Fluxograma de escolha dos testes

O teste de Mudholkar e Srivastava possui a característica de apresentar as proporções de rejeição da hipótese nula, quando esta é verdadeira, abaixo do nível de significância nominal especificado quando as variáveis são correlacionadas. É melhor usar aparação para distribuições com caudas pesadas e não usar aparação sob normalidade dos dados. Dentre os métodos de combinação de p-valores, os que se mostraram mais apropriados na maior parte dos casos foi o método de Fisher e Tippett. Pelos resultados observados, o teste de Mudholkar e Srivastava é melhor do que o teste _T2_{de Hotelling (não corrigido pela falta de normalidade)} quando os dados provém da distribuição t-Student multivariada e as variáveis não são correlacionadas. E quando os dados não são normais e nem simétricos o teste stepwise

também não é muito adequado, pois apresenta níveis de poder bem abaixo do que o teste de Hayter e Tsui. Ainda no caso normal, mesmo quando não se tem correlação, o teste de Mudholkar e Srivastava não é melhor que os outros testes.

Para a realização dos testes de Hayter e Tsui com a matriz de covariâncias amostral e o teste 2

T de Hotelling com a matriz de covariâncias estimada pela matriz de diferenças

sucessivas é necessário que as amostras tenham um tamanho mínimo: para dados normais, 10

n para p=2 e p=3 e n>25, para p=5; para a distribuição t com p=3, n>10. O 2

T de Hotelling com a matriz de covariâncias estimada pela matriz de diferenças sucessivas

não deve ser usado quando a distribuição não for normal e nem simétrica por inflacionar o erro do tipo I. O teste de Hayter e Tsui (teórico e amostral) pode ser usado para n>25 para dados provenientes do processo bivariado apresentado em Hayter e Tsui (1994).

O teste de Hayter e Tsui, tanto teórico como amostral, teve bom desempenho para os cenários normais simulados com p=2 e p=3 e resultado insatisfatório para p=5. Este é influenciado pelo tipo de mudança ocorrida no vetor de médias, é mais poderoso quando ocorre mudança em todas as variáveis. Em algumas situações com pequenas mudanças no vetor de médias se mostrou mais eficiente do que o teste _T2_{de Hotelling.}

O teste 2

T de Hotelling com a matriz de diferenças sucessivas também acompanhou o

comportamento do teste _T2_{de Hotelling com a matriz de covariâncias teórica para os modelos} normais. O uso da matriz de diferenças sucessivas fez com que o teste se mostrasse mais poderoso do que fazer o teste com a matriz de covariâncias amostral (S) em praticamente todos os cenários normais estudados e para a distribuição t-multivariada. Além disso, este teste fornece bons resultados para a distribuição t-multivariada e não é recomendado para distribuições não normais e não simétricas, como a que foi apresentada por Hayter e Tsui (1994) por inflacionar a taxa do erro do tipo I.

Outro ponto interessante é que os testes que usam a matriz de covariâncias teórica, _T2 de Hotelling e Hayter e Tsui (1994) não devem ser usados quando há violação na suposição de normalidade dos dados, pois eles inflacionam o erro do tipo I. É preciso fazer uma correção na distribuição da estatística de teste por meio da distribuição empírica dos dados. Esta é uma sugestão para trabalhos futuros.

Os testes, de um modo geral, não foram muito afetados pelo aumento da variabilidade. Também não foram comprometidos com a mudança da estrutura de correlação das variáveis, com exceção do teste stepwise de Mudholkar e Srivastava.

Este não seria muito recomendado em controle de qualidade. Primeiro porque ele só consegue competir com os outros testes ( 2

T de Hotelling e Hayter e Tsui) quando não há

correlação entre as variáveis; situação incomum em controle de qualidade multivariado; mesmo quando não há correlação, o teste não consegue ser mais poderoso. Segundo porque em controle de qualidade não é razoável retirar os pontos extremos da análise, uma vez que estes pontos são importantes para detectar a falta de controle em um processo produtivo. Terceiro porque este teste é mais complexo e mais difícil de ser interpretado. E, por último, ele não identifica qual variável causa à rejeição da hipótese nula. No entanto, seria uma alternativa para controle em situações de dados multivariados provenientes de distribuições não normais e simétricas. Para dados provenientes de distribuições multivariadas não simétricas, os melhores testes são o teste de Hayter e Tsui com a matriz de covariâncias amostral e o não paramétrico, também proposto por Hayter e Tsui.

Vale salientar que uma das grandes contribuições dessa dissertação está no fato de ter- se analisado com maior detalhe o teste de Mudholkar e Srivastava (2000b), mostrando algumas de suas particularidades que não foram tratadas no artigo original e mostrando também que, ao contrário do que os autores afirmaram no artigo, o teste stepwise não é mais poderoso que o 2

T de Hotelling, mesmo no caso de normalidade e é influenciado pela

estrutura de correlação entre as variáveis. Em relação às situações não normais, ele é mais poderoso que o teste 2

T de Hotelling para dados provenientes de distribuições simétricas,

mas isso se deve ao fato de que a distribuição da estatística do teste 2

T é muito influenciada

pela falta de normalidade. Já para dados de distribuições não simétricas, o teste de Mudholkar e Srivastava não é o mais indicado, perdendo para o Hayter e Tsui em todos os casos em que

50 ≥

n .

Os programas e as simulações são frutos de boa parte do trabalho desta dissertação. Pretendemos disponibilizá-los na internet para auxiliar nas pesquisas futuras de inferências sobre o vetor de médias. Além disso, a divulgação contribui para usuários que queiram simular outras situações que não foram vistas nesta dissertação. Uma distribuição que poderia ser estudada é a distribuição Cauchy, que foi avaliada por Mudholkar e Srivastava (2000b). O programa para a situação sob a hipótese nula e com dados da distribuição normal está no

Anexo A. O programa com as situações sob a hipótese alternativa se diferencia apenas no comando de geração das observações.

Vale ainda ressaltar o tempo computacional demandado nas simulações feitas nesta dissertação. O tempo total para os cenários normais, p = 2, 3, 5 foram 378,79; 403,69; 483,26 horas respectivamente. O tempo total para os cenários da distribuição t-multivariada e processo estudado por Hayter e Tsui (1994) foram respectivamente 204,92 e 53,18 horas. Os equipamentos utilizados para as simulações foram: AMD Athlon ™ XP 1700+, 1.47 GHZ, 512 MB de Ram e Pentium ® 4 CPU 2.4 GHZ, 512 MB de Ram.

Sugere-se para trabalhos futuros simulações com um maior número de variáveis e com distribuições normais e não normais simétricas ou não para vários tamanhos de amostras e várias estruturas diferentes de correlação. Além disso, como nenhum dos testes estudados é uniformemente mais poderoso é possível pensar em combinar os testes de modo a obter-se um de melhor qualidade. Ainda seria interessante se os métodos de combinação de p-valores fossem melhor estudados, talvez em algum trabalho específico.

Outra sugestão é avaliar os testes para dados autocorrelacionados e modificá-los de modo a serem usados com outros processos de amostragem, como por exemplo, seqüencial e amostragem dupla.

In document Indigenous Cultural Tourism and the Discourse of Development among the Batwa of Mgahinga, South-Western Uganda (sider 63-0)