2 KOMMUNALE IT-TJENESTER – VERDIKJEDE
2.5 Driftsmodeller
2.5.2 Bruk av skytjenester
O teste do qui-quadrado é representado por χ2 , ele é um teste de hipóteses
que visa encontrar um valor da dispersão para duas variáveis nominais, avaliando a associação existente entre variáveis qualitativas, ou no caso do SPSS, variáveis categóricas, ou seja, ele é utilizado para comprovar se existe diferenças estatisticamente significativas entre duas distribuições. O qui-quadrado é um teste não-paramétrico, isto é, não depende dos parâmetros populacionais, como média e variância. Este método tem como princípio básico comparar proporções, isto é, as possíveis divergências entre as frequências observadas e esperadas para um certo evento. (CONTI, 200-?).
As principais funções do teste (χ2) são: “a) comparar uma distribuição observada com uma teórica; b) comparar distribuições observadas com dados independentes; c) prova de independência; d) prova de qualidade de ajuste” (BISQUERA; SARRIERA; MARTÍNEZ, 2004, p. 102).
Dessas funções a que vai interessar para esta pesquisa é a prova de independência que segundo os autores é utilizada para confirmar a hipótese de independência, ou seja, para descobrir se duas variáveis categóricas estão relacionadas, ou não.
Conti (200-?, p. 2) diz que na prova de independência o pesquisador trabalha com duas hipóteses:
• Hipótese nula: as frequências observadas não são diferentes das frequências esperadas. Não existe diferença entre as frequências (contagens) dos grupos. Portanto, não há associação entre os grupos; • Hipótese alternativa: As frequências observadas são diferentes da frequências esperadas, portanto existe diferença entre as frequências. Portanto, há associação entre os grupos.
A formula do (χ2) que permite calcular esta relação entre as variáveis é: χ2 = Σ [(o - e)2 /e]
Onde;
o = frequência observada para cada classe (obtidas diretamente dos dados das amostras).
e = frequência esperada para aquela classe (enquanto que as frequências esperadas são calculadas a partir destas).
Para realizar a prova de independência é necessário obter duas estatísticas denominadas χ2 calculado e χ2 tabelado, onde “o calculado é obtido a partir dos
dados experimentais, levando-se em consideração os valores observados e os esperados, tendo em vista a hipótese”. Já o χ2 tabelado “depende do número de
graus de liberdade e do nível de significância adotado” (CONTI, 200-?, p. 2), onde o número de graus de liberdade, é calculado pela fórmula: Graus de liberdade = número de classes – 1. Já o nível de significância (chamado de p valor ou alfa) representa a máxima probabilidade de erro que se tem ao rejeitar uma hipótese. Dancey e Reidy (2006) dizem que a probabilidade de 5% é suficientemente aceita como ponto de corte, ou seja o (p valor < 0,05). Para os autores (2006, p. 151) :
Considerando a hipótese nula verdadeira, se a probabilidade de um dado efeito é menor que 5% (0,05 ou 1 em 20), então fornecemos um suporte razoável para a nossa hipótese de pesquisa. Isso significa que se você conduz um estudo 20 vezes, somente uma vez nestes 20 estudos um relacionamento (ou diferença) tão grande quanto a que foi observada aparecerá por acaso se a hipótese nula for verdadeira. Como esta probabilidade é baixa, podemos concluir com razoável confiança que um relacionamento (ou diferença) real existe na população sob investigação. No caso do pesquisador dispor de um pacote estatístico, este, via de regra, calcula o p valor automaticamente, nesse caso é só comparar esse valor com o nível de significância desejado. Por exemplo no caso o p valor foi igual a 0,01058, o pesquisador rejeitaria a hipótese nula ao nível de 5%, uma vez que o p valor seria menor do que 0,05, mas não ao nível de 1%, pois o p valor seria maior do que 0,01.
Se χ2 calculado for maior ou igual ao χ2 tabelado o pesquisador irá rejeitar a
Hipótese nula, ou seja, há relação estatisticamente comprovada entre as hipóteses testadas. Já se o χ2 calculado for menor do que o χ2 tabelado o pesquisador irá
aceitar a hipótese nula, isto é não há relação entre as hipóteses testadas. A TAB. 6 traz os valores já estabelecidos para o χ2 tabelado.
(χ2)crítico Nível de significância Graus de Liberdade 0,99 0,90 0,10 ... 0,05 0,02 0,01 0,001 1 0,0002 0,016 2,706 ... 3,841 5,412 6,635 10,827 2 0,020 0,211 4,605 ... 5,991 7,824 9,210 13,815 3 0,115 0,584 6,251 ... 7,815 9,837 11,345 16,266 4 0,297 1,064 7,779 ... 9,488 11,668 13,277 18,467 5 0,554 1,610 9,236 ... 11,070 13,388 15,080 20,515 ... ... ... ... ... ... ... ... ...
Aceita-se a hipótese de igualdade estatística entre os números de observados e de esperados (Hipótese nula). Os desvios não são significativos.
Não há relação entre as variáveis.
Se o χ2calculado for maior ou igual ao χ2
tabelado no nível de significância escolhido, neste caso 0,05, deverá rejeitar-se a Hipótese nula e aceitar-se Hipótese alternativa. Os números de observados e esperados são estatisticamente diferentes. Os desvios são significativos. Há relação entre as variáveis. TABELA 6 – Tabela abreviada do qui-quadrado tabelado.
Fonte: adaptado de Conti, [200-?].
Será apresentado um exemplo bem simples, demonstrado por Conti (200-?), para ajudar a compreender como funciona o cálculo.
Se um dado não viciado for jogado 6 vezes, espera-se obter 1 vez cada face (1, 2, 3, 4, 5 e 6) uma vez que a probabilidade esperada de cair qualquer face é 1/6. Supondo que um dado foi jogado 186 vezes e obteve-se:
Face 1 Face 2 Face 3 Face 4 Face 5 Face 6
34 vezes 29 vezes 30 vezes 32 vezes 28 vezes 33 vezes Então pretende-se descobri o valor do χ2? e como interpretar esse valor?
Resolvendo:
Primeiramente tem-se que encontrar o valor da frequência esperada, e para encontrar essa frequência utiliza-se a fórmula: Probabilidade (p) x Número de ocorrência (N), logo:
E(face 1) = E(face 2) = E(face 3) = E(face 4) = E(face 5) = E(face 6) = p x N = 1 / 6 x 186 = 31
Em seguida calcula-se o valor o valor de χ2 de acordo com a fórmula:
χ2 = Σ [(o - e)2 /e]
Como se pode interpretar esse valor?
Lembrando que o graus de liberdade = número de classes -1, como há 6 classes, o graus de liberdade será igual a 5.
Verificando-se a TAB. 6 na linha em graus de liberdade = 5 encontra-se (χ2)crítico (máxima probabilidade de erro) igual a 11,070. Como o valor de Qui- quadrado obtido ( 0,903 ) foi menor que o esperado ao acaso ( 11,070) o pesquisador deverá aceitar a hipótese de igualdade estatística entre os números de observados e de esperados, ou seja, não há relação entre as hipóteses testadas. Agora se o (χ2) tivesse ficado num valor acima de (11,070) o pesquisador iria rejeitar
a hipótese nula, ou seja, existiria relação estatisticamente comprovada entre as hipóteses testadas.
Cazorla (200-?, p. 153) cita duas limitações para o teste do qui-quadrado, a primeira limitação é que ele “não permite concluir como se dá a relação”, mas apenas afirmar que existe relação entre as variáveis pesquisadas. A outra limitação do teste qui-quadrado “é que o valor esperado das células não deve ser menor ou igual a 5, pois isso torna vulnerável a estatística”.