A ideia de um teste de hip ´otese b´asico consiste em buscar indicac¸ ˜oes de que uma determinada suposic¸˜ao feita sobre alguma propriedade estat´ıstica ´e consistente com certo conjunto de dados. ´E importante se ter em mente que um teste deste tipo n˜ao permite refutar ou confirmar a hip ´otese, mas apenas dizer, com um determinado grau de confiabilidade, o quanto o conjunto de dados testado ´e discrepante do que seria esperado caso a hip ´otese fosse v´alida. O teste tem 3 elementos principais. O primeiro deles ´e a hip ´otese a ser testada, H0, chamada de hip ´otese nula. O segundo ´e a chamada estat´ıstica de teste, T, que ´e uma func¸˜ao constru´ıda a partir dos dados experimentais cuja distribuic¸˜ao de probabilidades ´e bem conhecida quando a hip ´otese nula ´e verda- deira. Uma caracter´ıstica importante dessa estat´ıstica ´e que quanto mais discrepante a hip ´otese nula est´a do comportamento dos dados observados, maior deve ser o seu va- lor observado. Essas restric¸ ˜oes ficar˜ao mais claras no exemplo que darei mais `a frente.
Figura 7.15: Estas figuras mostram o espectro de ru´ıdo de intensidade do campo refletido pela
cavidade em diversas situac¸˜oes. Nas curvas `a esquerda a ressonˆancia com cada banda lateral e com a portadora est˜ao bem resolvidas porque a frequˆencia de an´alise ´e bem maior que a largura de banda. Nas da direita a ressonˆancia com as bandas laterais se mistura `a com a portadora. As entradas da matriz de covariˆancias utilizada nas curvas pretas s˜aoα = 1.0, β = 2.58, γ = 0.0.
Nas curvas vermelhas, a mesma matriz ´e utilizadas, mas com as quadraturas giradas de 45o:
α= 1.79, β= 1.79, γ= 0.79. Nas curvas em azul, um termo δu = 0.76 ´e adicionado. Neste
7.6 Discuss˜ao sobre Gaussianidade 163
O terceiro elemento de um teste de hip ´oteses ´e o chamado p-valor. Formalmente, o p-valor ´e a probabilidade de que a estat´ıstica de teste possua um valor pelo menos t˜ao extremo
quanto o que foi observado em um determinado experimento,
p = P(T> t|H0) = 1− P(T ≤ t|H0) = 1 − F0(t), (7.12)
onde T ´e a estat´ıstica de teste te ´orica e t ´e o valor observado dessa estat´ıstica extra´ıda a partir dos dados experimentais. A func¸˜ao F0(t) = P(T≤ t|H0) ´e a distribuic¸˜ao de probabili-
dade cumulativa da estat´ıstica de teste at´e o valor observado t quando H0 ´e verdadeira3
e ´e uma func¸˜ao crescente definida no intervalo [0,1] [136]. Para vari´aveis aleat ´orias cont´ınuas, F0(t) = P(T≤ t|H0) =
R t
−∞dt′φ(t′) ondeφ(t) ´e a densidade de probabilidades.
Se a hip ´otese H0for verdadeira, os p-valores possuem densidade de probabilidade
uniforme, pois eles s˜ao, por definic¸˜ao, uma distribuic¸˜ao cumulativa. Para provar isto, considere duas vari´aveis aleat ´orias cont´ınuas X e Y que podem assumir valores reais x e y, respectivamente, tal que
Y = FX(x) =
Z x
−∞
dx′φX(x′) (7.13)
eφX(x) eφY(y) sejam as densidades de probabilidades de X e Y respectivamente. Como
0≤ y ≤ 1, 1 = Z 1 0 dy′φY(y′) = Z ∞ −∞ dx′φX(x′) = Z 1 0 |J| −1dy′φ X[F−1X (Y′)] = Z 1 0 dy′, (7.14) pois J =∂y′/∂x′=φX(x′). Portanto,φ
Y(y′) = 1, ou seja, a distribuic¸˜ao de Y ´e uniforme,
pois esta est´a definida no intervalo [0,1]. Como o p-valor ´e igual a uma distribuic¸˜ao uniforme mais uma constante, ele ´e, por sua vez, tamb´em uma distribuic¸˜ao uniforme. Em outras palavras como, o p-valor ´e definido como uma distribuic¸˜ao cumulativa condicionado `a hip ´otese H0ser v´alida, se observamos uma distribuic¸˜ao uniforme dos
p-valores temos evidˆencias para aceitar a hip ´otese H0como sendo v´alida. Ou, de forma
menos restritiva: n˜ao temos nenhuma evidˆencia que permita refutar a validade da hip´otese H0.
Normalmente ´e escolhido um valorα, chamado de significˆancia estat´ıstica, abaixo do qual a hip ´otese deve ser considerada falsa4. A escolha deste valor ´e arbitr´aria e quanto mais pr ´oxima de zero, mais o teste de hip ´otese ´e capaz de rejeitar a hip ´otese nula. O problema ´e que mesmo quando a hip ´otese ´e verdadeira, uma frac¸˜ao dos p-
3Ela ´e igual `a probabilidade da vari´avel aleat ´oria assumir valores t≤ t′ assumindo que H0 esteja
correta.
valores vai estar abaixo do n´ıvel de significˆancia escolhido, pois a distribuic¸˜ao dos mesmos deve ser uniforme. Por este motivo, uma informac¸˜ao bem mais confi´avel pare rejeitar a hip ´otese inicial ´e olhar para a distribuic¸˜ao dos p-valores em vez de somente para um p-valor individual. Se v´arios p-valores possu´ırem, consistentemente, valores abaixo do n´ıvel de significˆancia, ent˜ao a hip ´otese pode ser rejeitada satisfatoriamente.
Figura 7.16: Comparac¸˜ao do resultado do teste de Shapiro-Wilk para uma distribuic¸˜ao gaussiana
com uma T de Student de dimens˜ao ν = 40, ambas produzidas por um gerador de n ´umeros
pseudo-aleat´orios. O ponto interessante desta comparac¸˜ao ´e que, al´em do apelo visual, o quarto momento da distribuic¸˜ao T de Student ´e apenas 8 % maior que o da distribuic¸˜ao gaussiana. Note que o resultado para o teste de Shapiro-Wilk acusa claramente a distribuic¸˜ao da direita n˜ao ´e gaussiana.
Discutirei um exemplo simples de teste de hip ´oteses para criar um pouco de intuic¸˜ao sobre a estat´ıstica de teste e sobre o p-valor. Considere que possuo um conjunto de vari´aveis aleat ´orias, x1, x2, ..., xn, com distribuic¸˜ao gaussiana de m´ediaµ e variˆancia σ, e
7.6 Discuss˜ao sobre Gaussianidade 165
de uma estat´ıstica de teste. Uma possibilidade simples seria
T1≡ x = 1 n n X i=1 xi. (7.15)
Como cada xisegue uma distribuic¸˜ao gaussiana, de m´ediaµ e variˆancia σ2, a distribuic¸˜ao
de T1 ´e uma gaussiana de m´edia µ e variˆancia σ2/n. Entretanto, ela ´e possui um pro-
blema, pois a distribuic¸˜ao de probabilidade de T1 ´e sim´etrica em relac¸˜ao µ, ou seja, ela decresce ´a medida que uma realizac¸˜ao de T1se afasta de µ em ambos os sentidos
positivo e negativo. De fato, o ponto que satisfaz a hip ´otese nula est´a na pr ´opria medi- ana da distribuic¸˜ao. Para contornar este problema, um estat´ıstica de teste melhor que
T1 ´e T2=T12, que corresponde a projetar todos os valores negativos sobre os positivos.
Neste caso, a probabilidade de que cada realizac¸˜ao de T2 se afasta de µ decresce a
medida que o valor seu valor aumenta. Como a probabilidade de uma ocorrˆencia de um valor em T2deve ser a igual `a soma de toda poss´ıvel ocorrˆencia T1mais o seu res-
pectivo valor negativo, P(T2)dT2=P(T1)dT1+P(−T1)dT1, ent˜ao, T2segue a densidade
de probabilidades
P(T2) = p 1 2πσ2T
2
e−2σ2T2 (7.16)
casoσ seja conhecido5. Portanto, ´e poss´ıvel comparar T2calculado a partir da distribuic¸˜ao
P(T2) com com o valor t2= [P xdi]2/n2, calculado a partir dos dados que temos dis-
pon´ıveis.