Åpne gårdsrom - Arkitektur og byens rom

A ideia de um teste de hip ´otese b´asico consiste em buscar indicac¸ ˜oes de que uma determinada suposic¸˜ao feita sobre alguma propriedade estat´ıstica ´e consistente com certo conjunto de dados. ´E importante se ter em mente que um teste deste tipo n˜ao permite refutar ou confirmar a hip ´otese, mas apenas dizer, com um determinado grau de confiabilidade, o quanto o conjunto de dados testado ´e discrepante do que seria esperado caso a hip ´otese fosse v´alida. O teste tem 3 elementos principais. O primeiro deles ´e a hip ´otese a ser testada, H₀, chamada de hip ´otese nula. O segundo ´e a chamada estat´ıstica de teste, T, que ´e uma func¸˜ao constru´ıda a partir dos dados experimentais cuja distribuic¸˜ao de probabilidades ´e bem conhecida quando a hip ´otese nula ´e verda- deira. Uma caracter´ıstica importante dessa estat´ıstica ´e que quanto mais discrepante a hip ´otese nula est´a do comportamento dos dados observados, maior deve ser o seu va- lor observado. Essas restric¸ ˜oes ficar˜ao mais claras no exemplo que darei mais `a frente.

Figura 7.15: Estas figuras mostram o espectro de ru´ıdo de intensidade do campo refletido pela

cavidade em diversas situac¸˜oes. Nas curvas `a esquerda a ressonˆancia com cada banda lateral e com a portadora est˜ao bem resolvidas porque a frequˆencia de an´alise ´e bem maior que a largura de banda. Nas da direita a ressonˆancia com as bandas laterais se mistura `a com a portadora. As entradas da matriz de covariˆancias utilizada nas curvas pretas s˜aoα = 1.0, β = 2.58, γ = 0.0.

Nas curvas vermelhas, a mesma matriz ´e utilizadas, mas com as quadraturas giradas de 45o:

α= 1.79, β= 1.79, γ= 0.79. Nas curvas em azul, um termo δu = 0.76 ´e adicionado. Neste

7.6 Discuss˜ao sobre Gaussianidade 163

O terceiro elemento de um teste de hip ´oteses ´e o chamado p-valor. Formalmente, o p-valor ´e a probabilidade de que a estat´ıstica de teste possua um valor pelo menos t˜ao extremo

quanto o que foi observado em um determinado experimento,

p = P(T> t|H0) = 1− P(T ≤ t|H0) = 1 − F0(t), (7.12)

onde T ´e a estat´ıstica de teste te ´orica e t ´e o valor observado dessa estat´ıstica extra´ıda a partir dos dados experimentais. A func¸˜ao F0(t) = P(T≤ t|H0) ´e a distribuic¸˜ao de probabili-

dade cumulativa da estat´ıstica de teste at´e o valor observado t quando H0 ´e verdadeira3

e ´e uma func¸˜ao crescente definida no intervalo [0,1] [136]. Para vari´aveis aleat ´orias cont´ınuas, F0(t) = P(T≤ t|H0) =

R t

−∞dt′φ(t′) ondeφ(t) ´e a densidade de probabilidades.

Se a hip ´otese H0for verdadeira, os p-valores possuem densidade de probabilidade

uniforme, pois eles s˜ao, por definic¸˜ao, uma distribuic¸˜ao cumulativa. Para provar isto, considere duas vari´aveis aleat ´orias cont´ınuas X e Y que podem assumir valores reais x e y, respectivamente, tal que

Y = FX(x) =

Z x

−∞

dx′φX(x′) (7.13)

eφX(x) eφY(y) sejam as densidades de probabilidades de X e Y respectivamente. Como

0_{≤ y ≤ 1,} 1 = Z 1 0 dy′φY(y′) = Z ∞ −∞ dx′φX(x′) = Z 1 0 |J| −1_dy′_φ X[F−1_X (Y′)] = Z 1 0 dy′, (7.14) pois J =∂y′_/∂x′₌_φ_X_(x′_{). Portanto,}_φ

Y(y′) = 1, ou seja, a distribuic¸˜ao de Y ´e uniforme,

pois esta est´a definida no intervalo [0,1]. Como o p-valor ´e igual a uma distribuic¸˜ao uniforme mais uma constante, ele ´e, por sua vez, tamb´em uma distribuic¸˜ao uniforme. Em outras palavras como, o p-valor ´e definido como uma distribuic¸˜ao cumulativa condicionado `a hip ´otese H0ser v´alida, se observamos uma distribuic¸˜ao uniforme dos

p-valores temos evidˆencias para aceitar a hip ´otese H0como sendo v´alida. Ou, de forma

menos restritiva: n˜ao temos nenhuma evidˆencia que permita refutar a validade da hip´otese H0.

Normalmente ´e escolhido um valorα, chamado de significˆancia estat´ıstica, abaixo do qual a hip ´otese deve ser considerada falsa4. A escolha deste valor ´e arbitr´aria e quanto mais pr ´oxima de zero, mais o teste de hip ´otese ´e capaz de rejeitar a hip ´otese nula. O problema ´e que mesmo quando a hip ´otese ´e verdadeira, uma frac¸˜ao dos p-

3_{Ela ´e igual `a probabilidade da vari´avel aleat ´oria assumir valores t}_{≤ t}′ _{assumindo que H}₀ _esteja

correta.

valores vai estar abaixo do n´ıvel de significˆancia escolhido, pois a distribuic¸˜ao dos mesmos deve ser uniforme. Por este motivo, uma informac¸˜ao bem mais confi´avel pare rejeitar a hip ´otese inicial ´e olhar para a distribuic¸˜ao dos p-valores em vez de somente para um p-valor individual. Se v´arios p-valores possu´ırem, consistentemente, valores abaixo do n´ıvel de significˆancia, ent˜ao a hip ´otese pode ser rejeitada satisfatoriamente.

Figura 7.16: Comparac¸˜ao do resultado do teste de Shapiro-Wilk para uma distribuic¸˜ao gaussiana

com uma T de Student de dimens˜ao ν = 40, ambas produzidas por um gerador de n ´umeros

pseudo-aleat´orios. O ponto interessante desta comparac¸˜ao ´e que, al´em do apelo visual, o quarto momento da distribuic¸˜ao T de Student ´e apenas 8 % maior que o da distribuic¸˜ao gaussiana. Note que o resultado para o teste de Shapiro-Wilk acusa claramente a distribuic¸˜ao da direita n˜ao ´e gaussiana.

Discutirei um exemplo simples de teste de hip ´oteses para criar um pouco de intuic¸˜ao sobre a estat´ıstica de teste e sobre o p-valor. Considere que possuo um conjunto de vari´aveis aleat ´orias, x₁, x₂, ..., xn, com distribuic¸˜ao gaussiana de m´ediaµ e variˆancia σ, e

7.6 Discuss˜ao sobre Gaussianidade 165

de uma estat´ıstica de teste. Uma possibilidade simples seria

T1≡ x = 1 n n X i=1 xi. (7.15)

Como cada xisegue uma distribuic¸˜ao gaussiana, de m´ediaµ e variˆancia σ2, a distribuic¸˜ao

de T1 ´e uma gaussiana de m´edia µ e variˆancia σ2/n. Entretanto, ela ´e possui um pro-

blema, pois a distribuic¸˜ao de probabilidade de T₁ ´e sim´etrica em relac¸˜ao µ, ou seja, ela decresce ´a medida que uma realizac¸˜ao de T1se afasta de µ em ambos os sentidos

positivo e negativo. De fato, o ponto que satisfaz a hip ´otese nula est´a na pr ´opria medi- ana da distribuic¸˜ao. Para contornar este problema, um estat´ıstica de teste melhor que

T₁ ´e T2=T₁2, que corresponde a projetar todos os valores negativos sobre os positivos.

Neste caso, a probabilidade de que cada realizac¸˜ao de T2 se afasta de µ decresce a

medida que o valor seu valor aumenta. Como a probabilidade de uma ocorrˆencia de um valor em T2deve ser a igual `a soma de toda poss´ıvel ocorrˆencia T1mais o seu res-

pectivo valor negativo, P(T2)dT2=P(T1)dT1+P(−T1)dT1, ent˜ao, T2segue a densidade

de probabilidades

P(T₂) = p 1 2πσ2_T

e−2σ2T2 _(7.16)

casoσ seja conhecido5. Portanto, ´e poss´ıvel comparar T2calculado a partir da distribuic¸˜ao

P(T2) com com o valor t2= [P xd_i]2/n2, calculado a partir dos dados que temos dis-

pon´ıveis.

In document Arkitektur og byens rom (sider 40-60)