As notações 𝑡 e 𝑇 apelam à notação de tempo, no entanto, o método STATIS poder-se-á
aplicar a dados não temporais.
4.3 INTERESTRUTURA
Esta primeira etapa consiste na comparação global dos 𝑇 quadros. Para tal é necessário
definir um objecto representativo para cada estudo, uma métrica sobre os objectos representativos de cada estudo e, finalmente, definir uma imagem euclidiana dos objectos representativos associada aos produtos escalares já definidos.
Assim é possível caracterizar um estudo (𝑋𝑡, 𝑄𝑡, 𝐷), 𝑡 = 1, … , 𝑇, por um objecto:
𝑊𝑡= 𝑋𝑡 𝑄𝑡 𝑋𝑡′ (4.4)
em que 𝑄𝑡 é a métrica associada ao espaço dos indivíduos do quadro 𝑋𝑡 e 𝐷 é a métrica
associada ao espaço das variáveis. O objecto 𝑊𝑡 é uma matriz de dimensão 𝑛 × 𝑛
denominada matriz dos produtos escalares entre indivíduos do quadro 𝑿𝒕.
Tal como já foi referido, para representar graficamente os 𝑇 estudos é necessário definir
uma distância (métrica) entre estes. Para tal, é necessário definir um produto escalar entre os objectos:
141
Denominado produto escalar de Hilbert-Schmidt, introduzido inicialmente por Escoufier (1973), para induzir uma distância (euclidiana) entre os objectos 𝑊𝑡 e 𝑊𝑡′, dada pela seguinte expressão: 𝑑𝐻𝑆(𝑊𝑡, 𝑊𝑡′) = ‖𝑊𝑡− 𝑊𝑡′‖𝐻𝑆 = √〈𝑊𝑡− 𝑊𝑡′, 𝑊𝑡− 𝑊𝑡′〉𝐻𝑆 =⏞ (3.94) √𝑡𝑟 ((𝑊𝑡− 𝑊𝑡′) 𝐷)2 (4.6)
Note-se que a distância entre estes objectos também pode ser estabelecida da forma que segue: 𝑑𝐻𝑆(𝑊𝑡, 𝑊𝑡′) = ‖𝑊𝑡− 𝑊𝑡′‖𝐻𝑆 = √〈𝑊𝑡− 𝑊𝑡′, 𝑊𝑡− 𝑊𝑡′〉𝐻𝑆 = √‖𝑊𝑡‖𝐻𝑆2 + ‖𝑊 𝑡′‖𝐻𝑆2 − 2 〈𝑊𝑡, 𝑊𝑡′〉𝐻𝑆 (4.7)
A norma do objeto 𝑾𝒕 é assim definida:
‖𝑊𝑡‖𝐻𝑆 = √〈𝑊𝑡, 𝑊𝑡′〉𝐻𝑆 =⏞ (3.94) √𝑡𝑟 (𝑊𝑡 𝐷 𝑊𝑡 𝐷) = √𝑡𝑟 (𝑊𝑡 𝐷)2 = √∑(𝜆𝑖𝑡)2 𝑛 𝑖=1 (4.8)
com 𝜆𝑖𝑡 o 𝑖 − é𝑠𝑖𝑚𝑜 valor próprio de 𝑊𝑡𝐷.
A matriz 𝑺 dos produtos escalares entre os objectos 𝑊𝑡 e 𝑊𝑡′ de dimensão 𝑇 × 𝑇, tem
como termo geral:
142
Da mesma forma que acontecia na ACP, se os objectos 𝑊𝑡 tiverem normas muito diferentes é conveniente normá-los, ou seja, considerar os objectos 𝑊𝑡 ‖𝑊
𝑡‖𝐻𝑆
⁄ ; neste caso, a matriz dos produtos escalares 𝑆̃ tem como termo geral:
𝑆̃𝑡𝑡′= 〈𝑊𝑡, 𝑊𝑡′〉𝐻𝑆 ‖𝑊𝑡‖𝐻𝑆 ‖𝑊𝑡′‖𝐻𝑆
(4.10)
O coeficiente de correlação vetorial entre os objectos 𝑾𝒕 e 𝑾𝒕′, ou coeficiente 𝑹𝑽,
proposto por Robert et al.(1976) é designado por:
𝑅𝑉 (𝑡, 𝑡′) = 〈 𝑊𝑡 ‖𝑊𝑡‖𝐻𝑆, 𝑊𝑡′ ‖𝑊𝑡′‖𝐻𝑆〉𝐻𝑆 = 𝑆𝑡𝑡′ √𝑆𝑡𝑡√𝑆𝑡′𝑡′ = 𝑆̃𝑡𝑡′ (4.11)
Os coeficientes 𝑅𝑉 são muito úteis na interpretação da interestrutura, uma vez que
possuem as seguintes propriedades:
Os coeficientes 𝑅𝑉 permitem obter a distância entre dois objectos normados:
𝑑𝐻𝑆 ( 𝑊𝑡 ‖𝑊𝑡‖𝐻𝑆 , 𝑊𝑡′ ‖𝑊𝑡′‖𝐻𝑆 ) = ‖ 𝑊𝑡 ‖𝑊𝑡‖𝐻𝑆 − 𝑊𝑡′ ‖𝑊𝑡′‖𝐻𝑆 ‖ 𝐻𝑆 = √2 − 2 𝑅𝑉 (𝑡, 𝑡′) (4.12)
Se 𝑅𝑉(𝑡, 𝑡′) = 1 a distância acima é nula e:
𝑊𝑡 ‖𝑊𝑡‖𝐻𝑆 =
𝑊𝑡′
‖𝑊𝑡′‖𝐻𝑆 (4.13)
Isto significa que a imagem euclidiana dos indivíduos do estudo 𝑡 deduz-se da imagem
euclidiana do estudo 𝑡′ pela homotetia de razão ‖𝑊𝑡‖𝐻𝑆
‖𝑊𝑡′‖𝐻𝑆
⁄ .
Existem duas justificações importantes para a utilização do produto escalar de Hilbert- Schmidt:
143
Decompondo ‖𝑊𝑡− 𝑊𝑡′‖𝐻𝑆2 no espaço dos indivíduos (isto é, com as métricas 𝑄𝑡 e
𝑄𝑡′) fica-se com: ‖𝑊𝑡− 𝑊𝑡′‖𝐻𝑆2 = ∑ ∑ 𝑝 𝑖 𝑝𝑗 (〈(𝑥𝑖)𝑡, (𝑥𝑗) 𝑡 〉𝑄𝑡 𝑛 𝑗=1 𝑛 𝑖=1 − 〈(𝑥𝑖)𝑡′, (𝑥 𝑗) 𝑡′ 〉𝑄𝑡′)2 (4.14)
Então ‖𝑊𝑡− 𝑊𝑡′‖𝐻𝑆2 é igual à soma ponderada dos quadrados das diferenças entre os
produtos escalares entre indivíduos do quadro 𝑋𝑡 e os produtos escalares entre indivíduos do quadro 𝑋𝑡′.
Exprimindo 〈𝑊𝑡, 𝑊𝑡′〉𝐻𝑆 no espaço das variáveis e utilizando a métrica identidade para
calcular os produtos escalares entre indivíduos (que seja, 𝑄𝑡= 𝐼𝑝𝑡 e 𝑄𝑡′= 𝐼𝑝𝑡′), tem-
se: 〈𝑊𝑡, 𝑊𝑡′〉𝐻𝑆= ∑ ∑(〈(𝑥𝑘)𝑡, (𝑥𝑙)𝑡′〉𝐷)2 𝑝𝑡′ 𝑙=1 𝑝𝑡 𝑘=1 (4.15)
Então 〈𝑊𝑡, 𝑊𝑡′〉𝐻𝑆 é igual à soma dos quadrados das covariâncias entre as variáveis do quadro 𝑋𝑡 e as variáveis do quadro 𝑋𝑡′.
Se os objectos 𝑊𝑡 e 𝑊𝑡′ são ortogonais, tem-se que 〈𝑊𝑡, 𝑊𝑡′〉𝐻𝑆= 0; então 𝑅𝑉(𝑡, 𝑡′) = 0 e
poder-se-à dizer que as covariâncias entre as variáveis de 𝑋𝑡 e as variáveis de 𝑋𝑡′ são nulas.
Para se construir a imagem euclidiana dos 𝑇 estudos é necessário afetar cada um destes
de um peso designado por 𝜋𝑡. Logo a matriz dos pesos dos estudos é:
∆= ( 𝜋1 0 … 0 𝜋2 … ⋮ ⋮ ⋱ 0 0 ⋮ 0 0 … 𝜋𝑇 ) (4.16)
144
No caso de se atribuir aos estudos a mesma importância tem-se que ∆= 1
𝑇 𝐼𝑇. Se houver
algum quadro que deva intervir na imagem euclidiana sem contribuir para a análise e determinação dos eixos, esse quadro deverá ser considerado suplementar, ou seja, deverá ser-lhe atribuído um peso nulo.
A partir deste momento basta aplicar uma ACP à matriz 𝑆; para tal é necessário calcular
os valores próprios e os vetores próprios da matriz 𝑆∆. Assuma-se então:
𝜏1, 𝜏2, … , 𝜏𝑇 como os valores próprios da matriz 𝑆∆ associados aos vetores próprios
∆ − 𝑜𝑟𝑡𝑜𝑛𝑜𝑟𝑚𝑎𝑑𝑜𝑠𝛾1, 𝛾2, … , 𝛾𝑇, respetivamente;
𝐴1, 𝐴2, … , 𝐴𝑇 como os pontos associados a 𝑊1, 𝑊2, … , 𝑊𝑇, respetivamente, na imagem
euclidiana.
As coordenadas de 𝐴𝑡 sobre o 𝑖 − é𝑠𝑖𝑚𝑜 eixo são as componentes do vetor √𝜏𝑖𝛾𝑖 (de
dimensão 𝑇) com 𝑡 = 1, … , 𝑇.
Na prática, a imagem euclidiana restringe-se aos dois primeiros eixos, obtendo-se uma imagem euclidiana plana aproximada dos 𝑇 estudos, associada aos produtos escalares
entre objectos: o plano principal. Desta forma, a distância entre os pontos 𝐴𝑡 e 𝐴𝑡′ é a melhor aproximação entre os objectos 𝑊𝑡 e 𝑊𝑡′ no sentido do produto escalar de Hilbert- Schmidt e dois pontos suficientemente próximos no plano principal revelam uma estrutura de indivíduos comum aos quadros correspondentes.
O seguinte teorema, cuja demonstração se encontra em Lavit (1988-a), permite ter uma ideia de como se vão situar os pontos 𝐴𝑡, na respetiva imagem euclidiana.
Teorema 4.1: Uma matriz simétrica com todos os termos positivos admite um vetor
próprio associado ao maior valor próprio cujas coordenadas têm todas o mesmo sinal.
Ora, representando os pontos 𝐴𝑡 (𝑡 = 1, … , 𝑇) no plano principal constituído pelos dois
primeiros eixos, estes vão situar-se todos no primeiro e quarto quadrantes, admitindo que as coordenadas do primeiro vetor próprio são todas positivas - veja-se a Figura 4.2.
145
Figura 4.2 - Representação dos objectos no plano principal
Fonte: Adaptado de Carvalhido (2005).
Note-se que o coeficiente 𝑅𝑉(𝑡, 𝑡′) representa o cosseno do ângulo formado pelos vetores 𝑂𝐴𝑡 ⃗⃗⃗⃗⃗⃗⃗ e 𝑂𝐴⃗⃗⃗⃗⃗⃗⃗⃗⃗ : 𝑡′ 𝑅𝑉 (𝑡, 𝑡′) =⏞ (3.100) 〈𝑊 𝑡, 𝑊𝑡〉𝐻𝑆 ‖𝑊𝑡‖𝐻𝑆 ‖𝑊𝑡′‖𝐻𝑆 = 𝑐𝑜𝑠(𝑂𝐴⃗⃗⃗⃗⃗⃗⃗ , 𝑂𝐴𝑡 ⃗⃗⃗⃗⃗⃗⃗⃗⃗ ) 𝑡′ (4.17)
Se os objectos forem normados (𝑊𝑡
‖𝑊𝑡‖𝐻𝑆
⁄ ) a matriz dos coeficientes 𝑅𝑉 coincide com a
matriz 𝑆.
Caso se pretenda atribuir pesos iguais aos vários estudos, diagonalizar-se-à apenas a matriz 𝑆. A diagonalização desta matriz permite obter uma representação análoga à
representação das variáveis na ACP, designada por imagem euclidiana da interestrutura
não centrada.
Outra representação gráfica será a imagem euclidiana da interestrutura centrada, em que a matriz 𝑆 será centrada por linhas e por colunas. Esta representação é diferente e
complementar daquela obtida anteriormente e tem como vantagem a visualização das proximidades e oposições entre objectos.
Neste caso a matriz em questão é:
146
A diagonalização da matriz 𝐶∆ ou 𝐶 (no caso dos pesos atribuídos aos objectos serem
todos iguais) permite a representação gráfica dos objectos semelhante à representação dos indivíduos na ACP.