• No results found

Análise fatorial é um nome genérico dado a uma classe de métodos estatísticos multivariados (análise de múltiplas variáveis em um único relacionamento ou conjunto de relações), cujo propósito principal é definir a estrutura subjacente em uma matriz de dados. Genericamente, a análise fatorial visa analisar a estrutura das inter-relações (correlações) entre um número grande de variáveis obtidas, por exemplo, por meio da aplicação de questionários, definindo um conjunto relativamente pequeno de dimensões latentes comuns, chamadas de fatores ou simplesmente dimensões (HAIR, Jr. et al., 2005). Essas variáveis, em termos sociais, podem estar de alguma maneira correlacionadas.

Por ser uma técnica de interdependência, na sua análise, todas as variáveis são simultaneamente consideradas, cada uma correlacionada com todas as outras. A apresentação dos resultados é feita pela composição linear das variáveis, sendo possível observar o poder de explicação do conjunto inteiro de variáveis.

Com a análise fatorial, é possível identificar as dimensões separadas da estrutura e então determinar o grau em que cada variável é explicada por cada dimensão. Uma vez que essas dimensões e a explicação de cada dimensão estejam definidas, os dois principais usos da análise fatorial – resumo e redução de dados – podem ser obtidos.

Resumir os dados significa obter dimensões latentes, que uma vez analisadas e interpretadas, descrevem os dados em um número muito menor de conceitos do que as variáveis individuais originais. A redução dos dados é obtida pelo o cálculo

de escores para cada uma das dimensões latentes e na substituição das variáveis originais por esses escores.

Segundo Hair, Jr et al. (op. cit., p. 91), se um número de variáveis é muito grande, ou se há a necessidade de representar melhor um número menor de conceitos, em vez de muitas facetas, a análise fatorial pode auxiliar na seleção de um subconjunto representativo de variáveis ou mesmo na criação de novas variáveis como substitutas das variáveis originais, e ainda mantendo seu caráter original, e explica:

“Se tivéssemos que esboçar uma analogia com as técnicas de dependência, seria no sentido de que cada variável observada (original) é uma variável dependente que é uma função de algum conjunto latente de fatores (dimensões) feitos eles próprios a partir de todas as outras variáveis.” E segue “[...] de maneira recíproca, podemos olhar para cada fator (variável estatística) como uma variável dependente que é uma função do conjunto inteiro de variáveis observadas.”

De maneira geral as técnicas analíticas fatoriais podem ser utilizadas sob dois aspectos: segundo a perspectiva exploratória – útil na busca da estrutura em um conjunto de variáveis ou um método para redução de dados –, ou sob a ótica confirmatória, onde o pesquisador tem preconcebido idéias sobre a real estrutura dos dados, baseado em pesquisas anteriores ou suporte teórico. Neste caso podem- se testar hipóteses envolvendo questões sobre agrupamento de variáveis ou o número de dimensões (fatores) que devem fazer parte da análise.

Quanto às suposições na análise fatorial, Hair, Jr. et al. (op. cit., p.98) comenta que, de um ponto de vista estatístico, os desvios da normalidade, da homoscedasticidade e da linearidade aplicam-se apenas no nível em que elas diminuem as correlações observadas, e complementa: “de fato, na análise fatorial, um pouco de multicolinearidade é desejável, pois o objetivo é identificar conjuntos de variáveis inter-relacionados.”

Entretanto, há a necessidade de verificar se a matriz de dados tem correlações suficientes para justificar a aplicação da análise fatorial. Dentre os diversos métodos (inspeção visual das correlações; correlações parciais; correlações anti-imagem, etc), pode-se aplicar o teste Kayser-Meyer-Olkin Measure of

Sampling Adequacy (KMO) (DILLON e GOLDSTEIN, 1984), que é um método

estatística de que a matriz de correlação tenha correlações significantes (consistência) entre pelo menos algumas variáveis. O índice obtido variando entre 0 e 1, pode assumir o valor 1 quando cada variável é perfeitamente prevista sem erro pelas outras variáveis.

Apesar da bibliografia (KAYSER, 1974) interpretar valores na casa de 0,6 como sendo de adequação medíocre dos dados à análise fatorial, outros pesquisadores (HAIR, Jr. et al., op cit., BORIN, 2006) consideram níveis de intensidade acima de 0,5 ou 0,6 como sendo satisfatórios para análises que abordem aspectos no âmbito social.

Outro teste que precede a análise fatorial com vistas à verificação de suas premissas é o de Bartllet Test of Sphericity (BTS) (HAIR, Jr. et al., op cit., p. 98), que, conforme Zambrano e Lima (2004) serve para testar a hipótese nula de que a matriz de correlação é uma matriz de identidade. Se essa hipótese nula se confirmar, o uso do modelo de análise fatorial deve ser reavaliado.

Quanto à seleção do método de extração dos fatores (análise de fatores comuns versus análise de componentes), depende inteiramente do objetivo do pesquisador, sendo que na análise de componentes o objetivo principal é resumir a maior parte da informação original (variância) a um número mínimo de fatores, possibilitando inferir previsões. Por outro lado, a análise de fatores comuns é usada para identificar fatores ou dimensões latentes que reflitam o que as variáveis têm em comum. Segundo Hair, Jr. et al. (op. cit., p. 99), as dificuldades das análises de fatores comuns têm levado para o amplo uso da análise de componentes. Pesquisas empíricas demonstram que tanto a análise de fatores comuns quanto a análise de componentes chegam a resultados essencialmente idênticos se o número de variáveis exceder a 30 (VELICER e JACKSON, 1990).

Após a transformação de um grande conjunto de variáveis em fatores, há a necessidade de se analisar o melhor critério de parada para a extração desses fatores. Dentre os diversos critérios, o de percentagem de variância garante a significância prática dos fatores determinados, onde: “[...] em ciências sociais, na qual as informações são menos precisas, não é raro considerar uma solução que explique 60% da variância total (em alguns casos até menos) como satisfatória.” (HAIR, Jr. et al., op. cit., p. 102).

A interpretação dos dados envolve a rotação dos fatores, isto é, rotacionar os eixos de referência dos fatores em torno da origem, procurando-se outras posições para os dados. De certa forma, a solução de fatores rotacionados extrai fatores em sua ordem de importância, onde o primeiro fator apresenta a maior parcela da variância, e os seguintes, resultados da parcela residual dessa variância. A redistribuição da variância busca um padrão fatorial mais simples e teoricamente mais significativo para o conjunto de dados.

Dentre os processos ortogonais desenvolvidos para a simplificação de linhas e colunas de matrizes fatoriais, o método VARIMAX tem sido bem sucedido como uma abordagem analítica para a rotação de fatores (HOFFMANN, 1999). Verifica-se que, sendo a intenção do pesquisador reduzir o número de variáveis para um conjunto menor de variáveis, não obrigatoriamente correlacionadas, para uso subseqüente em regressão ou outras técnicas de regressão, a solução ortogonal se mostra mais interessante.

Na análise final interpretativa da matriz de componentes rotacionada identificam-se as maiores cargas apresentadas para cada variável analisada, identificando-se a comunalidade de cada variável. Nesta fase o pesquisador deve definir quais critérios devem ser utilizados para identificar as variáveis que atendam aos níveis de redução aceitáveis, levando-se em conta quais variáveis realmente contribuem para a pesquisa.