Existem vários métodos de análise fatorial, cada um com fundamentação teórica e faixas de aplicabilidade específicas. Quando se tem por objetivo verificar de que forma as amostras se relacionam, bem como a redução da dimensionalidade do problema, utiliza-se o método da análise das componentes principais (ACP).
A análise de componentes principais é uma técnica de redução da dimensionalidade que permite projetar o máximo de informação no menor número possível de dimensões não correlacionadas, facilitando o manuseio e a compreensão do fenômeno, sem perda significativa de informação.
O desenvolvimento desta técnica teve início com Karl Person, em 1901, e foi inserida na estatística matemática por Harold Hotelling, em 1933 (LEBART et al., 1995), e atualmente é utilizada no campo da sociologia, medicina, tecnologia de alimentos, educação, economia, agronomia, limnologia e hidrologia (SHOJI; YAMANOTE; NAKAMURA, 1966; POSSOLI, 1984: VIDAL et al., 2000; BRESSAN; BERAQUET; LEMOS, 2001; SILVEIRA; ANDRADE, 2002; LOPES et al, 2009), dentre outros.
A análise de componentes principais tem a finalidade de substituir um conjunto de variáveis correlacionadas por um conjunto de novas variáveis não-correlacionadas, sendo essas combinações lineares das variáveis iniciais e colocadas em ordem decrescente por suas variâncias, ou seja: VAR CP1 > VAR CP2 > VAR CPn (VERDINELLI, 1980).
A primeira componente principal explica o máximo possível da variância total contida nos dados em uma única dimensão. A segunda componente explica o máximo da variância restante entre todas as componentes não correlacionadas com a primeira componente. Já a terceira não é correlacionada com as duas primeiras, e explica o máximo de variância restante entre todas as componentes não correlacionadas com as duas primeiras. As componentes seguintes explicam, sempre, o restante da correlação entre os elementos não correlacionados com as componentes principais anteriores. Esta relação segue até se obter um número de componentes iguais ao número de variáveis.
Geometricamente, as componentes principais representam um novo sistema de coordenadas obtidas por uma rotação do sistema original, que fornece as direções de máxima variabilidade e proporciona uma descrição mais eficiente e simples da estrutura de covariância dos dados (SCREMIN, 2003).
A coordenada de uma variável ao longo de um eixo é o coeficiente de correlação entre essa variável e o fator (saturação). O quadrado de sua coordenada é igual à qualidade da representação de uma variável e é proporcional à sua contribuição à inércia do eixo. A
interpretação do fator fundamenta-se na síntese das variáveis mais ligadas (com maior coeficiente de correlação) ao eixo (JOLLIFE, 1986).
Segundo Hawkins (1974), em muitos casos, para a detecção de erros, a utilização de análise de componentes principais poderá ser tão eficiente quanto a utilização de dados originais, principalmente porque os vetores estarão expressando o comportamento conjunto das variáveis em estudo.
A ACP é uma técnica de análise de fator, podendo ser utilizada sempre sem correlação nas combinações lineares das variáveis observadas. O que se faz é transformar um par de variáveis correlatas em um par de fatores sem correlação (componentes principais), auxiliando a decidir quantos deles são necessários para representar os dados e para examinar a percentagem de variância total explicada por cada fator. A variância total é a soma da variância de cada variável, e é representada pelos autovalores (SILVEIRA, 2000). Existem vários procedimentos para determinar o número de fatores para ser usados em um modelo. Porém, o critério mais aceito pela comunidade científica é aquele que apenas fatores com variância maior que um, e autovalores maiores que um, sejam incluídos (HAIR JÚNIOR et al., 2005).
Na região central da Espanha, Helena et al. (2000) utilizaram a análise das componentes principais na avaliação temporal da composição do aquífero aluvial do rio Pisuerga. Foram analisadas 16 variáveis físico-químicas e, com a aplicação da análise das componentes principais, foram identificados cinco componentes principais, que explicaram 71,39 % da variabilidade total dos dados, sendo duas destas componentes (CP1 e CP4) associadas à mineralização das águas e as outras três à poluição.
Na região nordeste da Grécia, Simeonov et al. (2003) estudaram a qualidade das águas superficiais durante 3 anos (fevereiro de 1997 a janeiro de 2000). Foram analisadas 26 variáveis. Com a ACP foram extraídos seis fatores responsáveis, que explicaram 89,5% da variância total dos dados. A primeira componente conteve 22,1% da variância, a segunda componente, 19,8%, e as componentes CP3, CP4, CP5 e CP6, explicaram, respectivamente, 15,5; 13,0; 10,9; e 8,2% da variação total dos dados.
Com o propósito de avaliar a qualidade das águas para a parte baixa da bacia hidrográfica do rio Trussu, localizada no município de Iguatu, Ceará, Palácio (2004) desenvolveu um índice de qualidade de água, utilizando a técnica da análise da componente principal. O estudo considerou variáveis físico-químicas, e a técnica da análise da componente principal (ACP) foi aplicada com o objetivo de selecionar as mais significativas
para a variabilidade total dos dados. A ACP proporcionou a redução de 13 variáveis para duas componentes que explicaram 84,44% da variância total.
Singh et al. (2005) usaram técnicas de estatística multivariada para avaliação da qualidade de água e identificação das fontes de poluição do rio Gomti (Índia). Foram analisados 33 parâmetros e o modelo aplicado mostrou que os parâmetros responsáveis pelas variações de qualidade da água foram os relacionados principalmente aos traços de metais (lixiviação do solo e dos depósitos de resíduos industriais), sais solúveis (naturais), poluição orgânica e nutrientes (antropogênicos).
Para identificar os fatores determinantes (naturais e antrópicos) da qualidade das águas superficiais na bacia do Alto Acaraú, Ceará, Brasil, Andrade et al. (2007b) utilizaram a análise estatística multivariada, Análise Fatorial/Análise da Componente Principal(AF/ACP). Foram realizadas coletas trimestrais de amostras de água durante o período de fevereiro de 2003 a março de 2004, em seis pontos localizados em áreas de influência de maior densidade urbana e de drenagem de perímetros irrigados. O emprego da AF/ACP promoveu a redução de 16 características das águas superficiais da bacia do rio Acaraú para três componentes, que explicam 88% da variância total. Os parâmetros indicadores da qualidade das águas na bacia do Alto Acaraú foram relacionados, principalmente, com a solubilidade dos sais (ação natural), com nutrientes e transporte de sedimentos (ação antrópica), sendo o principal fator a geologia da região. A poluição difusa, gerada nos núcleos urbanos e em atividades agropecuárias, apresentou-se como o segundo fator determinante da qualidade das águas superficiais na área em estudo.
Analisando a qualidade das águas do trecho perenizado do rio Jaibaras, Ceará, Girão et al. (2007) aplicaram a técnica de estatística multivariada (AF/ACP) para verificar os fatores e as variáveis de maior significância. Foram consideradas 13 variáveis. Observaram por meio da AF/ACP que no início do trecho perenizado, a qualidade da água relaciona-se com três fatores, explicando 80% da variância total. Na confluência do rio Jaibaras com o rio Acaraú, dois fatores explicaram 81% da variância total dos dados.
Com o objetivo de identificar a origem dos fatores que determinam a qualidade das águas na parte baixa da Bacia do Acaraú, Andrade et al. (2007a) aplicaram o modelo de estatística multivariada – AF/ACP (Análise Fatorial/Análise da Componente Principal). A técnica da AF/ACP permitiu a seleção de quatro componentes indicadoras da qualidade das águas superficiais, explicando 82,1% da variância total. As variações da qualidade da água foram definidas por um grupo de sólidos (representando o processo de erosão e escoamento superficial), por um grupo de nutrientes (influência de fontes de poluição difusa, como
drenagem das áreas agrícolas), por um grupo orgânico (indicativo da ação antrópica) e um grupo de sais solúveis (processo natural).
Palácio et al. (2008), estudando a qualidade das águas do trecho perenizado do rio Trussu, localizado no município de Iguatu, Ceará, usaram a ACP para avaliar e interpretar um grande conjunto de dados de qualidade da água e identificar as fontes de poluição, com vista a obter uma melhor informação sobre a qualidade da água. CP1 explicou 48,36% da variância dos dados e foi associada principalmente com o sódio, condutividade elétrica, cloreto de magnésio, sulfato e carbonato de hidrogênio. CP2 (15,91% da variância) foi dominada por contaminação orgânica na água (NO3-N e NH4-N), sugerindo atividades antrópicas. Já a CP3 foi relacionada com os efeitos causados na água por fontes de poluentes não pontuais, tais como o escoamento agrícola (pH e PO4). Esse estudo sugere que a técnica CP é uma ferramenta útil para a identificação de importantes parâmetros de monitoramento da superfície da qualidade da água.
Para identificar a similaridade dos reservatórios superficiais do Ceará, com relação à salinidade das águas e identificar os fatores determinantes da qualidade das águas, Palácio et al. (2011) aplicaram técnicas de estatística multivariada. O emprego da análise de fator/análise de componente principal promoveu a redução de sete características das águas superficiais, para dois componentes, sendo que o primeiro componente explicou 57,28% e o segundo, 26,77% da variância contida nas sete variáveis.