• No results found

Lage dukker og invitere til lek

A utilização de métodos de análise de dados multivariados teve um crescimento significativo no século XXI, devido, principalmente, à necessidade da compreensão da imensa complexidade do comportamento humano, incluindo suas características multivariadas, e pelos imensos avanços ocorridos na área tecnológica. A análise multivariada está relacionada a um conjunto de procedimentos para se analisar a associação entre dois ou mais conjuntos de medidas que foram feitas em cada objeto em uma ou mais amostras de objetos (VALENTIN, 2012).

Para descrever os métodos multivariados, três características devem ser observadas: (1) se a técnica é usada principalmente para a análise da interdependência ou para a análise da dependência; (2) se a técnica é usada principalmente com o objetivo de exploração ou para o propósito de confirmação e tese, e (3) se a técnica é projetada para ser usada com dados métricos ou com dados não métricos (VALENTIN, 2012). Dentre as técnicas de análise multivariadas de dados, destacam-se a análise de componentes principais (ACP) e a análise de agrupamento hierárquico (AAH).

3.2.3.1 Análise de componentes principais (ACP)

A análise de componentes principais é um método que pode ser usado para se reduzir a dimensionalidade dos dados multivariados. Ela permite que o pesquisador reexpresse os dados (fazendo combinações lineares das variáveis originais) para que as primeiras variáveis novas resultantes (chamadas componentes) expliquem o maior número possível (LATTIN, 2011).

A tabela de dados é formulada com m variáveis (descritores) e n objetos (amostras). A ACP deve ser realizada em modo R (O R é um software livre para computação estatística e construção de gráficos que pode ser baixado e distribuído gratuitamente de acordo com a licença GNU). Consequentemente, é preciso definir, o que corresponde aos

“descritores” e aos “objetos”. Quando utiliza o coeficiente r de Pearson como índice de semelhança, não há necessidade de uma padronização dos dados.

Segundo Valentin (2012) a partir de uma matriz S de coeficientes de correlação linear (ou variâncias-covariâncias) entre m descritores medidos sobre n amostras, são efetuados os seguintes cálculos: os eixos fatoriais (= componentes principais) são definidos em direção e comprimento, pela resolução da equação característica:

(S - ʎbI)Ub = 0

Onde: S = matriz de coleção; Ub = autovetor b de S, com 1 ≤ b ≥ mν ʎb = autovalor b de S; I = matriz unidade.

A interpretação correta de um eixo fatorial deve ser baseada nas amostras e nos descritores que mais contribuem para a formação deste eixo (maior contribuição absoluta, CA). Por outro lado, o cálculo da contribuição relativa (CR) das amostras e descritores permite avaliar a importância de cada eixo sobre a posição relativa dessas amostras e descritores. Em ACP, essas contribuições são iguais às coordenadas dos pontos sobre o eixo, o que dispensa o seu cálculo (VALENTIN, 2012).

Para cada ponto P, o somatório dos quadrados das coordenadas sobre os eixos é igual à variância total de P. Assim, F21,I + F21,II + F21,III = variância de P1.

A análise de uma ACP consiste em determinar o que representa cada eixo em termos de suas características gerais, responsáveis pela ordenação das amostras. Na medida em que a significância dos eixos (maior variância explicada) vai diminuindo, a sua interpretação torna-se cada vez mais complicada. A interpretação de um eixo deve ser elaborada com base nas coordenadas dos descritores (espécies, meio, etc.) neste eixo, a partir dos quais foi elaborada a matriz de correlação (de Pearson) que deu origem aos autovetores. As coordenadas das amostras vem auxiliar, em seguida, nessa interpretação. Os princípios da interpretação de uma ACP são os seguintes:

1 - Uma proximidade maior ou menor entre dois pontos-variáveis no plano traduz uma maior ou menor correlação entre estas variáveis, principalmente quando elas são afastadas do centro do plano;

2 - A coordenada de um ponto-variável sobre um eixo fatorial é igual ao coeficiente de correlação entre esta variável e o eixo. Uma variável é considerada

significativamente ligada a um eixo, e por consequência suscetível de ser utilizada para a

interpretação deste eixo, quando a sua distância d ao centro do plano é d onde m = número de variáveis;

3 - A proximidade entre dois pontos-amostras traduz uma certa similaridade entre essas duas amostras;

4 - A proximidade entre um ponto-espécie e um ponto-amostra significa que, em média, esta espécie tem um alto valor nesta amostra (VALENTIN, 2012).

A análise de componente principal tem sido amplamente utilizada para auxiliar na interpretação dos dados em várias áreas do conhecimente, com maior ou menor frequência.

Na área de meio ambiente, por exemplo, a ACP foi utilizada para auxiliar na identificação de vapores nocivos, como representado na Figura 14 (SING et al., 2016).

Figura 14 – Utilização da ACP na identificação de vapores nocivos

Fone: Adaptado de SING et al., 2016.

Em um estudo na área de saúde, a ACP foi utilizada na triagem de compostos bioativos, como representado na Figura 15 (p. 75) (HAN et al., 2015).

Benzeno

Metanol

Diesel DMMP

Figura 15 – Utilização da ACP na triagem de compostos bioativos

Fonte: Adaptado de HAN et al., 2015

Na área econômica, a ACP foi usada em um estudo de avaliação de criação de peixes (trutas), com base em impactos ambientais e indicadores econômicos no ciclo de vida da criação, como representado na Figura 16 (CHEN et al., 2015).

Figura 16 - Utilização da ACP na avaliação do ciclo de vida

Fonte: Adaptado de CHEN et al., 2015

Inativo

Em estudo de metabolômica, a ACP pode ser utilizada como ferramenta auxiliar no rastreio de composição química e enzimática de vários genótipos de espécies, como representado na Figura 17 (UARROTA et al., 2014).

Figura 17 - Utilização da ACP com o ferramenta para auxiliar o rastreio da composição química de espécies

Fonte: Adaptada de UARROTA et al., 2014.

3.2.3.2 Análise de agrupamento hierárquico (AAH)

A análise de agrupamento busca a categorização, ou seja, dividir um grande grupo de observações em grupos menores para que as observações dentro de cada um deles sejam relativamente similares. A forma de construção de representações de objetos é baseada em suas similaridades e dissimilaridades, e constrói representações não espaciais e discretas (por exemplo, divisão em conjuntos sobrepostos e não sobrepostos), e fornece variáveis de escala nominal que diz se cada objeto pertence ou não pertence a cada um de determinado número de agrupamentos (LATTIN, 2011).

Muitas metodologias diferentes foram desenvolvidas para a análise de agrupamento, no entanto, a principal é a do método hierárquico, cujo resultado é representado como uma estrutura hierárquica de árvore, em que a solução de k agrupamento é formada pela união de dois agrupamentos da solução de agrupamento k + 1. Para este método a atribuição resultante de objetos aos agrupamentos é mutuamente exclusiva, isto é, nenhum objeto é atribuído a mais de um agrupamento e coletivamente exaustiva isto é, todos os objetos são atribuídos a algum agrupamento (LATTIN, 2011).

Os métodos hierárquicos normalmente abordam a análise de dados por intermédio de um destes dois modos: de baixo para cima (aglomerativo, começa com cada observação em

um agrupamento separado e juntando-se os agrupamentos a cada etapa do processo até que reste somente um agrupamento de tamanho n) ou de cima para baixo (divisivo, começando com todas as observações em um único agrupamento e dividindo-se um agrupamento em dois a cada etapa do processo até que reste n agrupamentos de tamanho um) (LATTIN, 2011).

Basicamente, todos os problemas de agrupamentos de qualquer tamanho apreciável exigem uma solução heurística. Isso acontece porque, à medida que o numero de objetos no conjunto de dados aumenta, o número de soluções de agrupamento possíveis cresce espetacularmente. O numero de diferentes modos de dividir n objetos em m agrupamentos de tamanho n1, n2, n3,..., nm é dado por:

n!/[n1!n2!n3!...!nm!m!]

Vale salientar que o objetivo mais comum da análise de agrupamentos talvez seja tratar da heterogeneidade nos dados. O resultado ideal é um número menor de objetos relativamente homogêneos com uma variação dentro do grupo bem menor do que o total de variação no conjunto completo de dados. Objetivo, secundário é encontrar uma modalidade natural de dados (LATTIN, 2011).

Em uma análise de agrupamentos, busca-se as observações do conjunto de dados. Quando se usam métodos de agrupamentos hierárquicos aglomerativos, o agrupamento deve ser feito com base na proximidade mútua ou através do cálculo da similaridade. Essa medida de proximidade pode ser de duas fontes: usando uma avaliação direta da proximidade ou através do cálculo de uma medida derivada das classificações dos atributos para cada observação (LATTIN, 2011).

O método mais empregado é o cálculo da distância euclidiana, onde as variáveis em estudo possuem propriedades métricas. Um modo óbvio de se refletir a proximidade de dois objetos é com uma medida de distância, que no caso da distância euclidiana é definida pela seguinte equação:

dij = [ ]1/2

onde dij é a distância euclidiana entre os objetos i e j. Como as variáveis X são frequentemente medidas em unidades diferentes, a fórmula da distância na equação acima é aplicada mais comumente para dados padronizados. Com isso, atribui-se peso igual a cada variável padronizada, de maneira que elas sejam igualmente importantes na determinação relativa dos objetos (LATTIN, 2011).

Uma exceção a essa regra se dá quando são usados componentes principais como contribuição para a análise de agrupamentos. Nesse caso, devemos conceder ao primeiro componente principal, que explica a maior parte das informações nos dados, um peso maior

na determinação da proximidade relativa de quaisquer dois objetos no conjunto de dados (LATTIN, 2011).

A análise de agrupamento hieráquico pode ser utilizada na interpretação de dados de diferentes estudos, em várias áreas do conhecimento.

Por exemplo, na área ambiental, a AAH foi utilizada em um estudo de identificação da emissão de gases do efeito estufa em diferentes sistemas de agricultura, como representado na Figura 18 (ZAFIRIOU et al., 2012).

Figura 18 – Utilização da AAH para auxiliar na idenficação de gases nocivos

Fonte: Adaptado de ZAFIRIOU et al., 2012 C: Convencional; I: Integrado; O: Orgânico

Na área da saúde, a AAH, foi utilizada em um estudo de avaliação da lipolificidade de compostos farcologicamente ativos, como representado na Figura 19 (p. 79) (ANDRÍCA e HÉBERGER, 2015).

Figura 19 – Utilização da AAH na avaliação da lipolificidade de compostos farcologicamente ativos

Fonte: ANDRÍCA e HÉBERGER, 2015

Em um estudo na área de alimentação, a AAH foi utilizada para avaliar a influência de variações nos parâmetros sensoriais dos cultivares de macieiras em resposta a tratamentos físico-químicos, como representado na Figura 20 (KEENAN et al., 2012).

Figura 20 – Utilização da AAH para avaliar a influência dos nos parâmetros sensoriais dos cultivares de marcieiras

Fonte: KEENAN et al., 2012

Em estudo de metabolômica, a ACP pode ser utilizada, como ferramenta complementar da AAH no rastreio de composição química e enzimática de vários genótipos de espécies, como representado na Figura 21 (p. 80) (UARROTA et al., 2014).

Figura 21 – Utilização da AAH para auxiliar no da composição química de espécies

Fonte: Adaptada de UARROTA et al., 2014.

Neste trabalho é descrito o estudo da produção de COVs, sob as mesmas condições de cultivo, por dez espécies de fungos endofíticos da família Botryosphaeriaceae associados a plantas do bioma Caatinga no estado do Ceará. Na extração dos COVs utilizou- se a microextração em fase sólida com a técnica de “hadspace” (HS-MEFS) e na análise e identificação dos constituintes utilizou-se a cromatotografia gasosa acoplada a espectrometria de massas (CG-EM). Além disso, as análises de dados multivariados de análise de componente principal (ACP) e análise de agrupamento hierárquica (AAH) foram utilizadas para estabelecer padrões de diferenciação entre as espécies e identificar possíveis biomarcadores que possam auxiliar na quimiotaxonomia de espécies fúngicas da família Botryosphaeriaceae. Descreve-se, também um estudo de avaliação do perfil de metabólitos voláteis produzidos pelo fungo Albonectria rigidiuscula, em quatro meios de cultivo diferentes em três períodos de incubação.

3.3 Metodologia de estudo dos COVs de fungos endofíticos associados a plantas da