Section II: Organisational structure
Chapter 7: Centralisation
Os avanços nas metodologias de monitorização das alterações nas comunidades microbianas possibilitaram o processamento de muitas amostras em simultâneo. As séries de dados resultantes são extensas e demasiado complexas para se poderem analisar subjectivamente, sendo então necessáro recorrer a métodos estatísticos.
A capacidade dos investigadores para quantificar a diversidade e testar muitas hipóteses em relação aos perfis e processos, nas comunidades microbianas, articula-se com a sua capacidade para caracterizar a diversidade e distribuição dos microrganismos numa grande variedade de habitats. Os índices de diversidade,
originalmente adoptados para macrorganismos, são frequentemente usados na análise de dados dos perfis das comunidades microbianas (Talbot et al., 2008). Uma avaliação correcta da composição destas comunidades permite efectuar a caracterização espacial e temporal dos modelos da diversidade, bem como das respostas a alterações nas condições ambientais, a perturbações e a tratamentos. Talvez o mais incómodo seja a tendência para simplesmente se ignorar o que é raro, e tirar conclusões relativamente à diversidade da comunidade bacteriana baseadas somente no número e na abundância em organismos numericamente frequentes. Esta abordagem pode conduzir a uma incorrecta interpretação dos dados e a conclusões erróneas.
Os polimorfismos da sequência de DNA, geralmente no gene de SSU rRNA, são usados para classificar a diversidade em termos de filótipos ou OTUs, sendo os organismos classificados em categorias distintas e possibilitando a quantificação da diversidade procariótica através do uso de índices de similaridade. Os índices de diversidade mais usados para definir a diversidade de uma comunidade microbiana, calculados a partir de dados de “fingerprint”, são a riqueza de espécies (S), a equitabilidade (E = H’/Hmax em que Hmax = log2S), o índice Simpson (Simpson, 1949) e o
índice Shannon (H’, Shannon, 1948), assumindo que uma OTU corresponde a uma espécie (Talbot et al., 2008). A riqueza de espécies é representada pelo número de filótipos presente, i.e. o número total de bandas (Mills et al., 2003). A equitabilidade é uma medida de equidade da abundância, ou seja, uma amostra ambiental com uma abundância melhor distribuída é mais diversa do que uma amostra com espécies predominantes e dispersas (Talbot et al., 2008). O índice Simpson reflecte a probabilidade de dois organismos da amostra serem o mesmo filótipo (Bent et al., 2008). O índice Shannon (H’) calcula-se a partir das abundâncias relativas de cada banda (ou pico) e também é influenciado pelo número de OTUs diferentes. É uma medida da dificuldade para prever a identidade do próximo indíviduo que será observado na amostra, e será maior nas comunidades que têm um número elevado de filótipos e com uma abundância relativa das espécies distribuída uniformemente. No entanto, é mais sensível a espécies raras pois é-lhes atribuído um peso maior, podendo ser usado como um indicador do aparecimento, ou desaparecimento, de uma espécie importante mas menos abundante (Talbot et al., 2008).
A Tabela 1.4. apresenta os índices de diversidade, em análise univariada, que podem ser também uma forma elegante de caracterizar uma comunidade complexa.
Tabela 1.4 – Índices usados para quantificar a diversidade de
comunidades bacterianas simuladas e os seus perfis da comunidade associados (adaptado de Blackwood et al. (2007).
Índice Formula
Riqueza de espécies (S) S
Índice de Shannon (H’) H´=Σpiln(pi) S i=1
Índice de equitabilidade de Shannon (J’) J’= H’/ln(S)
Índice de Simpson (D) D =ΣpiS 2
i=1
Apesar do seu uso corrente em Ecologia Microbiana, a aplicação dos índices de diversidade a dados obtidos de metodologias in situ, deve ter em conta que estas metodologias caracterizam normalmente os organismos “dominantes” (e.g.,> 1% da comunidade) devido aos limites de detecção. Assim, espécies raras podem nunca ser detectadas, mas muitas vezes fazem parte da vasta maioria da diversidade nas comunidades microbianas. Blackwood et al. (2007) avaliaram a utilidade dos vários índices de diversidade, incluindo a riqueza de espécies, equitabilidade, e índices de diversidade integrada.
A dinâmica da comunidade microbiana é um parâmetro que pode ser estimado com base nos padrões de alguma técnicas de “fingerprinting” como DGGE/TGGE. Este conceito pode ser interpretado como o número de espécies que aparecem, em média, com dominância significativa (acima do limite de detecção da técnica) num dado habitat e durante um intervalo de tempo definido. Numa comunidade microbiana, quanto mais espécies entram num estado de actividade funcional, por unidade de tempo e em proporção ao número já detectado, maiores são as possibilidades para a comunidade se alterar, e assim mais dinâmica esta pode ser (Marzorati et al., 2008). Na literatura, a dinâmica das comunidades bacterianas tem sido descrita mesmo para períodos de desempenho estável dos processos microbianos, o que pode ser demonstrado através da aplicação de uma variedade de ferramentas para comparação [e.g. análise de “clusters” (Seghers et al., 2003) e o Índice de Dice (La Para et al., 2002)].
Fernandez et al. (2000) sugeriram que a manutenção de uma dada
funcionalidade está assegurada devido a adaptabilidade de membros minoritários da comunidade, que podem tornar-se dominantes num curto período de tempo após uma perturbação significativa, assegurando uma recuperação rápida após uma condição de stress. O termo ‘organização funcional’ é assim definido como a capacidade da comunidade para se organizar numa distribuição adequada entre os microrganismos
dominantes e os que têm capacidade para rápida recuperação, condição que deve assegurar o potencial para neutralizar o efeito da repentina exposição ao stress (Marzorati et al., 2008). É possível aplicar-se as curvas de equitabilidade Pareto–Lorenz (PL) (Lorenz, 1905): uma curva PL de 25%, em termos ecológicos, representa uma comunidade com equitabilidade elevada. Esta comunidade pode resultar da ausência de uma pressão selectiva e não apresenta uma estrutura interna bem definida em termos de dominância de espécies; uma curva PL de 80% representa uma comunidade especializada, na qual apenas uma pequena fracção das espécies é dominante e todas as outras estão presentes em número reduzido. Esta comunidade está funcionalmente bem organizada, mas é frágil em relação às alterações externas e pode necessitar de longos tempos de recuperação (Marzorati et al., 2008).
Embora os organismos numericamente dominantes pareçam ser responsáveis pela maior parte das actividades metabólicas e fluxo de energia num sistema, sabe-se que os organismos menos frequentes servem de reservatório da diversidade genética e funcional, desempenham um papel chave nos ecossistemas e podem tornar-se numericamente importantes se ocorrerem alterações nas condições ambientais (Bent et
al., 2008). Em termos de ecologia da comunidade, aborda-se a questão fundamental:
"who lives with whom and why?” (Talbot et al., 2008). McCune & Grace (2002) descrevem as principais ferramentas estatísticas que podem ser usadas para relacionar a abundância das espécies numa comunidade com as condições ambientais.
A análise multivariada refere-se a todas as técnicas estatísticas que avaliam simultaneamente múltiplas aferições para cada indivíduo de uma determinada amostra. É essencial reiterar que os processos estatísticos multivariados podem sugerir causas ou factores, mas deve ter-se em conta que as variáveis sintéticas, eixos, ou os “clusters” originados, não correspondem necessariamente a entidades biológicas, ou ecológicas, na natureza. Não se deve exagerar na interpretação dos dados confiando em causalidade injustificada, especialmente na ausência de experimentação real. Um criterioso cuidado é necessário durante a recolha original de dados, para que a análise corresponda à situação em estudo, o que nem sempre acontece. Outro conceito errado comum é o de que a análise multivariada, por si só, pode fazer a triagem de todas as soluções nos estudos multivariados complexos. Embora permita revelar modelos interessantes em séries de dados, a interpretação e explicação das observações apoia- se, em última análise, nas hipóteses dos investigadores e no prévio conhecimento da situação ecológica (Ramette, 2007).
A maior parte dos obstáculos encontrados na Ecologia Microbiana quando se tenta resumir e explorar uma grande quantidade de dados, relacionam-se com a escolha das ferramentas numéricas adequadas para efectuar uma avaliação estatística e visualizar os dados. As séries de dados complexas são mais exploradas através da análise de “clusters” ou de componentes principais (PCA, Principal Component Analysis), mas as técnicas baseadas em hipóteses tais como as análises de redundância, análise de correlação canónica (CCA, “canonical correspondence analysis”) ou testes Mantel são também muito utilizadas (Ramette, 2007; Talbot et al., 2008).
Análise de “clusters” e coeficientes de associação – A análise de “clusters” tem, por
objectivo primordial, agrupar indivíduos de uma amostra (ambiental) de acordo com as suas características, de modo a formar conjuntos que se excluem mutuamente e que apresentem similaridades entre os seus elementos, podendo ser visualizados através de um dendrograma (Talbot et al., 2008). A disponibilização de uma matriz ou tabela suplementar de variáveis ambientais permite examinar se os modelos examinados estão relacionados com os gradientes ambientais. A análise tem a vantagem de fornecer medidas com suporte estatístico para cada “cluster” deduzido, sendo mais fácil interpretar os dados se forem divididos em grupos (“clusters”) que combinam dados similares. Esta análise tornou-se muito popular em Ecologia Microbiana porque as matrizes de distância, que são baseadas em diferenças nas sequências de DNA, ou de aminoácidos, são frequentemente usadas para descrever a diversidade microbiana. A análise de “clusters” responde tipicamente a questões relacionadas com a possibilidade dos modelos de “clustering” das sequências moleculares reflectirem a origem da amostra, ou o tempo da amostragem, de forma a revelarem perfis biogeográficos, ou ao longo do tempo, respectivamente. As regras comuns para associação são, por exemplo, a vizinhança mais próxima (em que a distância entre dois “clusters” é a distância entre os seus pontos vizinhos mais próximos), a vizinhança mais afastada (em que a distância entre dois “clusters” é a distância entre os seus dois objectos mais afastados) e o mais frequentemente usado método da distância média dos grupos-pares sem ponderação, UPGMA (“unweighted pair-group method using averages”, em que a distância entre dois “clusters” é a distância média entre todos os pares “inter-cluster” (Ramette, 2007). O dendrograma é construído a partir de uma matriz de distâncias dos “fingerprints” n x n, obtida de uma matriz de dados (n "fingerprints” x p picos) em que se especificam as abundâncias relativas (matriz quantitativa) ou a presença/ausência dos picos (1 ou 0, respectivamente; matriz binária) (Talbot et al., 2008). Uma extensão da
simples análise de “clusters” foi descrita por Abdo et al. (2006), utilizando o resultado da análise “cluster” para determinar quantas e quais amostras, em cada “cluster”, devem ser usadas para a construção de bibliotecas de clones, providenciando um procedimento objectivo e útil para minimizar o número de amostras que devem ser analizadas em detalhe pela sequenciação de genes clonados.
PCA – A PCA tem sido aplicada em numerosas séries de dados (por exemplo, em modelos de “fingerprinting”) e é uma das análises exploratórias mais popular. Deve ser geralmente usada quando as amostras cobrem gradientes muito curtos, isto é, quando as mesmas espécies são maioritariamente identificadas em toda a área em estudo (quando as amostras diferem principalmente em abundância de espécies), e quando as espécies respondem linearmente a gradientes ambientais (Ramette, 2007). É um método útil de visualizar as relações, de semelhança ou desigualdade, entre as comunidades microbianas. Os dados são traçados num gráfico a duas três dimensões (Schütte et al., 2008).
CCA – A CCA pode ser considerada como sendo uma forma constrita de análise de
componentes (CA), na qual os eixos são combinações lineares de variáveis ambientais (Cao et al., 2006). Através da aplicação da CCA é possível identificar quais os factores ambientais que influenciam a diversidade dos consórcios microbianos de entre uma vasta série de parâmetros ambientais, medidos para as mesmas amostras, quando se usam técnicas de “fingerprinting” genético, independentes de cultura. Permite relacionar as alterações observadas na estrutura de uma comunidade com as perturbações que ocorrem nas condições ambientais (Schütte et al., 2008). Também é possível determinar as espécies específicas, ou OTUs, que respondem a uma variável ambiental em particular, e como tal, serem identificadas como potenciais espécies indicadoras. A CCA é uma análise sensível para amostras que contêm espécies pouco abundantes (Ramette, 2007). A análise de componentes, em Microbiologia Molecular, pode ser efectuada com o CANOCO (pela Microcomputer Power, http://www.microcomputerpower.com) que é um programa de fácil utilização para Microsoft Windows (e.g. CANOCO: Krüger et al., 2005; Mills et al., 2006).