O termo proteômica abrange estudos em larga escala das proteínas expressas por um organismo. Já a área da metaproteômica (ou proteômica ambiental) é definida como a “caracterização em larga-escala de todas as proteínas de uma microbiota ambiental em um determinado ponto no tempo”, visto que leva em consideração as interações bióticas (entre os micro-organismos) e abióticas (entre micro-organismos e seu ambiente natural), as quais governam a ecologia das comunidades microbianas in situ (MARON et al., 2007; WILMES e BOND, 2004). A complexidade dessas comunidades faz com que alguns autores as classifiquem como um ‘metaorganismo’, pois a diversidade do seu proteoma se compara à de um eucarioto pluricelular (LACERDA e REARDON, 2009). Além disso, devido à matriz da qual as amostras são retiradas, um dos grandes desafios da proteômica ambiental é o estabelecimento de protocolos efetivos de extração de proteínas que sejam compatíveis com as técnicas de identificação empregadas atualmente (SCHULZE et al., 2005). Apesar dessa dificuldade, nos últimos anos alguns trabalhos mostram o potencial da aplicação da proteômica para o entendimento da funcionalidade e da dinâmica microbiana em diferentes ambientes, como solo, sedimentos, ecossistemas aquáticos, trato intestinal humano e reatores de tratamento biológico de efluentes (SIGGINS et al., 2012). Para isso, dentro das limitações para cada ecossistema, o tratamento da amostra consiste das etapas de: coleta e separação da fração de interesse, extração de proteínas, separação e fracionamento, análise por espectrometria de massas e busca em bancos de dados ou síntese de novo de peptídeos (Figura 5; STEEN e MANN, 2004; SIGGINS et al., 2012).
O fluxograma e os protocolos escolhidos para cada fase são extremamente dependentes do tipo de ionização empregada na fase de análise por espectrometria de massas. Essa ionização pode ser conseguida pelas técnicas de MALDI (Matrix Assisted Laser
Desorption and Ionization) ou ESI (Electrospray Ionization), sendo que as fontes de ionização ESI são amplamente empregadas devido à possibilidade de seu uso on-line com a separação dos peptídeos por cromatografia, servindo de interface entre o cromatográfo e o espectrômetro de massas (STEEN e MANN, 2004; KELLER e HETTICH, 2009). Desse modo, as etapas do tratamento da amostra citadas abaixo são focadas nas análises proteômicas
21
realizadas por sistemas de cromatografia líquida acoplada à espectrometria de massas (LC- MS; Figura 5).
Figura 5: Fluxograma de análises metaproteômicas (A). Cromatograma de separação dos peptídeos, espectro de massas de uma fração dos peptídeos e MS/MS de um determinado íon (B).
Amostras de proteínas microbianas coletadas em ambientes naturais, especialmente em ecossistemas aquáticos, são encontradas em concentrações muito baixas, sendo necessário, portanto, etapas de concentração – usualmente por filtração ou liofilização – mais severas do que as empregadas para materiais obtidos de culturas em laboratório (SCHULZE et al., 2005; MORRIS et al., 2010; WANG et al., 2011). Nos casos em que se deseja estudar uma parte específica do proteoma (intra ou extracelular), simultaneamente à coleta é realizada a separação da fração de interesse. Geralmente, antes da lise das células, a biomassa passa por procedimentos de lavagem, para a remoção de polímeros e demais contaminantes da matriz extracelular (WILMES e BOND, 2004). Por outro lado, quando o objeto de estudo são as proteínas que compõem a matriz, diferentes métodos de extração são empregados, sendo que cada um deles solubiliza preferencialmente uma fração do proteoma dos EPS (PARK et al., 2008).
22
Após a obtenção das amostras, os métodos empregados para a extração proteica variam de acordo com a complexidade da amostra. Em ambientes de composição conhecida, a extração pode ser realizada por protocolos simples, que compreendem um menor número de etapas e que consistem basicamente, no caso do proteoma intracelular, da lise (por french
press ou ultrassonicação), seguida da concentração do material desejado (WILMES e BOND, 2004; ABRAM et al., 2009). Para proteínas componentes dos EPS ou encontradas ligadas à membrana de MBR, os polipeptídeos são separados de carboidratos e outros biopolímeros por meio de sua precipitação com sulfato de amônio e posterior diálise, para a remoção do sal (PARK et al., 2008; HUANG et al., 2012). Amostras mais complexas, tanto no que diz respeito à variedade da microbiota quanto à composição do ambiente de origem, exigem procedimentos com um maior número de passos para a obtenção de pools proteicos representativos e passíveis de análise. Esses procedimentos são comumente encontrados em estudos sobre o proteoma de solos ou biorreatores que tratam resíduos compostos (BENNDORF et al., 2007; HANREICH et al., 2012). Mesmo para reatores de bancada alimentados com água residuária sintética (de composição conhecida e com baixo número de contaminantes), a presença de bactérias Gram-positivas e Gram-negativas requer a combinação de métodos físicos e químicos distintos para alcançar a lise completa dos micro- organismos (LACERDA et al., 2007). Apesar das inúmeras fases de lavagem e precipitação das amostras proteicas de comunidades naturais, ao final do processo de preparação ainda existe a contaminação dessas por ácidos húmicos, como pode ser notado pela coloração escura do extrato e pelo background elevado em géis SDS-PAGE (BASTIDA et al., 2009; HANREICH et al., 2012). Além da co-purificação desse contaminante, sua presença em grandes concentrações parece ser um problema específico da proteômica ambiental, visto a ausência de protocolos específicos para a sua remoção (BODZON-KULAKOWSKA et al., 2007; CAÑAS et al., 2007).
A separação e o fracionamento dos extratos proteicos são procedimentos úteis para aumentar a resolução da identificação por espectrometria de massas e, para os protocolos que fazem uso de géis 2D, servem também para verificar o nível de expressão de proteínas específicas (KHALSA-MOYERS e MCDONALD, 2006). Essa etapa da análise mostra-se de especial importância para a metaproteômica, visto o grande número de proteínas presentes em amostras ambientais, e é realizada por métodos cromatográficos ou eletroforéticos (SCHNEIDER e RIEDEL, 2010). O uso de géis SDS-PAGE diminui a concentração de contaminantes que podem interferir nas etapas posteriores e, no caso dos géis 2-D, possibilita
23
a comparação dos perfis de expressão proteicos em diferentes situações. Apesar do alto poder de resolução dos géis 2-D PAGE, proteínas que possuem valores extremos de ponto isoelétrico (pI, muito básico ou muito ácido), alta hidrofobicidade (como proteínas de membrana), baixa solubilidade, baixa massa molecular ou aquelas menos abundantes são sub- representadas nos géis (WILKINS et al., 1998; GYGI et al., 2000; TOMANEK, 2011).
Como alternativa aos métodos eletroforéticos, é empregada a separação por colunas cromatográficas, as quais podem ser utilizadas tanto para a separação das misturas proteicas (previamente à proteólise enzimática) quanto para os peptídeos digeridos. O fracionamento da amostra é realizado por HPLC (High Performance Liquid Chromathography), é baseado na afinidade dos analitos pelas fases móvel e estacionária e depende, para cada tipo de coluna, de características como tamanho, carga, especificidade e hidrofobicidade. A resolução das amostras pode ser aumentada pela separação multi-dimensional das proteínas por meio da combinação de colunas de diferentes tipos, como troca catiônica/fase reversa, troca aniônica/fase reversa e interação hidrofílica/fase reversa (BODZON-KULAKOWSKA et al., 2007; SCHNEIDER e RIEDEL, 2010). As amostras fracionadas são então submetidas à análise em espectrômetro de massas para a identificação das proteínas. Para isso, as proteínas são digeridas enzimaticamente, os peptídeos gerados são separados e ionizados e é realizada a análise de suas relações massa/carga (m/z; KARPIEVITCH et al., 2010). O primeiro passo do processo, a digestão proteica, gera uma mistura de peptídeos de manuseio e identificação mais simples do que as proteínas de origem (RAPPSILBER e MANN, 2002). A digestão pode ser realizada in-gel (para bandas ou spots advindos de géis) ou para amostras em solução (in-
solution digestion; CAÑAS et al., 2007). Na maioria dos trabalhos, a protease tripsina é empregada para a conversão de proteínas em peptídeos. Devido sua alta estabilidade e especificidade, a clivagem ocorre sempre nos resíduos de lisina e arginina, gerando peptídeos dentro de uma faixa de massas adequada para seu sequenciamento (STEEN e MANN, 2004). Para análises pela metodologia LC-MS, os peptídeos trípticos são então introduzidos no cromatógrafo e separados em colunas C-18 (fase reversa) ou em combinações de colunas de troca catiônica e fase reversa (AEBERSOLD e MANN, 2003).
Essa separação diminui o número de peptídeos que alcança a fonte de ionização ao mesmo tempo, aumentando a sensibilidade da espectrometria. No caso da ionização por fontes ESI, diferentes cargas são atribuídas aos peptídeos através da aplicação de uma diferença de potencial elétrico entre a saída da coluna cromatográfica e a entrada do analisador de massas (MANN et al., 2001). Atualmente, existem cerca de 20 tipos diferentes
24
de analisadores os quais, por meio de princípios distintos, realizam a análise das relações m/z dos peptídeos. Por fim, o sequenciamento dos peptídeos é obtido por meio da fragmentação dos íons analisados (denominados precursores) e nova obtenção das relações massa/carga, metodologia denominada de espectrometria de massas em tandem ou MS/MS. Como cada resíduo de aminoácido possui uma massa única, com exceção da leucina e da isoleucina, é possível indicar qual a sequência dos peptídeos analisados (DOMON e AEBERSOLD, 2006; KARPIEVITCH et al., 2010).
Os espectros obtidos são confrontados com bancos de dados através de softwares de busca, como SEQUEST, X!TANDEM ou MASCOT. Tais programas identificam as proteínas correspondentes aos peptídeos sequenciados por meio da comparação dos dados experimentais com proteínas traduzidas in silico a partir de bancos de dados genômicos. Desse modo, o rendimento dos trabalhos de proteômica ambiental depende fortemente de estudos metagenômicos. Além da comparação dos espectros, a identificação dos peptídeos pode ser feita por meio do sequenciamento de novo, que consiste na análise das diferenças das massas entre o íons gerados à partir da fragmentação de um íon precursor. Ao final da identificação proteômica, os resultados obtidos são confrontados com demais dados sobre a microbiota estudada e fornecem informações relevantes quanto à comunidade presente bem como quanto à funcionalidade dessa (Figura 5; KARPIEVITCH et al., 2010; MARON et al., 2007).