Podemos considerar a bioinformática como uma linha de pesquisa que envolve aspectos multidisciplinares (ciência da computação, matemática/estatística, biologia, bioquímica, física, medicina, entre outros) e que surgiu a partir do momento em que se iniciou a utilização de metodologias computacionais para a análise de dados biológicos, químicos, médicos, entre outros (Bayat, 2002). Dentro desse contexto, e da impossibilidade da análise manual desses
59
dados, se torna necessário o emprego de computadores e abordagens computacionais como ferramentas para análise, captura e interpretação de dados biológicos.
A bioinformática utiliza sistemas de informações para entender processos biológicos; portanto, possui um papel essencial, seja decifrando dados gerados por tecnologias de high- throughput relacionadas aos projetos genoma, proteoma e transcriptoma, seja organizando,
coordenando e viabilizando o acesso racional aos dados gerados a partir da biologia tradicional. Mais do que metodologias e protocolos de análises de sequências de nucleotídeos e proteínas, a bioinformática tem fornecido a base conceitual e os métodos práticos, para a detecção de comportamentos sistemáticos funcionais de células e organismos e para a elucidação de processos somente detectáveis quando se estuda o organismo como um todo.
O aumento no número de estruturas tridimensionais (3D) disponíveis em bancos de dados como o PDB (Protein Data Bank) (Berman et al., 2000), levou ao crescimento da
bioinformática estrutural. Assim, a predição de estruturas 3D de proteínas permanece uma área de grande interesse, sendo que a principal categoria de predições de estruturas de proteínas tem sido a modelagem molecular por homologia, baseada nos conhecimentos da estereoquímica dos aminoácidos e na alta homologia de uma sequência por uma estrutura conhecida (Sanchez et al., 1997; De Lima, 2006). E a metodologia de Dinâmica Molecular, atualmente aumenta a possibilidade no avanço da compreensão de processos biológicos em escala atômica e molecular, sendo assim, tornou-se uma ferramenta essencial para a investigação de moléculas (Namba et al., 2008). Através da técnica de simulação do movimento de partículas em um sistema, obtêm-se as flutuações das posições relativas dos átomos de uma determinada molécula em solução, em função do tempo. Utilizando esse conhecimento é possível obter várias informações sobre a molécula como, por exemplo, as possíveis mudanças na estrutura 3D da molécula que esteja associada a sua atividade biológica, estudar interações da molécula com possíveis ligantes ou a importância dessas interações para a estabilidade e/ou atividade biológica (Karplus & Petsko, 1990). Com este método podemos estudar tanto estruturas obtidas experimentalmente como aquelas obtidas por modelagem molecular.
Entre as ferramentas mais utilizadas na bioinformática estrutural encontram-se aquelas relacionadas à comparação de sequência de aminoácidos através do alinhamento de sequências. O alinhamento de pares é uma comparação aproximada entre duas sequências, a
qual tem como objetivo evidenciar padrões comuns, identidade e similaridade, que podem ocorrer globalmente ou localmente entre duas sequências comparadas e o alinhamento múltiplo é uma comparação aproximada com mais de duas sequências que reflete a existência de regiões comuns compartilhadas entre as sequências (Gibas & Jambeck, 2001).
60
A comparação de pares de sequências é fundamental para a realização da modelagem molecular por homologia. Se o grau de identidade entre as sequências primárias das proteínas, que podem ser utilizadas como moldes, e da proteína alvo for igual ou superior a cerca de 30%, existe uma grande probabilidade de que estas proteínas apresentem estruturas 3D semelhantes e pode-se construir um modelo 3D para a proteína alvo utilizando metodologias de modelagem molecular por homologia (Sander & Schneider, 1991). Existem vários programas que são utilizados no processo de alinhamento como o BLAST (Altschul et al., 1997), o FASTA (Lipman & Pearson, 1985), o CLUSTAL (Thompson et al., 1994), entre outros.
Nos casos em que a identidade entre as sequências é inferior a cerca de 30%, a melhor maneira de solucionar o problema é utilizar métodos de compatibilidade sequência-estrutura (threading ou 3D template matching methods) (Jones et al., 1992). Estes métodos baseiam-se
na avaliação da compatibilidade entre a predição da possível estrutura 3D da proteína alvo e de potenciais proteínas molde determinados experimentalmente. Ou seja, é escolhida a proteína molde, cuja estrutura 3D, apresenta uma maior compatibilidade em relação à sequência da proteína alvo. A avaliação sequência/estrutura é realizada por meio de um potencial empírico derivado de uma tabela de contatos de resíduos observados em proteínas de estrutura 3D determinadas experimentalmente. Esse método de seleção de proteínas molde é menos preciso que o método de alinhamento de pares, porém, trata-se de uma ferramenta muito útil quando não são encontradas proteínas moldes com identidade superior a 30% (Rost & Sander, 1996).
61
3. Objetivos
No presente estudo adotamos a abordagem bottom-up com a utilização e combinação
de tecnologias como a 2-DE, cromatografia líquida e espectrometria de massas (NanoLC-ESI- CID/ETD-MSn) para não só identificar o perfil proteico das glândulas que secretam a seda da
aranha N. clavipes, como também as proteínas constituintes dessa seda com a obtenção de
uma elevada cobertura da sequência e detecção de suas PTMs. Sendo assim, os objetivos do presente estudo foram:
- Identificar as proteínas presentes no conjunto de glândulas distintas especializadas na secreção de diferentes tipos de seda que constituem a teia, o frame, a linha de segurança “escape” e o casulo para a proteção dos ovos;
- Isolar e identificar as proteínas constituintes das fibras da seda que formam os fios da teia orbital e do frame utilizando uma abordagem proteômica;
- Realizar a digestão in gel dos spots proteicos individualmente com diferentes enzimas
proteolíticas para obter uma maior cobertura da sequência das proteínas;
- Analisar os fragmentos peptídicos por espectrometria de massas (MS e MSn) para a identificação das proteínas;
- Analisar e caracterizar as modificações pós-traducionais (PTMs) das proteínas identificadas;
- Verificar a presença de modificações pós-traducionais como fosforilação, glicosilação e nitrotirosina através de tratamentos específicos com fosfatase alcalina, PNGase e ensaios de imunodetecção;
- Realizar a modelagem molecular por homologia e caracterizar as modificações pós- traducionais na estrutura tridimensional da proteína;
62
- Propor um mecanismo geral de atuação das proteínas identificadas nas glândulas produtoras de seda, as quais podem estar envolvidas com a produção, secreção, armazenamento, transporte, proteção e mudanças conformacionais das espidroínas constituintes da seda durante todo o processo de fiação;
- Estabelecer um esquema representativo para o mecanismo natural de fiação das fibras da seda da teia da aranha N. clavipes.
63
4. Justificativa
A seda da teia de aranha tem sido extensivamente estudada através de dados oriundos da engenharia genética e da tecnologia do DNA recombinante (Lazaris et al., 2002; Lewis, 2006; Rising et al., 2007; Lefèvre et al., 2011; Rising et al., 2011). As surpreendentes propriedades mecânicas da seda têm motivado muitas pesquisas para o estabelecimento de técnicas de produção biotecnológica, as quais são necessárias para a obtenção de quantidades suficientes de proteínas da seda para as aplicações industriais (Vendrely et al., 2007). Porém, a análise proteômica prospectiva apresenta vantagens com relação às análises genéticas, já que normalmente, genes mutados podem não ser transcritos por inúmeras razões epigenéticas. Estudos proteômicos com análises de PTMs são necessários e importantes para que possamos compreender a relação estrutura-função e a interação entre as proteínas constituintes da seda após serem secretadas pelas glândulas. Tem-se tornado muito grande o interesse pelos fios da seda da teia de aranhas, e estudos tem demonstrado a eficácia do uso dessa seda principalmente com um grande potencial em aplicações biomédicas.
No presente estudo foi possível obtermos informações químicas e estruturais das características das proteínas da seda da teia da aranha Nephila clavipes, possibilitando o seu
desenvolvimento em aplicações biotecnológicas. Dessa forma, esse estudo procurou alcançar alguns dos objetivos principais do projeto BIOprospecTA da FAPESP que surgiu como um projeto piloto para a bioprospecção da biodiversidade do Estado de São Paulo. O grupo de pesquisas em Biologia Estrutural e Zooquímica do CEIS/IBRC-UNESP possui experiência na área de caracterização de compostos orgânicos, proteínas e peptídeos em secreções de artrópodes e tem realizado a prospecção química de maneira sistemática, em insetos e aranhas da fauna do Estado de São Paulo, junto ao programa BIOprospecTA/FAPESP (Proc. 2011/51684-1).
64