Os resultados obtidos nesse trabalho exigiram ferramentas computacionais para as análises dos dados, que foram possibilitados graças ao avanço da bioinformática como uma Ciência que possui raízes na computação, estatística e biologia, gerando novos conhecimentos a partir de um eficiente acesso aos dados já publicados além do manuseio de grande volume de dados.
As sequências de banana obtidas tanto de pares de primers dirigidos à família de proteínas de resistência NBS-LRR, quanto à família RLK, foram alinhadas juntamente com sequências obtidas no genbank. O genbank é o mais conhecido banco de dados que disponibiliza gratuitamente sequências e também instrumentos para sua análise. Os alinhamentos representam uma poderosa ferramenta não só para comparar sequências desconhecidas com sequências de genes já descritos e depositados no banco, como também para fazer inferências tanto estruturais e funcionais quanto evolutivas à respeito dessas sequências.
A maioria dos R genes já identificados codificam proteínas pertencentes à família que possui um sítio de ligação de nucleotídeo, com uma série de repetições ricas em leucinas - NBS-LRR. O domínio NBS de R proteínas contém alguns motivos que são altamente conservados e podem ser utilizados para desenhos de primers para a amplificação de RGAs. O alinhamento das sequências geradas nesse trabalho confirmou a conservação dos motivos de NBS (Figura 15). Apesar da grande conservação do domínio NBS, o alinhamento múltiplo mostrou grande diversidade de sequências. Tal fato pode ser explicado com base nas regiões das sequências que estão situadas entre os motivos que não considerados críticos para funções bioquímicas, sendo com isso, alvo de grandes mutações (MEYERS et.al, 1999).
Baseados na estrutura N-terminal do domínio, as proteínas NBS-LRR podem ser divididas em 2 classes: TIR NBS-LRR e não TIR NBS-LRR (DANGL & JONES, 2001; HULBERT et.al, 2001). O último resíduo do motivo Quinase 2 é especialmente utilizado para a classificação das sequências como TIR e não TIR (MEYERS et.al, 1999). A classe TIR é encontrada em briófitas (AKITA &VALKONEN, 2002) e ambos, TIR e não TIR são encontradas em gimnospermas (LIU & EKRAMODDOULLAH, 2003). Acredita-se que o grupo TIR NBS-LRR talvez tenha sido perdido pelas monocotiledôneas (MAYERS, 1999; BAI et. al, 2002; PAN et.al, 2000). No entanto,
71 quatro RGAs foram caracterizados em trigo possuindo o motivo Quinase 2 consistentes com sequências TIR NBS-LRR (JIANG et.al, 2005).
A raridade da classe TIR em monocotiledôneas não reflete necessariamente na abundância do domínio TIR em si. Duas famílias de proteínas semelhantes que podem agir como adaptadores (TIR-NBS e TIR-X) são encontrados em monocotiledôneas, porém em número reduzido em comparação com dicotiledôneas (MEYERS et.al, 2002).
Os RGAs amplificados por meio de primers degenerados desenhados a partir de motivos conservados do domínio NBS-LRR pertencem a classe não TIR como esperado. A responsabilidade da diferenciação das classes TIR e não TIR é atribuída ao aminoácido triptofano, que pode caracterizar, de forma bastante conservada a classe não TIR (Figura 15). Na classe TIR, o aminoácido ácido aspártico é quem aparece na posição, porém em condição menos conservada.
A análise filogenética corroborou com a hipótese da conservação dos motivos de NBS. No clado A (Figura ), M. acuminata e M. bankisii aparecem muito próximas e com índice máximo de suporte (100% bs), mostrando que o domínio surgiu anteriormente à diferenciação das espécies e se manteve conservado até mesmo depois dele. Juntamente com esses estão os contigs NBA_LRR_c4 e NBS_LRR_c36, ambos com índice de suporte elevado (79% bs e 55% bs respectivamente). Ainda no clado A está o contig NBS_LRR_ c42_1 proximamente à uma proteína de resistência de M.ornata, colocando as duas espécies diferentes em um mesmo clado de forma muito bem suportada ( 99% bs).
As sequências de RLK_STK foram originadas a partir de primers degenerados direcionados à quinases. Porém duas famílias de genes de resistência possuem uma quinase em suas composições. São elas: Família LRR extracelular com domínio transmembrana ligado a uma ser/thr kinase no citoplasma (RLK) e Ser/Thr quinases citoplasmática sem LRRs (STK). É possível que durante as reações de PCR tenha acontecido a amplificação das duas diferentes quinases e até mesmo outras quinases não relacionadas à resistência. Uma característica comum aos receptores quinases é que cada um possui uma sequência sinal no N-terminal, um domínio extracelular que varia na estrutura, uma membrana abrangendo a região e um domínio catalítico citoplasmático da proteína quinase. Todas as plantas que possuem esse receptor quinase fosforilam resíduos de serina e treonina (WALKER, 1994; TORII and CLARK, 2000).
72 Além dos receptores quinases, existem cerca de 10 a 12 grupos de diferentes quinases (HARDIE, 1999).
A árvore construída para RLK_STK não auxiliou na diferenciação de sequências da família RLK e da família STK. Todas as sequências de quinases apareceram agrupadas em um grande clado, confirmando a hipótese de conservação dos domínios quinases. Estudos posteriores poderão confirmar à que classe pertencem as quinases amplificadas nesse trabalho.
A comparação entre cultivares contrastantes à doenças não pode ser verificada, pois os RGAs são provenientes tanto de cultivares resistentes quanto de cultivares suscetíveis. Dos 7 RGAs contigs NBS-LRR caracterizados, todos os consensos são derivados de diferentes cultivares e apenas 1 RGA contig (NBS_LRR_c36) possui sequência exclusiva de apenas 1 cultivar suscetível Pisang Berlin. Da mesma forma acontece com RLK_STK no qual dos 47 RGA contigs, 29 são exclusivos de apenas 1 cultivar e 18 consensos derivados de diversos cultivares. Dos contigs exclusivos de apenas 1 cultivar, 6 deles são de cultivares resistentes e 11 de cultivares suscetíveis. Para um conhecimento mais completo da relação entre RGAs e suscetibilidade/ resistência, futuramente primers específicos serão desenhados para os RGAs e desenvolvido uma análise de expressão diferencial, via q RT PCR utilizando plantas suscetíveis (Cavendish) e plantas resistentes (Calcutta 4). Essa análise será utilizada como uma ferramenta a mais para o entendimento da relação entre os RGAs e cultivares resistentes e suscetíveis.
Os pares de primers utilizados nesse trabalho obtiveram níveis diferentes de eficiência. No total, três conjuntos de primers amplificaram RGAs, direcionados aos motivos P-loop, Quinase 2, GLPL, RNBS-D e LRR. A elevada eficiência atribuída a estes primers se deu provavelmente devido a estratégia de desenho para monocotiledôneas/dicotiledôneas levando em consideração o nível de degeneração, comprimento do primer, composição de nucleotídeos.
A combinação de primers P1B-RNBS-D foi responsável pela formação de 17 contigs acumulando 150 sequências de alta qualidade com similaridade a RGAs desta família. 57,7% das sequências amplificadas foram obtidas por meio da combinação de primers P1B-RNBS-D. Aproximadamente 18% e 23% das sequências foram amplificadas pelos primers 1F-P3B e 3F2/13R1 respectivamente.
73 As estatísticas efetuadas para a família RLK-STK não mudam muito. O desenho dos primers foi conduzido de forma que se conseguisse primers com níveis de degeneração mais altos, intermediários e de nível baixo de degeneração. Combinações de primers com baixa degeneração são normalmente sugeridas () por ser mais eficiente para o isolamento de sequências altamente divergentes Os pares de primers RLK_S1_K_F/RLK_S1_ID_R e RLK_S5_K_F/RLK_S5_K_R possuem menor nível de degeneração e amplificou 11,22% e 37,5% das sequências totais. A combinação de primers RLK_S4_K1_F/RLK_S4_ID_R possui o valor mais alto de degeneração e amplificou 30,61% das sequências. Este primer foi o único a amplificar um domínio LRR. O primer RLK_S3_K_F/RLK_S3_ID_R amplificou 20,66% das sequências totais.
74