4. EMPIRI OG ANALYSE
4.4 Kunnskapsanvendelse
4.4.1 Er mer bevisst i arbeidet
O estudo de proteínas de membrana de Leptospira spp. é importante porque estas estão em contato com o hospedeiro e contribuem para a sobrevivência no meio ambiente. Inclusive, algumas proteínas de membrana externa são reguladas de forma diferenciada nas condições in vivo e in vitro (LO et al., 2006; MATSUNAGA et al., 2007).
Neste trabalho foram selecionados 3 genes de L. interrogans sorovar Copenhageni. Segundo o software LipoP, todas os genes selecionados codificam para proteínas que possivelmente serão destinadas à membrana de Leptospira. A proteína OmpL1, codificada pelo gene LIC10973, possui sinal SpI, portanto não é uma lipoproteína, embora seja encaminhada para a membrana externa (HAAKE et al., 1993). Já as proteínas relativas aos genes LIC10731 e LIC10645 possuem sinal SpII, tratando-se portanto de possíveis lipoproteínas, pois essa região é reconhecida pela enzima peptidase sinal II, a qual é responsável pela clivagem do peptídeo sinal e por lipidação de resíduos de cisteína.
Adicionalmente, o software PSORT e CELLO foram utilizados para definir a localização celular possível das proteínas, utilizando-se de algoritmo funcional para bactérias gram-negativas. De acordo com os resultados, as proteínas OmpL1 e a proteína codificada pelo gene LIC10645 possuem alta probabilidade de estarem alocadas na membrana externa da bactéria, ao passo que a proteína codificada pelo gene LIC10731 apresentou resultados distintos pelos dois softwares, uma vez que foi dada como proteína de membrana citoplasmática ou de espaço periplasmático pelo PSORT e como de membrana externa pelo CELLO.
A proteína codificada pelo gene LIC10731 é uma provável lipoproteína, e como se sabe, a grande maioria das lipoproteínas em Leptospira spp., assim como em Borrelia spp., se localiza na membrana externa (HAAKE et al., 2000). Esta proteína também possui um resíduo de aminoácido neutro após a cisteína N-terminal, outro forte indício de localização na membrana externa da bactéria (MATSUNAGA et al., 2006).
Atualmente, três espécies de Leptospira spp. possuem genoma completo sequenciado: L. interrogans sorovar Lai (REN et al., 2003) e sorovar Copenhageni (NASCIMENTO et al., 2004a), L. borgpetersenii sorovar Hardjo-bovis (BULACH et al., 2006) e L. biflexa sorovar Patoc (PICARDEAU et al., 2008).
Por meio da análise comparativa das sequências de aminoácidos (blastp) preditas verificou-se que as três proteínas possuem similaridade com uma proteína predita em L. interrogans sorovar Lai, em L. borgpetersenii sorovar Hardjo-bovis, e apenas OmpL1 possui similaridade com uma proteína predita na espécie saprofítica L. biflexa, embora baixa.
A proteína OmpL1 possui um domínio estrutural do tipo Porin_OmpL1, que denota um domínio do tipo porina, presente entre os aminoácidos 45 e 311, de acordo com o programa PFAM. A proteína codificada pelo gene LIC10731, segundo definido pelo PFAM e SMART, possui um domínio da família Beta-lactamase entre os aminoácidos 86 e 366. Segundo o resultado, esse domínio catalisa a abertura e quebra do anel beta-lactâmico contido em antibióticos beta-lactâmicos, como penicilina, por exemplo; essas beta-lactamases normalmente são secretadas. A proteína codificada pelo gene LIC10645 possui apenas algumas regiões de baixa complexidade e não possui nenhum domínio conservado.
O modelo topológico predito da proteína OmpL1 é composto por 10 domínios anfipáticos de folha- (HAAKE et al., 1993; SHANG et al., 1995). Pela análise utilizando o software TMBETA, a proteína codificada pelo gene LIC10731 possui 15 domínios transmembrana do tipo folha- e a proteína codificada pelo gene LIC10645 possui 14.
Quanto à predição de domínios transmembrana do tipo alfa-hélice, feita pelo software TMHMM, a proteína codificada pelo gene LIC10731 possui apenas um domínio deste tipo, porém localizado no peptídeo sinal; o mesmo foi observado para a proteína codificada pelo gene LIC10645.
O Quadro 3 mostra resumidamente a análise por bioinformática das proteínas codificadas pelos genes selecionados para o estudo.
A proteína OmpL1, pela análise da sequência de aminoácidos, se mostrou bastante conservada entre diferentes espécies e sorovares de Leptospira, que, embora não tenham sido inteiramente sequenciados, possuem algumas sequências depositadas no banco de dados do NCBI (National Center for Biotechnology Information). A similaridade da sequência de aminoácidos desta proteína em L. interrogans sorovar Copenhageni é bastante alta em relação a diversas espécies patogênicas de leptospira, como L. kirschneri, L. noguchii, L. weilii e L. santarosai.
Em relação à proteína codificada pelo gene LIC10731, sua sequência de aminoácidos apresenta similaridade com sequência de L. weilii, L. noguchii e L. santarosai acima de 80%. Similaridade no domínio de beta-lactamase também foi observada em relação a proteínas de outros gêneros de bactérias, como Paenibacillus, Collimonas e Burkholderia. Quanto à
proteína codificada pelo gene LIC10645, similaridade de 81% foi observada em L. noguchii, e em menor porcentagem em L. santarosai e L. weilii (44% e 50%, respectivamente).
Quadro 3 - Resumo das análises por bioinformática
Gene ID Descrição Sítio de
Clivagem conservado Domínio Similaridade com outras espécies já sequenciadas LIC10973 (OmpL1) Proteína de membrana predita 24-25 Porin_OmpL1 Lai 94% Hardjo-bovis 87% L. biflexa: 44%
LIC10731 Lipoproteína predita 35-36 Beta-lactamase Lai 100%
Hardjo-bovis 85%
L. biflexa: ausente
LIC10645 Lipoproteína predita 25-26 - Lai 99%
Hardjo-bovis 52%
L. biflexa: ausente Notas: Gene ID: identificação do gene no genoma L. interrogans sorovar Copenhageni; Abreviaturas: Lai: L. interrogans sorovar Lai; Hardjo-bovis: L. borgpetersenii sorovar Hardjo-bovis; L.biflexa: L. biflexa sorovar Patoc.
Foi gerado um filograma utilizando as sequencias de aminoácidos disponíveis no GeneBank, e o resultado pode ser visualizado na Figura 4. Pela análise do filograma, a proteína codificada pelo gene OmpL1 se mostrou presente em várias cepas, tanto patogênicas quanto saprofíticas e intermediárias. Existe uma clara similaridade/proximidade entre as sequencias presentes nas cepas patogênicas e baixa similaridade com sequencias contidas nas cepas saprofítica e intermediária, as quais estão organizadas em um ramo mais distante.
A proteína codificada pelo gene LIC10731 mostrou maior similaridade entre as cepas patogênicas, sendo a cepa intermediária disposta em um ramo mais distante. A proteína codificada pelo gene LIC10645 mostrou uma distribuição dispersa no filograma, entre as cepas patogênicas, sugerindo uma conservação moderada. Adicionalmente, uma cepa saprofítica (L. kmetyi) foi agrupada com uma cepa patogênica (L. interrogans).
Cabe ressaltar que, embora o filograma tenha sido gerado com base na sequencia de aminoácidos codificados pelos genes, isso não implica em a proteína ser expressa nas diferentes cepas. Estas sequências de aminoácidos são geradas por tradução conceitual de sequencias de nucleotídeos depositadas no NCBI.
Figura 4 - Filograma gerado a partir das sequências de aminoácidos disponíveis no GeneBank.
Um filograma foi gerado utilizando as sequências de aminoácidos disponíveis no GeneBank, as quais são geradas por tradução conceitual de sequencias de nucleotídeos. (A) refere-se ao gene OmpL1, (B) ao gene LIC10731 e (C) ao gene LIC10645.