• No results found

As 597.565 sequências mapeadas contra o banco de dados Known

Gene foram alinhadas contra a sequência do genoma humano, utilizando a

ferramenta BLAT, e as coordenadas de alinhamento dos limites éxon/íntron foram anotadas. Em seguida, a identificação de putativas novas variantes de

splicing foi feita pela comparação das coordenadas das sequências das

bibliotecas com as coordenadas de alinhamento de transcritos conhecidos. Foram identificadas 2.875 potenciais novas variantes de splicing, considerando a presença de sítios de splice conservados. As novas variantes de splicing foram categorizadas em uso de sítios de splice alternativos, retenção de íntrons ou uso alternativo de éxons. Em relação ao uso alternativo de éxons, foram identificados 487 eventos de exclusão de éxons

(Figura 40A) e 651 eventos de inclusão de éxons, sendo que destes 89 eventos apresentam os dois éxons flanqueadores conhecidos e os demais 562 eventos apresentaram apenas um éxon flanqueador mapeado contra transcritos conhecidos (Figura 40B). Foram identificados 530 eventos de uso de sítio de splice alternativo, incluindo sítio doador e aceptor alternativo na mesma categoria (Figura 40C). Por fim foram identificados 1.207 eventos de retenção de íntron, incluindo casos onde o íntron retido estava flanqueado por 2 éxons conhecidos (165 eventos) e 1.042 eventos em que apenas um dos éxons flanqueadores foi mapeado (Figura 40D).

Figura 40: Identificação de novas variantes de splicing. As novas variantes de

splicing estão distribuídas de acordo com o tipo de evento reportado. Os retângulos

brancos representam os éxon constitutivos e os retângulos em cinza os éxons alternativos. A – Retenção de íntron com ou sem a identificação de éxons flanqueadores conhecidos. B – Sítios de splice doador ou aceptor alternativos. C – Uso alternativo de éxons. Esta classe esta dividida em exclusão de éxons e inclusão de éxons, com ou sem a identificação dos éxons flanqueadores conhecidos.

4.2.4 Validação de eventos de splicing alternativo identificados pelas bibliotecas de cDNA de transcriptoma completo

Com o intuito de identificar novas variantes de splicing em câncer de mama que possam ser utilizadas como marcadores moleculares ou alvos

terapêuticos foram selecionados 20 eventos para validação por RT-PCR dentre o conjunto de 53 putativas novas variantes que apresentaram a inclusão de um novo éxon e foram reportadas com exclusividade por sequências oriundas da biblioteca da linhagem C5.2 (Tabela 12). Para a reação de RT-PCR os iniciadores foram desenhados no éxon novo e no éxon adjacente e o cDNA da linhagem C5.2 foi usado como molde.

Tabela 12: Caracterização das variantes selecionadas para validação. As variantes

estão representadas pelo símbolo dos genes correspondentes. A localização dos éxons em relação a sequência codificante (CDS) ou região não traduzida (5’ UTR e 3’UTR). A presença de sequências no banco de dados de sequências expressas EST foi verificada.

GENE

Éxon novo Localização

no RNAm Mapeado entre os éxons Confirmado por EST

LRP11 - 1 e 2 não

APEX1 CDS 1 e 3 não

BC039445 - - não

CLTC CDS 25 e 26 sim

CSRP2BP CDS 8 e 9 não

CUEDC2 5'UTR 1 e 2 não

FLJ00150 CDS 2 e 3 não FTSJ3 CDS 13 e 14 sim KIAA1033 CDS 26 e 27 não KIF2A CDS 6 e 7 não NR_002599 - 1 e 2 sim NR2C1 CDS 2 e 3 sim PAWR CDS 4 e 5 sim PDE6D CDS 4 e 5 não PPP2R2A CDS 4 e 5 sim PRCC CDS 5 e 6 não RPLP1 CDS 1 e 2 não RPS19 CDS 3 e 4 não RWDD1 CDS 1 e 2 não ZNF567 CDS 2 e 3 não

Dezoito dos 20 éxons selecionados foram validados por RT-PCR (90%). A estrutura dos novos éxons com suas respectivas coordenadas genômicas estão detalhadas na figura 41.

Figura 41: Validação das variantes de splicing por RT-PCR. A estrutura gênica das

novas variantes e das variantes conhecidas de cada gene estão representadas. As coordenadas genômicas dos limites éxon/íntron foram anotadas. Os retângulos em

branco representam os éxons constitutivos e os retângulos em cinza os éxons alternativos.

Uma vez que 14 dos 18 novos éxons validados estão posicionados na região codificante do gene (CDS) as possíveis alterações na sequência de aminoácidos decorrente da inclusão do novo éxon foram preditas com auxílio da ferramenta ORFFinder e a consequente inlfluência nos domínios proteicos preditas com auxílio do banco de predição InterProScan.

Metade dos genes apresentou inserção de códon de parada prematuro na variante com a inclusão do novo éxon (CSRP2BP, FTSJ3, KIAA1033,

PAWR, PDE6D, RPLP1 e RPS19), sugerindo provável geração de proteínas

truncadas com perdas funcionais. O gene PRCC também resultou em provável perda completa de função uma vez que a variante com inserção do éxon não forma sequência aberta de leitura. Outras alterações na sequência aberta de leitura foram identificadas para quatro genes (APEX1, CLTC, KIF2A e ZNF567), com a inserção ou deleção de aminoácidos sem, no entanto, resultar em alterações nos domínos proteicos. Por fim, os genes PP2R2A e

NR2C1 apresentaram grandes perdas de aminoácido na porção N-terminal,

resultando em alterações em alguns domínios proteicos. O gene PP2R2A sugere uma possível perda de 107 aminoácidos na região que inclui o domínio N-terminal de proteína serina-treonina fosfatase 2A, subunidade B, e um sítio conservado de subunidade regulatória PR55 da mesma proteína serina-treonina fosfatase além da perda de duas repetições do tipo WD40. O gene NR2C1 apresenta perda de 177aa na porção N-terminal da proteína com a inserção do novo éxon. Esta perda implica na substituição de domínios proteicos nesta região. A proteína resultante da variante sem o éxon apresenta um domínio do tipo receptor de vitamina D que é substituído por um domínio de receptor de ácido retinóico, além da perda de domínios de receptores hormonais nucleares do tipo dedo de zinco.

4.2.5 Regulação das variantes de splicing pela expressão diferencial