• No results found

6.1 Methodological discussion

6.1.2 Cross-sectional study

Para identificar, dentre os lncRNAs intrônicos antissenso e senso detectados nas linhagens celulares humanas DU-145, MCF-7 e Mia PaCa 2, aqueles que possuem ortólogos expressos em outras espécies, nós cruzamos as coordenadas genômicas dos 5.625 lncRNAs antissenso e 3.504 lncRNAs senso com as coordenadas genômicas de transcritos de vertebrados mamíferos e não mamíferos que foram sintenicamente mapeados no genoma humano pelo método de alinhamento de mRNAs entre espécies denominado TransMap (Zhu et al., 2007).

Dentre os lncRNAs senso e antissenso expressos em pelo menos uma das três linhagens analisadas, 888 (25% do total) e 3.562 (63% do total), respectivamente apresentaram conservação de expressão (Figura 18A e B). Esses conjuntos de lncRNAs que possuem ortólogos expressos em outras espécies são maiores que os conjuntos esperados quando se cruzam coordenadas genômicas de sequências humanas geradas randomicamente com as coordenadas do catálogo de ortólogos gerados por TransMap, (p-value < 0,0001; Teste Qui-quadrado) (Figura 18C).

Figura 18: lncRNAs intrônicos possuem transcritos ortólogos em outros vertebrados. Distribuição de

888 lncRNAs senso (A) e 3.562 lncRNAs antissenso (B) humanos que possuem ortólogos expressos em pelo menos uma das 18 espécies de vertebrados mamíferos e não mamíferos analisadas usando o algoritmo TransMap (Zhu et al., 2007). As coordenadas genômicas de todos os 3.504 lncRNAs senso e 5.625 lncRNAs antissenso identificados nas três linhagens de estudo foram cruzadas com as coordenadas genômicas do catálogo de ortólogos humanos de transcritos expressos em 18 espécies de vertebrados alinhados no genoma humano pelo algoritmo TransMap. Em cada linha está representada a distribuição dos ortólogos mapeados em cada uma das 18 espécies de vertebrados analisadas. Nas colunas estão representados cada um dos lncRNAs senso (A) e antissenso(B) que possuem ortólogos identificados. Em (C) estão plotadas as porcentagens de ortólogos identificados nas 18 espécies de vertebrados analisadas

para cada classe de transcrito não codificador em relação às porcentagens de ortólogos identificados para sequências randômicas (Teste Qui-Quadrado, p-value < 0,0001).

Para cerca de 25% dos lncRNAs senso e 63% dos lncRNAs antissenso foram identificados ortólogos em outras espécies de vertebrados, desde peixes até primatas. Apesar de estarem presentes nas análises espécies mais próximas ao homem, como a do orangotango e a do macaco rhesus, a espécie com mais ortólogos identificados em ambas as análises foi a do camundongo. Isto pode ser explicado pelo fato de que o transcriptoma do camundongo possui alta cobertura, devido ao grande esforço de anotação funcional do genoma dessa espécie realizado pelo projeto Functional Annotation of the Mouse Genome - FANTOM (Okazaki et al., 2002). A baixa representatividade de ortólogos observada nas espécies de primatas pode ser explicada pela menor cobertura disponível do transcriptoma dessas espécies.

Outra evidência de conservação evolutiva para os lncRNAs intrônicos senso e antissenso expressos nas linhagens utilizadas neste trabalho foi obtida a partir do cruzamento das coordenadas genômicas de todos os lncRNAs expressos em pelo menos uma das três linhagens com as coordenadas genômicas de elementos conservados entre 46 espécies de vertebrados. Além disso, foi avaliada a presença de elementos conservados subagrupando as espécies em primatas (9 espécies) e mamíferos placentários (32 espécies) (Figura 19). Para essa análise foi utilizado o dataset de elementos conservados disponível no UCSC Genome Browser.

Figura 19: Frequência de elementos evolutivamente conservados entre primatas, mamíferos placentários e vertebrados encontrados nos lncRNAs intrônicos. As coordenadas genômicas dos 3.504

lncRNAs senso (A) e dos 5.625 lncRNAs antissenso (B) foram cruzadas com as coordenadas genômicas de elementos conservados evolutivamente entre 46 espécies de vertebrados e entre os subgrupos de primatas (9 espécies) e mamíferos placentários (32 espécies). As frequências de transcritos não codificadores conservados evolutivamente foram comparadas com as frequências de sequências geradas randomicamente conservadas evolutivamente (Teste Qui-Quadrado, p-value < 0,0001).

Foram identificados 4.377 (78% do total) e 1.711 (49% do total) lncRNAs intrônicos antissenso e senso, respectivamente, que comportam em sua sequência elementos conservados evolutivamente entre os vertebrados. Comparando-se as taxas de transcritos intrônicos que apresentaram sobreposição com coordenadas genômicas de elementos conservados entre organismos pertencentes a cada grupo evolutivo com as taxas de coordenadas genômicas geradas randomicamente podemos observar que tanto os lncRNAs senso como os lncRNAs antissenso possuem enriquecimento nesses elementos (p-value < 0,0001, Teste Qui-Quadrado). Além disso, pode-se observar, como esperado, uma maior frequência desses elementos entre os primatas, que entre placentários e vertebrados.

tRNAs, bem como os RNAs catalíticos, como por exemplo a RNAse P e outros. A seleção natural agindo sobre a estrutura secundária desses RNAs não codificadores funcionais causa padrões de substituição de nucleotídeos característicos na sequência primária. Mutações consistentes e compensatórias troca um tipo de par de bases por outro nas regiões pareadas da molécula. Desse modo, há diferenças na variação de sequências entre regiões de loop e regiões de stem. Esses padrões podem ser explorados para discriminar ncRNAs funcionais expressos nas células (Washietl et al., 2005). Utilizando o programa RNAz (Washietl et al., 2005) identificamos estrutura secundária evolutivamente conservada para 623 (11% do total de 5.625) lncRNAs antissenso e 342 (10% do total de 3.504 lncRNAs senso). A Figura 20 mostra alguns exemplos de estruturas secundárias consenso obtidas para lncRNAs antissenso (Figura 20A) e para lncRNAs senso (Figura 20B).

Figura 20: lncRNAs intrônicos antissenso e senso expressos nas linhagens DU-145, MCF-7 e Mia PaCa 2 possuem estrutura secundária conservada evolutivamente. Na Figura estão representadas alguns exemplos de estruturas secundárias consenso preditas para lncRNAs antissenso (A) e senso (B). Os círculos indicam variações de pareamento de nucleotídeo nos stems e as cores indicam o número de diferentes tipos de pares de bases que suportam a seleção estabilizante sobre a estrutura e a escala de tom da cor indica número de pareamentos incompatíveis com a estrutura consenso no alinhamento múltiplo.

A Figura 21 mostra a sobreposição do número de transcritos não codificadores intrônicos senso e antissenso aos quais foram atribuídas predições de conservação evolutiva de expressão, de conservação evolutiva de sequência e predição de estrutura secundária conservada evolutivamente.

Figura 21: Sobreposição do número de lncRNAs antissenso e senso que apresentaram conservação de expressão (TransMaps), conservação de sequência (PhastConElements) e predição de estrutura secundária evolutivamente conservada. (A) lncRNAs senso; (B) lncRNAs antissenso.

Cinquenta e nove lncRNAs intrônicos senso (2% do total expresso) e 361 lncRNAs intrônicos antissenso (6% do total expresso) possuem predição de estrutura secundária evolutivamente conservada, além de conservação de expressão e de sequência (Figura 21). A pequena sobreposição pode ser explicada pelos diferentes critérios utilizados para o cálculo de estrutura e conservação por cada um dos algoritmos.

4.7 Regulação da expressão de lncRNAs intrônicos e mRNAs por metilação do DNA