O promotor é uma seqüência de DNA reconhecida pelo aparato de transcrição, que
após ligação, indica a sequência a ser lida e a direção da transcrição. Até então não existe
Sendo assim, no intuito de avaliar o potencial regulatório das regiões adjacentes ao sítio de
início de transcrição (TSS; transcription start site) do gene NCS-1 humano (NM_014286.3;
ENSG00000107130), um sistema de gene repórter com luciferase foi desenvolvido. Insertos
candidatos a conter a região promotora foram isolados por PCR e artificialmente inseridos em
plasmídeos pGL4.10[luc2]. O monitoramento da indução da expressão da luciferase
codificada no plasmídeo, a qual reflete a habilidade da seqüência regulatória inserida em
promover a transcrição, foi utilizada como parâmetro para avaliar o potencial regulatório dos
insertos.
3.12.1 Seleção da região candidata a promotor do gene NCS-1.
Uma das maiores dificuldades na identificação de uma região no DNA que contém
elementos reguladores dos níveis de expressão genética é definir a sua localização exata no
genoma. Ao contrário de procariotos, cujo o promotor normalmente encontra-se
imediatamente antes do sítio de início da transcrição, em mamíferos esta região pode ser
encontrada muito mais distante, na ordem de alguns kb (1.000 pares de bases, pb). No
entanto, a estratégia de considerar regiões proximais como ponto de partida em estudos ainda
é amplamente utilizada, mostrando-se eficaz (CURK et al., 2009; TRINKLEIN et al., 2003).
De fato, a maioria dos promotores descritos em humanos estão localizados em uma região
imediatamente anterior ao sítio de início da transcrição, também conhecida como “5’
upstream”. Um determinado local dentro desta região é designado com um valor negativo (-), que representa a quantidade de pares de bases (pb) antes do TSS. Presumidamente, valores
positivos (+) designam posições gênicas após o TSS. Alia-se a esta estratégia o estudo da
estrutura genômica local, uma vez que, com frequência, na região promotora encontram-se
elementos cis (sequências de nucleotídeos específicos que são reconhecidas e servem para
e ilhas de CpG (CpG islands). Uma vez reunidas tais características, uma região candidata
configura-se ter alta probabilidade de conter o promotor pesquisado. Para este estudo, estes
princípios foram utilizadas para definir as regiões candidatas a promotor do gene NCS-1, e a
descrição detalhada da estratégia utilizada durante seleção é apresentada nos parágrafos
seguintes.
A primeira pergunta feita foi qual seria a possível distância que o candidato a
promotor poderia estar do TSS do gene NCS-1? Levando em consideração que a região
intergênica 5’ upstream que separa os genes NCS-1 e GPR107 é de 32,409 kb, essa foi uma
pergunta muito improvável de ser respondida (Tabela 8).
Tabela 8. Posição da região intergênica entre NCS-1 e GPR107.
Gene Fim da transcrição Início da transcrição Tamanho da região intergênica
GPR107a 9:132,902,448 - 32,409kb
NCS-1b - 9:132,934,855
a
GPR107: G protein-coupled receptor 107; bNCS-1: sensor neuronal de cálcio.
A alternativa encontrada foi selecionar arbitrariamente cerca de 2 kb 5’ upstream do
TSS do NCS-1 baseado no pressuposto de que a maioria dos promotores descritos na literatura
encontram-se entre -1 e -1.000 pb. A alternativa de amplificar -2.000 pb, tal como foi feita,
seria razoavelmente apropriada baseando-se em nossas limitações técnicas. Como
previamente exposto, uma região genômica considerada “promotor” é caracterizada pela
presença de elementos cis e sequências de consenso. No intuito de aprofundar o conhecimento
sobre a estrutura genômica da região -2.000 pb selecionada para estudo, diversas ferramentas
Primeiramente, a identificação de elementos cis foi determinada levando em
consideração 80% de homologia entre os motivos e com 95% de confiança estatística através
da plataforma online e gratuita NSITE1, desenvolvida pela SoftBerry. Foram encontrados 60
potenciais sítios de ligação para fatores de transcrição (FT) em -2.100 pb 5’ upstream ao TSS
do NCS-1. Interessantemente e indo de encontro com a hipótese do estudo, alguns dos sítios
de ligação encontrados correspondem a FTs regulados por Gsk3 e MAPKs os quais são
indicados na sequência mostrada na Figura 20.
Em seguida, o software HCtata2 foi utilizado para predição de TATA box, sequências
nucleotídicas acreditadas determinar o sítio de ligação da RNA polimerase II. De acordo com
o parâmetro interno mais restringente do programa, três TATA boxes foram identificadas
(GAGATGAGGT, TTTCTAAAGG e AGTATGCTTA) (Figura 20). Outros elementos
genômicos também considerados importantes para início da transcrição são as “Ilhas CpG”.
Estas regiões são ricas em citosina (C) e guanina (G) (geralmente acima de 50% dos
nucleotídeos da região) e estão localizadas quase sempre na extremidade 5’ upstream do gene,
geralmente na região do promotor e, algumas vezes, se estendendo ao primeiro éxon. O
programa EMBOSS CpGPlot3 mostrou que quanto maior a aproximação do início do TSS do
gene NCS-1, maior é o conteúdo de C e G computando porcentagens de até 80% (Figura 21 A
e B). Utilizando os parâmetros padrões internos de análise, identificou-se através do programa
uma região de 575 pb (-54 pb a -628 pb) como sendo a ilha de CpG mais próxima do TSS do
NCS-1 dentro do input de -2100 pb (Figura 21 C).
1Disponível online em:
<http://linux1.softberry.com/berry.phtml?topic=nsite&group=programs&subgroup=promoter> [Acessado em 05/04/2012].
2Disponível online em: http://zeus2.itb.cnr.it/~webgene/wwwHC_tata.html [Acessado em 05/04/2012]. 3Disponível online em: <http://www.ebi.ac.uk/Tools/emboss/cpgplot/> [Acessado em 05/04/2012].
-2101 GAATGCAGTG GCACAATGAC GGCTCACTGC AGCCTCGCCC TGCTGGGTTC AAGTGATCCT -2041 TCCACTTCAG CCACCCGAGT AACGGGGAGT TAGGCATGTG TCACCAAGCC CAGCTAACTT TATA box
-1981 TTAAAAATTT TTGTAGAGAT GAGGTCTCCC CTGTCAGGCT GGTCTTGAAC TCCTAAGCTC