• No results found

9. 
 CONCLUSIONS AND RECOMMENDATIONS

9.2 
 F URTHER WORK

A investigação de genes candidatos é atualmente bastante utilizada para estudos de associação. Para avaliar a associação indireta com a o Glaucoma primário de ângulo aberto cerca de 15 tagSNps foram escolhidos para o gene MYOC e 11 para o gene OPTN cujo objetivo é a maior captura de variação haplotipica. O valor de correlação limiar (r2 ) utilizado para captura dos

tagSNps pelo Tagger (algoritmo inserido no programa Haploview) foi de 0.8 (Barrett, Fry et al., 2005) (De Bakker, Yelensky et al., 2005). No entanto, sabe-se que um r2 maior que 0,5 % propicia uma seleção de tagSNps com mínimo representativo do haplótipo.

Outro critério de seleção observado foi a freqüência alélica mínima(MAF 5%).A utilização de freqüências mínimas alélicas abaixo de 5% pode possibilitar resultados espúrios (Jorde, 2000). Entretanto os 15 marcadores selecionados que melhor representaram a variação haplotipica estão abaixo de 5%. O projeto HapMap por sua vez apresenta muitas informações e dentre estas são encontrados marcadores do tipo tagSNPs entre as populações Yoruba, Européia e Asiáticas bem como ferramentas de seleção destes marcadores que podem ser utilizadas em estudos de associação (Magi, Kaplinski et al., 2006). As populações asiáticas CBH e JPT foram excluídas deste estudo por não apresentarem mais de três tagSNPs em comum.

As genotipagens para os marcadores do gene MYOC na população brasileira foram realizadas através dos sistemas multiplex desenvolvidos através do uso do kit SNaPshot Multiplex da Applied Biosystemns para as reações de extensão de base única . Houve sucesso nas genotipagens chegando a 100% dos genótipos esperados ocorrendo entretanto maior freqüência de heterozigotos.

Os padrões de freqüências alélicas para o gene MYOC investigado entre as populações brasileira e as do HapMap ( Yoruba e Européia) se mostram diferenciados para alguns dos 15 tagSNPs utilizados nestes estudo. No entanto, a comparação entre as freqüências alélicas das populações CEU e YRI com a população brasileira mostraram ter padrões intermediários de similaridade para alguns marcadores O banco de dados dbSNP banco de dados dbSNP do NCBI, também foi utilizado para a verificar as freqüências alélicas dos marcadores selecionados. Observou-se que as freqüências alélicas dos tagSNPs entre a população brasileira e as do dbSNP para alguns dos marcadores encontram-se fixados principalmente na população africana (Tabela 6).

As baixas freqüências foram observadas nos marcadores: rs12082573, rs12073336,rs10913388,rs10913374,rs2032555,rs7523603 e rs6425363. Na população CEU do HapMap o marcador rs12073336 não foi identificado e dois tagSNPs rs10913374 e rs12082573 apresentam-se monomórficos.

Dessemelhanças entre as freqüências alélicas para alguns marcadores foram analisadas entre as populações brasileira, africana e européia. Os tagSNPs rs10913374,rs12076134 e rs12082573 mostraram freqüências diferenciadas uma vez que alguns alelos se mostraram fixados para as populações européia e africana . Não foram observadas semelhanças nos padrões de freqüências alélicas para inferir que a população brasileira possua maior similaridade com a população Européia ou Africana pelo banco de dados dbSNP com relação com outros bancos de dados como o Perlegen e HapMap utilizados neste estudo para o gene MYOC.

Os resultados obtidos das análises de heterozigosidade entre e dentro das populações utilizadas neste estudo para os marcadores tagSNps do gene MYOC mostraram que a população brasileira apresenta níveis de heterozigosidade maiores para alguns marcadores quando comparados com as populações do HapMap (Tabelas 8 e 9) Dos 15 tagSNPs genotipados na população brasileira alguns marcadores não se mostraram dentro do Equilíbrio de Hardy- Weiberg como o esperado apresentando desvios e estes foram: rs6425363(p=1.0E-4 ), rs7545646 (p= 1,05E-11), rs10913374(p=1.0E-4), rs12035960 (p= 2,77E-02), rs12073336 (p= 1,70E-05 ),

rs2032555(p=@!$ '$ ! rs7523603(p=%!3 '# Oito marcadores restantes rs12076134, rs603930,

rs235870, rs235876, rs2236875, rs10913388, rs235918 e rs12082573 se mostraram dentro do EHW . Com relação a analise realizada para cinco tagSNPs três marcadores rs7545646 (p= 1,05E-11), rs2032555(p=@!$ '$ rs6425363(p=1.0E-4 ) se mostraram fora do EHW.

Estes desvios podem ter sido ocasionados por inclusões de dados incorretos gerando conclusões errôneas sobre os genótipos e conseqüentes erros nas análises estatísticas. Em estudos de genotipagem em larga escala é possível encontrar marcadores que ficaram fora do EHW não correspondendo às expectativas esperadas. Estes estudos sugerem que marcadores com freqüências alélicas mínimas abaixo de 5% apresentam desvios do EHW(Abecasis, Cardon et

al., 2001; Hosking, Lumsden et al., 2004; Terwilliger e Hiekkalinna, 2006). Apesar de apresentar sete marcadores fora do Equilíbrio de Hardy Weiberg em geral nos erros de genotipagem observa- se carência de heterozigoto o que não foi observado nesta investigação (Cox e Kraft, 2006).

As análises do padrão do desequilíbrio de ligação na população brasileira foram medidas pelo r2 e D’ de acordo com os parâmetros de Gabriel (Gabriel, Schaffner et al., 2002). O baixo

padrão de desequilíbrio observado de acordo com os valores médios de D’, r2 e LOD score na

população brasileira corroborou com o esperado(Tabela 11 e Figura 14). Esta estratégia se baseia na premissa que houve maior numero de SNPs genotipados e inseridos no projeto desde sua segunda fase(Lau, Kuo et al., 2006). Baixos valores de D’ e LOD score foram verificados não havendo formação de blocos haplótipicos na população Brasiléia utilizando os 15 tagSNPs e somente 8 marcadores em EHW bem como para a população do HapMap YRI (Figuras 15 e 17).

Para a população CEU houve a formação de dois blocos haplotipicos (Figura 16 e Tabela 13) . Em uma investigação do tipo caso-controle realizadas em pacientes pertencentes da população da Espanha o desequilíbrio de ligação foi avaliado utilizando SNPs da região promotora e dos Éxons 1, 2 e 3 do gene MYOC (Lopez-Martinez, Lopez-Garrido et al., 2007) .A freqüência alélica mínima foi maior que 5% e apenas dois blocos haplotipicos (5 haplótipos) foram observados com alto valor de D´. Os blocos haplotipicos encontrados neste trabalho foram os mesmos encontrados em outras populações como a Chinesa, asiática e européia (Mukhopadhyay, Acharya et al., 2002; Fan, Leung et al., 2004; Melki, Colomb et al., 2004).

Na análise de inferencia haplotipica por outro parâmetro estatístico avaliado pelo software Whap foi possível estimar 27 haplótipos (Tabela 14). Quatro dos 15 tagSNPs foram excluídos das análises devido as baixas freqüências alélicas mínimas(MAF 5%) e por estarem fora do EHW. Na busca de estimar a fase haplotípica o programa GERBIL foi utilizado uma vez que seu parâmetro estatístico é baseado no medelo de inferência Baesiana foi possível verificar a formação de 19 haplótipos e fases haplótipicas para as três populações utilizadas neste estudo.

Diferenças entre as freqüências haplotipicas entre as populações foram observadas. Entre as populações Yoruba e a Brasileira para os haplótipos H01, H02 e H03 apresentaram diferenças quanto a fase e freqüências haplotipicas observadas entre as três populações . Notas- se asuencia de freqüências e fases haplotipicas nas populações YRI e CEU para os haplótipos H15,H16,H17,H18 e H19 quando comprados com a população brasileira que mostraram para estes haplótipos freqüências que variaram entre 0,018 a 0,020 evidenciando assim a maior frequencia de heterozigotos para este gene na população brasileira (Tabela 15).

A utilização de marcadores do tipo tagSNPs tem sido aplicados para estudos de associação genética. Até o momento investigações de genes candidatos para doenças complexas por mapeamento por desequilíbrio de ligação para estudos de associação como o glaucoma primário de ângulo aberto tem sido realizado utilizando SNPs em estudos do tipo caso-controle e estudos em famílias em populações não miscigenadas. Estes estudos também tem sido realizados através do seqüenciamento de regiões promotoras onde foram detectadas mutações para os genes MYOC e OPTN bem como em outros genes associados com o GPAA (Povoa, Santiago et al., 2006; Campos-Mollo, Sanchez-Sanchez et al., 2007; Lopez-Martinez, Lopez- Garrido et al., 2007).

Foram observados neste trabalho o padrão de desequilíbrio de ligação utilizando estes marcadores selecionados na população Yoruba e avaliados na população brasileira que apresentou pra estes marcadores alta heterogeneidade genética (Alves-Silva, Da Silva Santos et

al., 2000; Pimenta, Zuccherato et al., 2006). A alta heterogeneidade em populações tem sido um dos focos de estudos de populações para doenças complexas (Schifman, Kuypers et al., 2003; Darvasi e Shifman, 2005; Palmer e Cardon, 2005).

No entanto, padrões de desequilíbrio de ligação são variados entre as populações. Forças evolutivas como migração, recombinação, padrões de heterogeneidade alélica e genotípica, diferenças nas freqüências alélicas e número de amostras interferem nos padrões de desequilíbrio de ligação (Jorde, 2000; Pritchard e Przeworski, 2001; Huang, He et al., 2006; Collins, 2008).

A análise do desequilíbrio de ligação obtido por estes marcadores para o GPAA na população brasileira quando comparados entre as populações do HapMap (Yoruba e Européias) podem não refletir a transferibilidade de informações pela população brasileira ser miscigenada e apresentar alta heterogeneidade genética. Uma vez que este estudo não é do tipo caso-controle, objetivou-se com a utilização dos tagSNPs verificar o poder de detecção da associação com o GPAA na população brasileira utilizando para isto as medidas de DL entre as populações estimadas por diferentes parâmetros e comparação entre as freqüências alélicas (De Bakker, Yelensky et al., 2005; De Bakker, Burtt et al., 2006).

A estratégia da seleção de tagSNPs a partir de genes candidatos se baseia na captura de maior informação haplotipica pelo uso em menor numero de SNPs para genotipagem para a redução da redundância destas informações bem como redução de gastos durante a genotipagem. Métodos de seleção de tagSNPs e definição de testes estatísticos(inferência Baesiana) vem sendo discutidos para melhor aplicabilidade para estudos de associação genômica e epidemiologia genética (Liu, Zhao et al., 2006).

Além disso, a transferibilidade das informações das variações genéticas comuns pelo uso de tagSNPs das populações do HapMap para outras populações vem sendo questionada (De Bakker, Graham et al., 2006; Sjolander, Hossjer et al., 2007; Pemberton, Jakobsson et al., 2008). Uma das alternativas para estudos de transferibilidade ente populações miscigenadas é a criação de um banco de dados com amostras destas populações com alta heterogeneidade genética.

Estudos de caso-controle com tamanho amostral acima de 1000 vem sendo descritos perfazendo assim uma das estratégias de verificar a transferibilidade para estudos de GWAS. Desenhos de melhores estratégias para estudos de associação genômica por SNPs tem sido pesquisados para identificação de variantes genéticas comuns e variantes de doenças comuns. O seqüenciamento em larga escala vem sendo utilizado como uma das estratégias por permitir a detecção direta da variabilidade estrutural (Gibbs e Singleton, 2006; Collins, 2008).

Outra estratégia utilizada para identificação de SNPs é o resequenciamento de amostras que tem indicado um aumento do numero de tagSNPs e permitido maiores conhecimentos sobre os padrões de desequilíbrio de ligação(paterna) da população de interesse (Constantine, Gurrib et

al., 2008). A transferilibilidade de tagSNps tem sido bastante discutida devido a estudos realizados que demonstraram bons resultados obtidos de populações européias em populações do Estado de Kingdom, Filandia, Estonia, populaçoes Japonesas, Chinesa e Hawainas respectivamente( (Ke, Hunt et al., 2004; Mueller, Lohmussaar et al., 2005; De Bakker, Graham et al., 2006; Montpetit, Nelis et al., 2006).

Cerca de 45% de variações puderam ser capturadas do HapMap através de tagSNPs com MAF 3% . Alguns algoritmos para seleção de tagSNPs tem sido desenvolvidos a fim de obter melhores conjuntos de marcadores para estudos de associação como o multiPopTagSlect (Carlson, 2004; Howie, Carlson et al., 2006; Tantoso, Yang et al., 2006). O algoritmo Tagger continua sendo uma das estratégias utilizadas para seleção de tagSNPs de genes candidatos para estudos de associação genômica (Mahasirimongkol, Chantratita et al., 2006; Constantine, Gurrib et al., 2008; Edlund, Lee et al., 2008; Xing, Witherspoon et al., 2008).

O sucesso de estudos de transferibilidade em populações européias foi importante, pois permitiu uma discussão sobre a portabilidade do uso de tagSNPs para múltiplas populações(Huang, He et al., 2006; Willer, Scott et al., 2006) (Pemberton, Jakobsson et al., 2008) Estudos de transferibilidade em populações miscigenadas indicaram que são necessárias utilizações de amostras em maior número bem como a observação da densidade em estudos do tipo caso controle (Abreu, 2007).

Em populações miscigenadas como a brasileira, pesquisas baseadas em mapeamento por desequilíbrio de ligação por miscigenação (MALD) são as mais indicadas para estudos de variantes de doenças com fenótipos complexos (Suarez-Kurtz, 2005; Tang, 2006; Manolio, Brooks

et al., 2008). A o padrão de distribuição de freqüências alélicas e genotípicas bem como estimativas de haplótipos e análises de ancestralidade genômica para populações miscigenas em investigações de doenças e fenótipos complexos são importantes para estudos de associação genética.

Para o gene MYOC pesquisas do tipo caso controle em pacientes com glaucoma indicaram que 2,7% dos pacientes apresentaram esta doença devido a mutação causada no gene. Nos estudos utilizando SNPs com MAF 5% não foram encontradas diferenças significativas para predizer freqüências haplotipicas entre casos e controles que possam indicar a falta de contribuição genética para o desenvolvimento do glaucoma (Lopez-Martinez, Lopez-Garrido et al., 2007).

Muitas ferramentas e técnicas para seleção de tagSNPs podem ser utilizados em estudos de associação [Lins TC et al, 2009 ;Magi et al, 2006]. No entanto, nem todos os genes e regiões genômicas tem freqüências diferenciais entre essas populações, especialmente nas regiões de baixo desequilíbrio de ligação como o gene MYOC. Em situações de ascendência diferencial sobre a epidemiologia da doença, não devem ser considerados os ancestrais das diferentes regiões do genoma, os genes LD ou seja, que apresentam alta e manchas recombinação baixo que também apresentam polimorfismos estatisticamente diferentes em freqüências que poderiam explicar a patogênese étnica [Collins, 2000 ].

No entanto, em casos de LD baixo como MYOC, esta abordagem não seria eficiente, pois as informações capturadas em um SNP podem não representar a informação de SNPs adjacentes não confinadas [Huang et al, 2006; Pritchard et al 2006, que exige vários SNPs adicionais e maiores densidades marcador necessárias para encontrar uma associação com a doença .

O gene MYOC uma vez que não foi considerado para explicar a questão variação étnica [Fingert et al, 1999], assim como foi mostrado que o desequilíbrio de ligação para o gene da Miocilina não era forte [Hewitt et al, 2007], os dados obtidos pela análise dos dados do projeto HapMap comparados com a população brasileira que é considerada heterogênea, corroboram com as pesquisas realizadas anteriormente.

Alternativamente, o MYOC e outros genes importantes como Optineurina(OPTN), têm um papel essencial em associação com o GPAA e outros tipos de glaucoma [Povoa CA et al 2006; Lopez-Martinez et al 2007;ampos-Mollo et al,2007; Chavarria-Soley et al, 2004] e, portanto, os marcadores usados aqui podem ajudar a explicar a associação em um estudo caso-controle realizado independentemente da origem étnica da população.

Essa abordagem foi aplicada anteriormente em estudos de glaucoma congênito primário (PCG) no Brasil [Stoilov IR et al, 2002]; PCG, juvenil (joag) e do início do adulto ou glaucoma crônico de ângulo aberto primário (COAG), em pacientes com glaucoma Costa Rica [Chavarria- Soley et al, 2004] GPAA, em famílias brasileiras [Povoa CA et al 2006]; estudos GPAA utilizando uma população principal fundadorade latino-americanos, a população espanhola [Lopez-Martinez

et al 2007; Campos-Mollo et al 2007]; mutações no gene OTPN entre e dentro de populações muito diferentes origens étnicas, incluindo hispânicos de ( ascendência latina [Ayala-Lugo et al, 2007]; e muitos outros estudos utilizando Africano-Misturadas e outros indivíduos de etnia diversificada [Nemesure B et al, 2003; Hewitt AW et al, 2007; Fan BJ et al, 2008].

Em populações miscigenadas, como a brasileira, baseada em pesquisa de mapeamento por desequilíbrio de ligação mistura [Collins-Schramm et al, 2002] e associação estruturada abordagem por genotipagem define marcadores informativos de ancestralidade, ancestralidade proporções inferir, e usá-las para corrigir a estratificação [Pritchard J et al 2001] são os mais adequados para estudo de doenças complexas variantes com fenótipos [Gentil P, et al;2009;,

Manolio TA et al 2008; Tang H et al, 2005 ]. Os padrões da distribuição de freqüências alélicas, bem como estimativas de haplótipos e análise de ascendência mista para as populações da investigação genómica de doenças e fenótipos complexos são importantes para estudos de associação genética [32, 46]. Para tal fundo fenotípica da doença, a diferença genética nas populações parentais deve ser sempre considerada para evitar a associação espúria em populações miscigenadas [45, 47].

Esforços estão sendo atualmente aplicadas em nosso grupo de pesquisa para identificar regiões genômicas de extremas diferenças genéticas em populações européias e Africano que pode explicar a maior prevalência de GPAA em Africano derivados populações (Manuscrito em preparação).

II-Mineração de SNPs informativos de