Chapter I: Introduction
1.3. Background
O gênero Eucalyptus apresenta uma ampla distribuição geográfica, estando presente em regiões com diferentes condições climáticas e de solo. Apesar da hibridação ocorrer espontaneamente em espécies do gênero Eucalyptus, a ampla distribuição geográfica e adaptação a nichos específicos faz com que esse gênero apresente forte estruturação genética entre suas espécies e até mesmo entre procedências dentro de uma mesma espécie (FARIA, 2008). Jones et al. (2007) encontraram a existência de estruturação espacial significativa em populações naturais de E. globulus ao correlacionar estrutura genética com distância geográfica. Avaliações de estrutura genética entre as principais espécies de Eucalyptus são essenciais para direcionar estudos de melhoramento molecular, uma vez que foram essas populações naturais que forneceram a variabilidade genética existente nos primeiros programas de hibridação e melhoramento de eucalipto no Brasil (FONSECA et al., 2010).
O conhecimento da estrutura populacional presente em populações naturais de Eucalyptus é importante também para a realização de estudos de associação. Nessa abordagem, a diversidade de genes candidatos é avaliada entre populações naturais e os polimorfismos correlacionados com a variação fenotípica são identificados. As principais vantagens na realização de testes de associação em populações naturais incluem a ausência de necessidade de população de mapeamento, a rapidez e a elevada resolução (KIRST, 2007). Entretanto, a presença de subgrupos com distribuição desigual de freqüências alélicas dentro da população avaliada pode levar a presença de associações espúrias, não funcionais (REICH e GOLDSTEIN, 2001). A análise de indivíduos em uma população estruturada pode levar a identificação de desequilíbrio de ligação entre locos que apresentam diferenças em suas freqüências alélicas entre as subpopulações, o que pode levar a identificação de associações espúrias no contexto de estudos de associação (NEALE e SAVOLAINEN, 2004). Sendo assim, associações significativas entre marcador e fenótipo podem ser encontradas mesmo que o marcador não esteja fisicamente ligado com o loco responsável pela variação fenotípica (LANDER e SCHORK, 1994).
Um estudo que avaliou a ocorrência da diabete tipo 2 em tribos nativo americanas é um exemplo da interferência da estrutura populacional em análises de associação. Knowler et al. (1988) encontraram uma correlação positiva entre um haplótipo específico no loco da imunoglobulina G e a incidência reduzida de diabetes. Análises subseqüentes mostraram que
indivíduos com diabetes apresentavam baixa proporção de ancestralidade européia quando comparado aos indivíduos controle e que o importante haplótipo da imunoglobulina era mais prevalente em europeus do que em nativo americanos. Quando a análise de associação foi realizada estritamente utilizando indivíduos com proporções similares de ancestralidade européia, a associação não foi mais detectada, sugerindo que a associação detectada primeiramente ocorreu devido a efeitos de mistura populacional.
A ocorrência de estrutura populacional em diversos sistemas de plantas também pode influenciar em análises de associação para características quantitativas. O processo histórico de domesticação das plantas cultivadas de interesse agronômico e o fluxo gênico limitado na maioria das plantas selvagens criaram uma estratificação complexa dentro dos bancos de germoplasma, o que dificulta a realização de estudos de associação (SHARBEL, HAUBOLD e MITCHELL- OLDS, 2000). Dessa maneira, testes de associação com características quantitativas que não levam em conta os efeitos de estrutura populacional estão sujeitos a erros e a identificação de falsos positivos. Entretanto, metodologias estatísticas capazes de corrigir os efeitos de estrutura populacional em análises de associação já foram desenvolvidas (PRITCHARD e ROSENBERG, 1999).
Modelos estatísticos que utilizam apenas a informação de genótipos multi-loco foram desenvolvidos com o objetivo de detectar a presença de estrutura genética em populações naturais (PRITCHARD, STEPHENS e DONNELLY, 2000). Essa informação de estrutura genética pode ser incorporada diretamente nos testes estatísticos de associação, evitando que associações espúrias sejam detectadas (PRITCHARD et al., 2000). Esses modelos foram utilizados primeiramente em análises de associação para doenças genéticas em humanos, porém essa mesma abordagem foi adaptada para ser utilizada em características quantitativas de plantas (BUCKLER e THORNSBERRY, 2002). A primeira aplicação desse método em plantas foi em um estudo de tempo de florescimento em milho (THORNSBERRY et al., 2001). Nesse estudo, os polimorfismos no gene Dwarf8 apresentaram uma associação significativa com a variação no tempo de florescimento e os falsos positivos foram reduzidos em 80% ao ser considerada a presença de estruturação genética na população.
Diversos trabalhos envolvendo análises de estrutura genética em populações naturais de
Eucalyptus já foram publicados (JONES et al., 2006; PAYN et al., 2008). De maneira geral, os
Austrália e ilhas adjacentes mesmo quando analisadas populações de uma mesmo espécie. Além disso, observa-se uma forte correlação entre posição geográfica e diferenciação genética. Estudos de estrutura e distribuição espacial da diversidade genética entre populações são importantes não apenas para corrigir e evitar possíveis detecções espúrias em análises de associação, mas também para direcionar a escolha de focos de conservação dos recursos genéticos (JONES, VAILLANCOURT e POTTS, 2007).
Os marcadores moleculares mais amplamente utilizados para análises de estrutura genética em plantas são os microssatélites. Entretanto, com o surgimento de novas metodologias de genotipagem de SNPs em larga escala nos últimos anos, os SNPs podem ser uma alternativa interessante para análises de estrutura genética, estudos de filogenia e biogeografia e estudos da história evolutiva de diferentes organismos. Platt et al. (2010) realizaram um estudo no qual foram avaliadas diversas populações de Arabidopsis thaliana ao redor do mundo, totalizando 5.707 plantas, genotipadas para 149 SNPs. Apesar de A. thaliana ser uma espécie predominantemente de autofecundação, esse trabalho mostrou que existe considerável variação genética entre grupos locais.