7 Concluding remarks and implications for Norwegian climate cooperation in India
7.1 P ROPOSALS FOR FOLLOW - UP WORK
As abordagens metodológicas baseadas em marcadores moleculares para a inferência de parentesco genético entre os indivíduos podem ser classificadas em duas categorias. A primeira utiliza um estimador de “momentum” para o cálculo do parentesco entre um
par de indivíduos: uma quantidade contínua definida em termos de probabilidades de IBD (e.g., LYNCH, 1988; QUELLER E GOODNIGHT, 1989; RITLAND, 1996; LYNH & RITLAND, 1λλλ). Estimadores de “momentum” como, por exemplo, os desenvolvidos por Queller e Goodnight (1989), Ritland (1996), Lynch e Ritland (1999), e Wang (2002) têm sido os mais utilizados. A segunda categoria usa uma abordagem de verossimilhança para determinar, a partir dos genótipos, a probabilidade de um par de indivíduos se relacionarem de uma determinada forma (irmãos completos, meio-irmãos, etc.) (e.g. MARSHALL et al., 1998; MOUSSEAU et al., 1998; GOODNIGHT E QUELLER, 1999; THOMAS E HILL, 2000). Considerando-se as limitações dos métodos e empregando-se as devidas correções, disponíveis na maioria dos softwares utilizados, é possível obter-se estimativas adequadas das relações de parentesco entre indivíduos em populações naturais (BLOUIN, 2003; JONES et al., 2010).
A similaridade genética entre indivíduos tem sido estimada com base em dois métodos clássicos, as medições estatísticas, como a correlação, e as medições de IBD (QUELLER E GOODNIGHT, 1989). Duas categorias principais de estimadores de parentesco genético são atualmente utilizadasμ 1) “Métodos dos momentos” (MM); e 2) Máxima verossimilhança (ML, das siglas em inglês de Maximum Likelihood), descritos pioneiramente por Thompson (1975) e utilizados para distinguir entre duas hipóteses de relacionamento.
Miño, CI Material e Métodos
Os estimadores de tipo MM são normalmente utilizados para calcular valores de similitude genética em termos de “probabilidades de Identidade-por-Descendência”. Queller & Goodnight (1989) foram os primeiros a desenvolverem estimadores de parentesco genético de tipo “métodos dos momentos‟ (MM), que podem ser aplicados a marcadores genéticos de tipo microssatélites. Esses estimadores foram posteriormente melhorados e reformulados por Ritland (1996) e Lynch e Ritland (1999). Um estudo recente de Csilléry et al. (2006) avaliou o desempenho de vários estimadores de parentesco em populações naturais e demonstrou que os estimadores de Ritland (1996), Lynch & Ritland (1999), e Queller e Goodnight (1989) tiveram seu desempenho melhor caracterizado (CSILLÉRY et al., 2006). No presente estudo, levou-se em consideração o sugerido por Csilléry e cols. (2006) e calcularam-se os estimadores de Lynch & Ritland (1999) (L&R) e Queller e Goodnight (1989) (Q&G). Os programas computacionais GENALEX (PEAKALL E SMOUSE, 2006) e KINGROUP (KONOVALOV et al., 2004) foram utilizados para o cálculo desses estimadores.
O estimador de parentesco de Lynch e Ritland (1999) pode ser descrito como:
considerando dois indivíduos diplóides, genotipados para quatro alelos de dois locos, sendo o indivíduo 1 AiAj e o indivíduo 2 AkAl, se Ai e Aj são iguais δij = 1; e se Ai
e Aj são diferentes δij = 0; n = número de alelos e pi é a frequência do alelo i na população.
O estimador de Queller e Goodnight (1989) é definido utilizando-se a mesma linguagem, como:
Queller e Goodnight (1989) sugeriram para calcular o estimador multilocos que pode-se somar os numeradores e os denominadores de cada um de maneira separada e
depois dividir um pelo outro.
A significância das estimativas de parentesco genético (obtidas pelos estimadores de Q&G e L&R) pode ser averiguada a partir de uma distribuição nula (BELKHIR et al., 2002) e calculando-se os valores P. O procedimento de re-
Miño, CI Material e Métodos
nula, com escolha casual de alelos, sem reposição, do conjunto de alelos presentes na amostra populacional. Foi demonstrado que com 17.000 pares gerados como hipótese nula os valores de P podem ser obtidos com uma precisão de 0,01.
Estimativas negativas de r podem ser entendidas como uma medida de quão mais baixa é a probabilidade de coalescência relativa de um par de indivíduos, com relação à probabilidade média de todos os pares considerados da população de referência, ou seja, esses indivíduos apresentam menor número de alelos idênticos-por- descendência do que o esperado (ROUSSET, 2002). Esta interpretação se aplica às estimativas negativas obtidas pelo estimador de parentesco de Q&G (1989) e de L&R (1999) e isso os torna não-enviesados (CSILLÉRY et al 2006). Valores de parentesco genético negativos possuem um significado biológico bastante interessante: i) quanto mais negativo o valor de r, mais certeza pode-se ter de que os indivíduos que estamos avaliando não estão relacionados; ii) esses valores podem ajudar a detectar numa população os indivíduos que são migrantes ou que carregam alelos novos (KONOVALOV E HEG, 2008).
2.5.4.2 Estimadores de tipo “máxima verossimilança” (maximum likelihood, ML)
Thompson (1975) foi o primeiro a desenvolver estimadores de parentesco genético de tipo “máxima verossimilança” e, a partir do seu trabalho, novos estimadores foram descritos. O programa ML-RELATE (KALINOWSKI et al., 2006), utilizado no presente estudo, utiliza os coeficientes k para descrever as relações genealógicas entre os indivíduos. Podem-se representar os coeficientes k que representam as relações genealógicas entre dois indivíduos como pontos em um gráfico (Fig. 2.8).
Miño, CI Material e Métodos
Figura 2.8. Coeficientes k de algumas categorias de relacionamento (U: não-relacionados; 1C: primos em primeiro grau; 2C: primos em segundo grau; FS: irmãos-completos; HS: meio- irmãos; PO: pogenitor-prole; M: gêmeos monozigóticos). A figura está construída de maneira que o parentesco aumenta à direita e ao extremo superior do gráfico. Figura adaptada de Kalinowski et al. (2006).
Se os indivíduos não forem endogâmicos, há uma relação entre os coeficientes k e o seu parentesco genético (r), de maneira que:
(1)
O relacionamento entre dois indivíduos pode ser estimado a partir de dados genéticos pelo cálculo da verossimilhança dos pontos no espaço-k (LYNCH E WALSH, 1998; BLOUIN, 2003). Chame-se K ao vetor representado pelos três coeficientes k, K = {k0,k1, k2}. Por definição, a verossimilhança de K, [L(K)] é igual à probabilidade de se observar determinados dados genéticos presentes em um indivíduo, conforme o relacionamento K (KALINOWSKI et al., 2006). A estimativa de máxima verossimilhança do relacionamento entre dois indivíduos é realizada buscando-se em todo o espaço paramétrico de K aqueles valores que maximizam L(K) e inserindo esses valores na equação (1). A “rotina de otimização simples” é boa para se realizar essa
Miño, CI Material e Métodos
picos de várias “alturas”, sempre é melhor começar a busca partindo de vários pontos, o que é feito pelo programa ML-RELATE, o qual insere diferentes valores de K na equação da verossimilhança (cada um correspondente a um relacionamento distinto) e determina qual é o valor que maximiza o resultado (KALINOWSKI et al., 2006). De maneira geral, as categorias de relacionamento que se encontram perto umas das outras no
espaço-k são mais difíceis de serem diferenciadas.
No presente estudo, o programa ML-RELATE (KALINOWSKI et al 2006) foi utilizado para estimativas de parentesco, supondo a ocorrência de alelos nulos ou não na amostra e realizando-se a correspondente correção. Este procedimento foi empregado com o intuito de avaliar e comparar as estimativas calculadas tanto na presença como ausência dos alelos nulos