• No results found

3 Method

3.2 Literature review

4.1. Coleta dos isolados de Leishmania

Os parasitas foram isolados da medula óssea de humanos com leishmaniose visceral sintomáticas antes do diagnóstico (n=10), do sangue de pessoas com infecção assintomática (n=4), de lesão cutânea de um paciente suspeito de leishmaniose cutânea (n=1) e do baço de cães com LV (n=5). Todas as amostras foram coletadas no Estado do Rio Grande do Norte, Brasil (Figura 3), o qual vem sendo relatado como uma área endêmica para VL desde a década de 1980 (JERONIMO et al., 1994). Cinco isolados humanos foram obtidos nos anos de 1991-93, enquanto que os remanescentes foram coletados entre os anos de 2009 e 2013.

Os isolados foram expandidos em meio e então clonados pela técnica microdrop. Um total de 1 x 106 promastigostas/mL foram serialmente diluídos até que se alcançasse a concentração de 0,1 parasitas/mL e as amostras diluídas foram introduzidas em placas agar. Colônias positivas originadas da diluição de 1 ou menos parasitas/mL foram selecionadas e expandidas em meio HOMEN suplementado com 10% de soro fetal bovino. Um total de 1 x 106 parasitas/mL em 20 mL foi centrifugado. Após a remoção do meio e lavagem dupla com PBS, as amostras foram digeridas com proteinase K, durante 30 minutos e então foram vortexadas. Um total de 4 µL (100 µg/mL) de RNAse foi adicionada e então as amostras foram incubadas a 65 oC por 10 minutos, seguida da adição de acetato de amônio (7,5 M), repousadas por 5 minutos e então centrifugadas a 15,700 x g a 4 oC com o sobrenadante transferido para um novo tubo. O DNA foi purificado em uma coluna de atividade de acordo com o protocolo do fabricante (Qiagen DNeasy blood and tissue kit, Quiagen, USA). A qualidade do DNA foi avaliada por meio de eletroforese em gel de agarose.

Todas as espécimes foram tipadas por isoenzimas no laboratório de referência da Organização Mundial de Saúde (Fiocruz, Rio de Janeiro, RJ, Brasil) e pelo sequenciamento dos produtos da amplificação por PCR do gene

da HSP70 e do espaçador transcrito interno ribossomal (ITS) (SCHÖNIAN; KUHLS; MAURICIO, 2011).

4.2. Sequenciamento e montagem dos Genomas

O DNA genômico dos 20 isolados foi sequenciado na plataforma Illumina HiSEQ 2000, utilizando sequências barcode para minimizar as variações específicas de cada corrida. Cada isolado teve seu genoma sequenciado em quadruplicata e em duas corridas distintas, gerando aproximadamente 60 milhões de reads (101 bp). A qualidade das reads foi analisada por meio do pacote fastx-toolkit (http://hannonlab.cshl.edu/fastx_toolkit/) e NGS QC toolkit (PATEL; JAIN, 2012).

Para o mapeamento das reads e montagem dos genomas, foi utilizado o genoma de referência de L. infantum JPCM5 (PEACOCK et al., 2008) e a ferramenta Bowtie2 (LANGMEAD; SALZBERG, 2012) com base nos parâmetros do modo Sensitive, onde haveria a desistência de extensão dos alinhamentos após 15 mismatchs e a read seria eliminada da análise caso alinhasse com mais de dois seeds.

As reads não mapeadas foram submetidas ao processo de montagem de

novo por meio do pacote Velvet (ZERBINO, 2010). Posterior ao processo de

montagem de novo, os contigs montados foram utilizados para a identificação da sequência de DNA do cinetoplasto utilizando a sequência de referência do kDNA de L. tarentolae (SIMPSON et al., 1987).

Figura 3 – Mapa do Rio Grande do Norte informando os locais de coleta dos isolados, os pontos estão coloridos de acordo com o grupo de cada

isolado. Em alguns casos, há a sobreposição dos pontos. Ao lado, são mostrados os códigos de cada um dos isolados, seguido do ano de isolamento e a respectiva cidade de origem do paciente.

VLh90 (1991-1993)

Ah (2011-2012)

VLh (2009-2013)

VLd (2010-2012)

Isolate Name Isolation Year City 1VLh90s 1991 Natal 2VLh90s 1992 Ielmo Marinho 3VLh90s 1992 Macaiba 4VLh90s 1993 Ceará Mirim

5VLh90s 1993 São José Mipibú 12VLh 2012 Extremoz 13VLh 2012 Açu 14VLh 2012 Macaiba 19VLh* 2013 Sitio Novo 20VLh* 2013 Sítio Novo 6CLh 2009 Macaíba 8Ah 2011 Natal 9Ah 2011 Touros 10Ah 2011 Extremoz 18Ah 2012 Natal 7VLd 2010 Natal 11VLd 2011 Natal 15VLd 2012 Natal 16VLd 2012 Natal 17VLd 2012 Natal

4.3. Processamento dos dados de mapeamento

A etapa de mapeamento teve como produto os arquivos de extensão BAM e SAM, os quais foram submetidos a posteriores etapas de refinamento da qualidade da montagem. A princípio foi realizada a marcação e remoção das

reads duplicadas, produtos de duplicação na etapa da PCR, utilizando a

ferramenta Picard (http://picard.sourceforge.net).

Utilizando o pacote GATK (DEPRISTO et al., 2011), foi realizado o processo de identificação dos SNPs, indels e genotipagem de todas as 20 amostras. Os escores de recalibração para qualidade de variantes de acordo com as recomendações do GATK Best Practices. (DePristo et al., 2011; Van der Auwera et al., 2013).

As informações dos SNPs válidos foram utilizadas para a realização de uma Análise de Componentes Principais (Principal Component Analysis - PCA) usando o pacote SNPRelate (ZHENG et al., 2012) implementado no ambiente R (www.R-project.org). Os SNPs foram visualizados por meio dos programas Geneious 7.1 (Biomatters; www.geneious.com) e do Integrative Genome Viewer (IGV; THORVALDSDÓTTIR; ROBINSON; MESIROV, 2013).

4.4. Número de cromossomos e análise de duplicação gênica

A cobertura de reads e os valores de ploidia dos cromossomos foram estimados de acordo com a metodologia de (ROGERS et al., 2014; ZHANG et al., 2014). A partir da média e da mediana dos valores de cobertura obtidos a partir do SAMtools (LI et al., 2009) e o script em Perl ´find_copy_number.pl´ (ZHANG et al., 2014). Para visualização dos valores de ploidia para cada cromossomo foi construído um heatmap utilizando os pacotes RColorBrewer e gplot do R.

4.5. Distância temporal dos isolados

As sequências consensos do genoma inteiro dos 20 isolados (determinado pelas reads que apresentavam 75% da mesma base) foram alinhadas utilizando a ferramenta Mauve (DARLING et al., 2004). Após a etapa de alinhamento automático foi realizada uma edição manual para a retirada de regiões de baixa qualidade de alinhamento, causada por regiões ricas em “N” no genoma de referência.Os alinhamentos foram utilizados para calcular a diversidade nucleotídica (PI), a partir da extração de uma matriz de dissimilaridade entre grupos de alinhamentos. Os alinhamentos foram agrupados de acordo com as características do isolamento de cada uma das amostras.

Para a inferência evolutiva do genoma dos isolados foi realizada uma análise Bayesiana através do programa BEAST 1.8.1, (DRUMMOND et al., 2012). Na reconstrução filogenética foi utilizado o modelo de substituição nucleotídica HKY (HASEGAWA; KISHINO; YANO, 1985) e parâmetro de distribuição gama, como modelo de relógio molecular foi selecionado o

coalescente lognormal relaxed e as priores foram configuradas de acordo com o

modelo Extended Bayesian Skyline Plot (EBSP) como descrito por (DRUMMOND et al., 2005, 2006). Paralelamente à reconstrução filogenética, foi realizada uma análise da dinâmica populacional (DRUMMOND et al., 2005; HO; SHAPIRO, 2011). O programa Tracer foi utilizado para visualizar os valores de posteriores e a convergência das corridas. A topologia da árvores filogenéticas foi analisada e exportada utilizando a ferramenta FigTree (DRUMMOND; RAMBAUT, 2007).