O ordenamento preliminar dos nove grupos de ligação utilizou a função "order.seq" e a opção "force". Antes do procedimento de ordenamento, a função de mapeamento de Kosambi foi ativada para que as distâncias de mapa sejam apresentadas na escala dessa função.
O ordenamento de cada grupo de ligação pode ser feito utilizando vários algoritmos. Neste caso foi utilizado a função "order.seq", que utiliza a combinação de algoritmo de ordenamento por pesquisa exaustiva (função "compare", para formar a seqüência base de ordenamento, que por padrão, ordena os cinco marcadores mas informativos do grupo de ligação) e um algoritmo de aproximação (função "try"), que acrescenta e testa os demais marcadores do grupo de ligação, à medida que os ordena a partir da sequência-base criada.
O ordenamento exaustivo é mais preciso, entretanto à medida que aumenta o número de ordens (n!/2 possíveis combinações, sendo n o número de marcadores), aumenta o tempo computacional para o processamento e avaliação dos resultados, o que limita a um número pequeno de marcadores para serem utilizados nesta etapa. Por padrão são analisados cinco marcadores, mas até com seis é possível fazer as comparações, sem que o tempo de processamento fique muito longo. Para o grupo de ligação I, foram utilizados cinco marcadores na seqüência inicial e nos demais grupos de ligação, seis marcadores.
No último passo desta etapa, os marcadores do grupo de ligação, que ainda assim não forem ordenados, devido principalmente a valores de LOD menores que 3, tem sua posição mais provável estimada e são integrados ao grupo ordenado, através da função "make.seq", incluindo o argumento "force".
O mapa do grupo de ligação foi verificado através da confecção do gráfico da matriz de fração recombinação dos locos (função "rf.graph.table") e do mapa com as distâncias entre as marcas ordenadas (função "draw.map"). O gráfico da matriz de fração de recombinação (denominado de "heatmap") é representado por linhas e colunas formadas por retângulos
coloridos. As colunas, da esquerda para a direita, representam os marcadores ordenados, da mesma forma que as linhas representam os mesmos marcadores ordenados, de baixo para cima. A intersecção entre linhas e colunas, indica informações sobre os valores da fração de recombinação e seu respectivo LOD-Score, conforme se observa a intersecção abaixo ou acima da diagonal principal. A diagonal da matriz fica em branco, pois representa a intersecção do marcador de uma coluna com ele mesmo na linha. Quando a intersecção entre marcadores ocorre abaixo da diagonal da matriz, representa a fração de recombinação entre os marcadores em questão, sendo o valor da fração representado pela coloração da intersecção. Quanto mais próximos, mais vermelha a coloração, quanto mais distantes, a coloração vai se esmaecendo em matiz e tendendo para verde e azul. Da mesma forma, a intersecção entre linhas e colunas, quando acima da diagonal da matriz, representa o LOD-Score da respectiva fração de recombinação estimada. O matiz entre vermelho e azul, indica escala de valores decrescente de LOD-Score. Em uma condição ideal de ordenamento, os retângulos ficam todos vermelhos, próximos a diagonal, apresentando um matiz de coloração no sentido perpendicular da diagonal, variando do vermelho e tendendo ao azul. Entretanto, essa condição é rara, e o que se vê, pois o ordenamento é aproximado, são vários blocos de coloração vermelha, ao longo da diagonal principal, interligados por seus vértices. Geralmente os blocos são constituídos por marcadores tipo D e os vértices, que os conectam, por marcadores mais informativos, tipo A, B ou C. Marcadores fracamente conectados, com LOD-Score muito baixo, geralmente tem retângulos verdes ou azuis próximos às diagonais, principalmente os marcadores da extremidade do grupo de ligação.
A partir do heatmap e do mapa de distâncias, pode ser feita a identificação de marcas com ligação fraca ou que estão ligando blocos de marcas diferenciados. As marcas das extremidades, com ligações fracas e longas distâncias entre si (acima de 30 cM), podem estar ligadas apenas devido a artefatos, sendo considerada uma ligação precária. A eliminação dessas marcas do grupo de ligação, pode ser testada. Neste caso, primeiro as marcas suspeitas são retirada da seqüência, função "drop.marker"; e em seguida, a seqüência remanescente é submetida um novo ordenamento (função "order.seq") e depois à verificação pelo procedimento executado pela função "ripple". Por último, as marcas retiradas podem ser testadas quando à sua re-introdução na sequência, através dos procedimentos da função "try".
A função "ripple" amostra um pequeno segmento de marcadores, de forma seqüenciada ao longo da ordem récem-determinada do grupo de ligação, e verifica se há uma seqüência alternativa melhor, entre os marcadores do segmento amostrado. A função tem como saída tabelas com as ordens alternativas e respectivos valores de LOD. Se houver alguma ordem alternativa, com LOD mais significativo que a ordem pré-determinada, então a ordem alternativa pode ser aceita e o ordenamento da seqüência é modificado. Neste caso, a seqüência é alterada manualmente: a seqüência pré-determinada do grupo de ligação inteiro é listada, copiada para um arquivo texto, as alterações na seqüência são realizadas e a nova seqüência novamente copiada para uma variável através da função "make.seq". Em seguida, a seqüência editada tem seus parâmetros recalculados através da função "map". Feitas as alterações sugeridas pela função "ripple", compara-se o novo ordenamento com o ordenamento anterior e mantém-se o ordenamento que apresentar maior valor da log-verossimilhança.
Para as marcas que foram retiradas através da função "drop.marker" foi realizado uma rotina de teste da re-inclusão no grupo de ligação, através do procedimento "try", função "try.seq", com saída gráfica implementada pela opção "draw.try=T". A cada marca re-inserida, o programa apresenta gráficos com o LOD-Score das posições possíveis, o gráfico das frações de recombinação e o mapa de distâncias do grupo de ligação, localizando a posição mais provável da marca. Observando essas informações, manteve-se retiradas as marcas que mostraram posicionamento ambíguo em ambas extremidades (maiores LOD-Score nas duas extremidades do grupo de ligação); e que também apresentaram distâncias acima de 30 cM da marca mais próxima. No caso de alguma dessas marcas serem re-introduzidas na seqüência, a rotina de teste das marcas remanescentes não ligadas é repetida, pois o posicionamento de uma marca, pode alterar a probabilidade de posicionamento das demais.
Esta rotina de ordenamento (ordenamento, retirada de marcas, teste de re- introdução) foi repetida para cada grupo de ligação.
O ordenamento do grupo de ligação II, seguiu rotina ligeiramente modificada (ver código dos comandas ONEMAP, Anexo B). Após a avaliação do primeiro ordenamento (considerado pouco informativo), uma nova seqüência foi criada com apenas as marcas mais informativas do grupo (tipos A, B e C). Em seguida ao ordenamento, aplicação da verificação "ripple" e avaliação do ordenamento obtido. Os marcadores que não se posicionaram de forma adequada, mostrando ligações fracas e distâncias superiores a 30 cM foram identificados. Estes
marcadores foram retirados do primeiro ordenamento "force", juntamente com outras marcas que mostraram problemáticas, a partir da matriz de recombinação. Em seguida, novo ordenamento e novo" ripple'. Depois, teste de re-introdução com a função "try", a partir dos marcadores anteriormente retirados. O ordenamento final obtido foi então apresentado através da matriz de fração de recombinação (heatmap) e do mapa de distâncias.
Obtidos os grupos de ligação ordenados, a informação de cada grupo foi exportada do ambiente do ONEMAP para ser utilizada em software específico para construção dos diagramas de mapas de ligação. A exportação foi feita através do função "write.map", que salvou as informações dos grupos de ligação (ordem e distância) em arquivos no formato texto (.txt).
Os grupos de ligação ordenados foram submetidos a avaliações quanto ao número de marcas integradas no mapa e à classificação quanto ao tipo de cruzamento e metodologia de origem das marcas; foram calculadas a saturação e a distância média entre marcas de cada grupo, bem como os valores do comprimento total do mapa de ligação e a média geral de saturação e distância de marcas. As marcas não ligadas são classificadas e listadas quanto ao seu tipo de cruzamento e origem.