3. Results: Case Study of the Danish PRM regulations reform
3.3. Opportunities permitted by the Danish law
3.3.3. Exchange for trial and development
De acordo com Shao et al. [SHA07] as métricas de avaliação DBI e pSF são imperfeitas e o ideal é utilizá-las em conjunto e realizar uma inspeção visual nos resultados para conclusões sobre os melhores agrupamentos. Com base nos resultados apresentados, é difícil a indicação de um melhor algoritmo e de uma melhor função pois os melhores valores das métricas variam muito entre as diferentes configurações de experimentos de agrupamento executadas.
Por esses motivos, neste trabalho decidiu-se, além de avaliar os grupos com as métricas clássicas
DBI e pSF implementadas em [SHA07], verificar os resultados dos agrupamentos na aplicação que os mesmos serão utilizados. O objetivo dos experimentos de agrupamento desde o início é utilizá-los em docagem molecular com o modelo FFR de receptor, de forma a acelerar experimentos desse tipo onde somente parte das conformações de cada grupo serão consideradas.
necessário a reexecução dos experimentos de docagem molecular (Experimentos Fase 2 - Seção 3.5.2 do Capítulo 3) pois, para utilização das conformações nos algoritmos de agrupamento foi necessária a sobreposição de todas as estruturas na primeira da DM, modificando as que foram utilizadas na Docagem-Fase 1.
Essa análise foi realizada para os resultados de docagem com os 4 ligantes: NADH, PIF, TCL e ETH. A partir destes, foram calculadas as médias de desvios padrão (DP) de FEB de cada agrupamento obtido para as diferentes configurações de experimentos. Os melhores valores nessa avaliação de média de DP são para as configurações com os menores valores. Estas menores médias de DP indicam que determinado agrupamento colocou conformações que apresentaram resultados de docagem mais similares em mesmos grupos. Por exemplo, tem-se experimentos de agrupamento quaisquer com 2 grupos cada, que obtiveram os seguintes valores de DP de FEB:
• experimento 1: Grupo 1 com DP de FEB de 0,5 Kcal/mol e Grupo 2 com DP de 1,5 kcal/mol. A média de DP para esse agrupamento é de 1,0 kcal/mol;
• experimento 2: Grupo 1 com DP de FEB de 2,5 Kcal/mol e Grupo 2 com DP de 1,5 kcal/mol. A média de DP para esse agrupamento é de 2,0 kcal/mol;
Neste exemplo simples, o melhor resultado é para o Experimento 1, uma vez que o mesmo apresenta menor variação de FEB entre seus grupos. Para realizar essa análise foi necessário cruzar as informações sobre FEB de cada conformação para cada ligante com os agrupamentos. Para isso, foi desenvolvido um pequeno Banco de Dados chamado Docagem_Agrupamentos que armazena todos os resultados de agrupamentos para as configurações executadas (6 tabelas, uma para cada função utilizada) e os resultados de docagem molecular de cada ligante (4 tabelas, uma para cada ligante). Assim, o cálculo de média de DP de FEB, utilizando os dados armazenados neste BD, foi aplicado para os 4 ligantes e:
• todas as funções de similaridade variando suas entradas entre THT e THT+NADH;
• número de grupos variando de 2 a 10;
• para os conjuntos de átomos de entrada 20_RES, 25_RES, 46_RES e ALL;
• para os 7 algoritmos de agrupamento com melhores resultados para as métricas DBI e pSF :
Average, Bayesian, Centripetal_Comp, Complete, Hierarchical, K-means e SOM.
Os resultados dos agrupamentos com os algoritmos Centripetal, Edge e Linkage, especialmente para a métrica pSF , são ruins para quase todas as configurações de experimentos realizados, in- cluindo aqueles primeiros experimentos com de 10-100 grupos (Seção 8.1.1) e para de 2-20 grupos (Seção 8.1.2). Neste capítulo são descritos os resultados desta análise aplicado nos resultados de docagem para o PIF com ambas as entradas das funções de similaridade THT+NADH (Figuras 8.17 e 8.18) e THT (Figuras 8.19 e 8.20). Para os demais ligantes, os resultados estão apresentados no Apêndice E, considerando a entrada THT.
Figura 8.17: Média de desvio padrão de FEB para o ligante PIF com as funções de similaridade RMS,
T CN, T CN_Mult2, CORREL_V 1, CORREL_V 2 e CORREL_V 3 (entrada THT+NADH)
para os algoritmos Average, Bayesian e Centripetal_Comp (ALL, 25_RES e 46_RES).
Figura 8.18: Média de desvio padrão de FEB para o ligante PIF com as funções de similaridade RMS,
T CN, T CN_Mult2, CORREL_V 1, CORREL_V 2 e CORREL_V 3 (entrada THT+NADH)
Figura 8.19: Média de desvio padrão de FEB para o ligante PIF com as funções de similaridade
RM S, T CN, T CN_Mult2, CORREL_V 1, CORREL_V 2 e CORREL_V 3 (entrada THT)
para os algoritmos Average, Bayesian e Centripetal_Comp (ALL, 25_RES e 20_RES).
Figura 8.20: Média de desvio padrão de FEB para o ligante PIF com as funções de similaridade
RM S, T CN, T CN_Mult2, CORREL_V 1, CORREL_V 2 e CORREL_V 3 (entrada THT)
Os resultados descritos nas Figuras 8.17, 8.18, 8.19 e 8.20 são discutidos considerando todas as funções (RMS, T CN, T CN_Mult2, CORREL_V 1, CORREL_V 2 e CORREL_V 3) para as diferentes configurações de experimentos:
• Novamente os algoritmos Bayesian e SOM apresentam valores aproximados para as diferentes funções. E isso ocorre para THT e THT+NADH. As funções com menores valores de DP variam muito para os diferentes número de grupos, não sendo possível indicar quais tem melhor resultado para esses algoritmos.
• O Average-THT+NADH apresenta menores valores de médias de DP para a função T CN _M ult2 para os átomos de entrada ALL e 46_RES, sendo superada em poucos casos pela função
RM S. O mesmo algoritmo com a entrada para as funções THT também apresenta melhores
valores para T CN_Mult2 na maioria dos casos, com exceção para ALL e 20_RES onde
CORREL_V 3 ou RMS algumas vezes são melhores.
• Os melhores valores de DP para o algoritmo Centripetal_Comp-THT+NADH variam entre as funções CORREL_V 2 (para as 3 entradas), T CN (ALL) e T CN_Mult2 (25_RES e 46_RES). Para Centripetal_Comp-THT, CORREL_V 2 é melhor para as entradas ALL e 25_RES enquanto que CORREL_V 1 tem menores valores de DP de FEB para 46_RES.
• Complete-THT+NADH apresenta menores valores de DP para a função T CN _M ult2 (ALL e 25_RES) enquanto que para a entrada 46_RES há uma variação entre as funções. Menos valores de DP para Complete-THT ocorrem na maioria dos casos também para a função
T CN_Mult2;
• O algoritmo Hierarchical apresenta os menores valores de DP de FEB para as funções CORREL_V 1,
T CN_Mult2 e CORREL_V 2 para ambas as entradas THT+NADH e THT.
• De maneira geral, o algoritmo K-means apresenta menores valores de DP para a função
T CN_Mult2 para a maioria das configurações de experimento realizadas com ambas entradas THT e THT+NADH.
Resumindo os resultados discutidos, juntamente com os resultados para os demais ligantes (Apên- dice E) pode-se afirmar que a função T CN_Mult2 apresenta os menores valores de DP de FEB para as diferentes configurações de experimento. Além disso, também foi verificado que os melhores algoritmos foram Average e K-Means. Confirmou-se os resultados das métricas DBI e pSF em relação aos algoritmos Bayesian e SOM, que não tem seus resultados muito alterados independente da configuração de experimento executada. As funções relacionadas a correlação (CORREL_V 1,
CORREL_V 2 e CORREL_V 3) novamente não se mostram muito promissoras, como já havia