O método dos múltiplos histogramas (The Weighted Histogram Analysis Method – WHAM) consiste basicamente em utilizar dados de várias simulações para aumentar a informação sobre o sistema visando a obtenção das grandezas termodinâmicas do sistema estudado [55,56]. Para o estudo do enovelamento de proteínas, em particular, apenas uma simulação em uma temperatura ܶ não é suficiente para representar todo o conjunto de estados conformacionais ܹ do sistema. Desta forma, não existindo uma boa estatística para a realização dos cálculos da determinação da temperatura de transição e da energia livre. Neste caso, são realizadas várias simulações em diferentes condições, para que a amostragem do sistema seja melhor. Portanto, com a melhora na amostragem do sistema e utilizando o método do WHAM, é possível realizar o calculo das grandezas termodinâmicas.
26 Para um conjunto de N simulações, sendo a enésima contendo ܥ configurações para a temperatura ܶ݊ ൌ ͳ ݇Τ ߚ, a densidade de estados é dada por:
ߗሺܹሻ ൌ ܪሺܹሻ݁ݔሺߚܧ െ ݂ሻ
onde ܪሺܹሻ é o histograma da coordenada ܹ e ݂ é a energia livre adimensional.
Para um grupo de vários histogramas retirados de várias simulações em diferentes temperaturas, a densidade de estados real ߗሺܹሻ amostrada com relação à coordenada ܹ é a média ponderada da densidade obtida em cada simulação ߗሺܹሻ:
ߗሺܹሻ ൌ ݓߗሺܹሻ ே
ୀଵ
Os pesos atribuídos ݓ são obtidos pela minimização do erro de cada histograma utilizado. A probabilidade de, o sistema assumir a configuração ܹ na temperatura ܶ, é dada por:
ܲሺܹሻ ൌσσேୀଵܥ ܪሺܹሻ݁ݔሺߚܧሻ
ሺܹሻ݁ݔሺߚܧ െ ݂ሻ ே
ୀଵ
O método é auto-consistente, onde valores arbitrários são atribuídos para a energia livre adimensional, sendo realizado um processo de interação até que se obtenha a convergência desejada. Com a probabilidade definida as grandezas termodinâmicas são calculadas, como por exemplo, a energia livre:
݁ݔሺെ݂ሻ ൌ ܲሺܹሻ
V
VI
VII
27
Apêndice C – Complementação dos resultados
Os resultados obtidos no trabalho, gerados pelas simulações, apresentam o limiar de separação dos grupos em função da barreira de energia livre e da ordem de contato absoluta, estes resultados foram obtidos de forma empírica. Os resultados complementares provenientes da analise de PCA (Principal Component Analysis) (figura 10) e PLS (Partial
Least Square) (figura 11), realizada por colaboradores, apresentam a separação das proteínas
em dois grupos distintos e a relação do produto οܨݔܱܥܣ com o valor da frustração ótima ߳௧.
Estes resultados reforçam a existência do limiar de separação das proteínas em dois grupos distintos. É observado que a influência da frustração no processo de enovelamento, não está dependente de como esta frustração é adicionada ao modelo, uma vez que, a informação sobre a frustração ótima de cada proteína não é utilizada para as analises dos dados. Desta forma, apenas com as características estruturais e algumas simulações do modelo simples, é possível estimar a frustração de cada proteína.
Figura 10 - Apresentação dos resultados de PCA, onde é possível observar a separação em dois grupos de proteínas pelo Fator 1 (Factor 1). Os círculos azuis representam o grupo de proteínas em que a adição de frustração não favorece o processo de enovelamento, os quadrados vermelhos representam o grupo de proteínas em que o valor da frustração ótima é maior que zero.
28 Figura 11 - Apresentação dos resultados pela análise de PLS. Os eixos apresentam os valores de frustração ótima de cada proteína, o valor previsto – Predicted e o valor medido – Measured. É construído um modelo que prediz a frustração ótima de cada proteína, a correlação obtida, entre os dados obtidos e os dados preditos pela análise, é positiva com valor de 0.96.
Posteriormente foram realizadas, algumas simulações envolvendo as mesmas proteínas descritas nos resultados, mas com os códigos de PDB’s diferentes [61–64]. Os resultados obtidos são coerentes com os apresentados nos resultados. Os detalhes das proteínas utilizadas estão descritas na tabela 3.
Nome PDB ࡻ οࡲ οࡲ࢞ࡻ ࣕࢌ࢚
PtG 3GB1 9.14 2.00 18.28 0.10
CI2 1YPA 9.82 2.75 27.00 0.10
SH3 1SHG 10.75 3.60 38.70 0.15
29
Referencias Bibliográficas
[1] D. Voet, J. G. Voet, e C. W. Pratt, Principles of biochemistry. J. Wiley & sons, 2008. [2] B. Alberts, A. Johnson, J. Lewis, M. Raff, K. Roberts, e P. Walter, Molecular Biology
of the Cell, 4o ed. Artmed, 2004.
[3] A. L. Lehninger, D. L. Nelson, e M. M. Cox, Lehninger principles of biochemistry. W.H. Freeman, 2005.
[4] J. D. Bryngelson e P. G. Wolynes, “Spin glasses and the statistical mechanics of protein folding”, Proceedings of the National Academy of Sciences, vol. 84, no. 21, p. 7524 -
7528, nov. 1987.
[5] J. D. Bryngelson e P. G. Wolynes, “Intermediates and barrier crossing in a random energy model (with applications to protein folding)”, The Journal of Physical Chemistry, vol. 93, no. 19, p. 6902-6915, 1989.
[6] E. I. Shakhnovich e A. M. Gutin, “Formation of unique structure in polypeptide chains. Theoretical investigation with the aid of a replica approach”, Biophys. Chem., vol. 34,
no. 3, p. 187-199, nov. 1989.
[7] R. A. Goldstein, Z. A. Luthey-Schulten, e P. G. Wolynes, “Optimal protein-folding codes from spin-glass theory”, Proceedings of the National Academy of Sciences, vol. 89, no. 11, p. 4918 -4922, jun. 1992.
[8] S. S. Plotkin e J. N. Onuchic, “Understanding protein folding with energy landscape theory. Part I: Basic concepts”, Q. Rev. Biophys., vol. 35, no. 2, p. 111-167, maio 2002.
[9] D. U. Ferreiro, J. A. Hegler, E. A. Komives, e P. G. Wolynes, “Localizing frustration in native proteins and protein assemblies”, Proceedings of the National Academy of
Sciences, vol. 104, no. 50, p. 19819 -19824, dez. 2007.
[10] H. Frauenfelder, S. Sligar, e P. Wolynes, “The energy landscapes and motions of proteins”, Science, vol. 254, no. 5038, p. 1598 -1603, dez. 1991.
[11] C. Clementi e S. S. Plotkin, “The effects of nonnative interactions on protein folding rates: theory and simulation”, Protein Sci., vol. 13, no. 7, p. 1750-1766, jul. 2004.
[12] J. D. Bryngelson, J. N. Onuchic, N. D. Socci, e P. G. Wolynes, “Funnels, pathways, and the energy landscape of protein folding: A synthesis”, Proteins: Structure, Function, and Bioinformatics, vol. 21, no. 3, p. 167-195, mar. 1995.
[13] J. N. Onuchic, Z. Luthey-Schulten, e P. G. Wolynes, “Theory of protein folding: the energy landscape perspective”, Annu Rev Phys Chem, vol. 48, p. 545-600, 1997.
30 [14] P. E. Leopold, M. Montal, e J. N. Onuchic, “Protein folding funnels: a kinetic approach
to the sequence-structure relationship.”, Proc Natl Acad Sci U S A, vol. 89, no. 18, p. 8721-8725, set. 1992.
[15] J. Nelson Onuchic, H. Nymeyer, A. E. García, J. Chahine, e N. D. Socci, “The energy landscape theory of protein folding: Insights into folding mechanisms and scenarios”, in
Advances in Protein Chemistry, vol. 53, Elsevier, 2000, p. 87-152.
[16] P. G. Wolynes, J. N. Onuchic, e D. Thirumalai, “Navigating the Folding Routes”,
Science, vol. 267, no. 5204, p. 1619-1620, mar. 1995.
[17] H. A. Scheraga, M. Khalili, e A. Liwo, “Protein-Folding Dynamics: Overview of Molecular Simulation Techniques”, Annual Review of Physical Chemistry, vol. 58, no.
1, p. 57-83, 2007.
[18] S. S. Cho, Y. Levy, e P. G. Wolynes, “P versus Q: Structural reaction coordinates capture protein folding on smooth landscapes”, Proc Natl Acad Sci U S A, vol. 103, no.
3, p. 586-591, jan. 2006.
[19] S. S. Plotkin, “Speeding protein folding beyond the Gō model: How a little frustration sometimes helps”, Proteins, vol. 45, no. 4, p. 337-345, 2001.
[20] R. J. Oliveira, P. C. Whitford, J. Chahine, J. Wang, J. N. Onuchic, e V. B. P. Leite, “The origin of nonmonotonic complex behavior and the effects of nonnative interactions on the diffusive properties of protein folding”, Biophys. J., vol. 99, no. 2, p. 600-608, jul.
2010.
[21] H. Nymeyer, A. E. García, e J. N. Onuchic, “Folding funnels and frustration in off- lattice minimalist protein landscapes”, Proceedings of the National Academy of Sciences, vol. 95, no. 11, p. 5921 -5928, maio 1998.
[22] C. Clementi, H. Nymeyer, e J. N. Onuchic, “Topological and energetic factors: what determines the structural details of the transition state ensemble and ‘en-route’
intermediates for protein folding? An investigation for small globular proteins”, J. Mol. Biol, vol. 298, no. 5, p. 937-953, maio 2000.
[23] N. Koga e S. Takada, “Roles of native topology and chain-length scaling in protein folding: a simulation study with a Go-like model”, J. Mol. Biol, vol. 313, no. 1, p. 171- 180, out. 2001.
[24] L. L. Chavez, J. N. Onuchic, e C. Clementi, “Quantifying the Roughness on the Free Energy Landscape: Entropic Bottlenecks and Protein Folding Rates”, J. Am. Chem.
31 [25] J. K. Noel, P. C. Whitford, K. Y. Sanbonmatsu, e J. N. Onuchic, “SMOG@ctbp:
simplified deployment of structure-based models in GROMACS”, Nucleic Acids
Research, vol. 38, no. Web Server, p. W657-W661, jun. 2010.
[26] S. Gosavi, L. L. Chavez, P. A. Jennings, e J. N. Onuchic, “Topological frustration and the folding of interleukin-1 beta”, J. Mol. Biol, vol. 357, no. 3, p. 986-996, mar. 2006. [27] H. M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T. N. Bhat, H. Weissig, I. N.
Shindyalov, e P. E. Bourne, “The Protein Data Bank”, Nucleic Acids Research, vol. 28,
no. 1, p. 235 -242, jan. 2000.
[28] “RCSB PDB”. [Online]. Available: http://www.rcsb.org/pdb/home/home.do. [Accessed: 06-mar-2012].
[29] J.-E. Shea, J. N. Onuchic, e C. L. Brooks, “Energetic frustration and the nature of the transition state in protein folding”, The Journal of Chemical Physics, vol. 113, no. 17, p.
7663-7671, nov. 2000.
[30] P. Osmark, P. Sørensen, e F. M. Poulsen, “Context dependence of protein secondary structure formation: the three-dimensional structure and stability of a hybrid between chymotrypsin inhibitor 2 and helix E from subtilisin Carlsberg”, Biochemistry, vol. 32, no. 41, p. 11007-11014, out. 1993.
[31] P. Robustelli, A. Cavalli, e M. Vendruscolo, “Determination of Protein Structures in the Solid State from NMR Chemical Shifts”, Structure, vol. 16, p. 1764-1769, dez. 2008.
[32] A. D. Kline, W. Braun, e K. Wüthrich, “Determination of the complete three-
dimensional structure of the alpha-amylase inhibitor tendamistat in aqueous solution by nuclear magnetic resonance and distance geometry”, J. Mol. Biol., vol. 204, no. 3, p.
675-724, dez. 1988.
[33] Y. Harpaz, N. Elmasry, A. R. Fersht, e K. Henrick, “Direct observation of better hydration at the N terminus of an alpha-helix with glycine rather than alanine as the N- cap residue”, Proceedings of the National Academy of Sciences, vol. 91, no. 1, p. 311 -
315, jan. 1994.
[34] G. W. Bushnell, G. V. Louie, e G. D. Brayer, “High-resolution three-dimensional structure of horse heart cytochrome c”, J. Mol. Biol., vol. 214, no. 2, p. 585-595, jul.
1990.
[35] J. Kuszewski, A. M. Gronenborn, e G. M. Clore, “Improving the Packing and Accuracy of NMR Structures with a Pseudopotential for the Radius of Gyration”, J. Am. Chem. Soc., vol. 121, no. 10, p. 2337-2338, 1999.
32 [36] C. J. McKnight, P. T. Matsudaira, e P. S. Kim, “NMR structure of the 35-residue villin
headpiece subdomain”, Nat. Struct. Biol., vol. 4, no. 3, p. 180-184, mar. 1997.
[37] A. M. Bonvin, H. Vis, J. N. Breg, M. J. Burgering, R. Boelens, e R. Kaptein, “Nuclear magnetic resonance solution structure of the Arc repressor using relaxation matrix calculations”, J. Mol. Biol., vol. 236, no. 1, p. 328-341, fev. 1994.
[38] W. Kremer, B. Schuler, S. Harrieder, M. Geyer, W. Gronwald, C. Welker, R. Jaenicke, e H. R. Kalbitzer, “Solution NMR structure of the cold-shock protein from the
hyperthermophilic bacterium Thermotoga maritima”, Eur. J. Biochem., vol. 268, no. 9,
p. 2527-2539, maio 2001.
[39] S. T. Walsh, H. Cheng, J. W. Bryson, H. Roder, e W. F. DeGrado, “Solution structure and dynamics of a de novo designed three-helix bundle protein”, Proc. Natl. Acad. Sci.
U.S.A., vol. 96, no. 10, p. 5486-5491, maio 1999.
[40] N. D. Clarke, C. R. Kissinger, J. Desjarlais, G. L. Gilliland, e C. O. Pabo, “Structural studies of the engrailed homeodomain”, Protein Sci., vol. 3, no. 10, p. 1779-1787, out.
1994.
[41] S. Vijay-Kumar, C. E. Bugg, e W. J. Cook, “Structure of ubiquitin refined at 1.8 A resolution”, J. Mol. Biol., vol. 194, no. 3, p. 531-544, abr. 1987.
[42] N. A. J. van Nuland, I. W. Hangyi, R. C. van Schaik, H. J. C. Berendsen, W. F. van Gunsteren, R. M. Scheek, e G. T. Robillard, “The High-resolution Structure of the Histidine-containing Phosphocarrier Protein HPr from Escherichia coli Determined by Restrained Molecular Dynamics from Nuclear Magnetic Resonance Nuclear Overhauser Effect Data”, Journal of Molecular Biology, vol. 237, no. 5, p. 544-559, abr. 1994. [43] J. Vendrell, M. Billeter, G. Wider, F. X. Avilés, e K. Wüthrich, “The NMR structure of
the activation domain isolated from porcine procarboxypeptidase B”, EMBO J., vol. 10,
no. 1, p. 11-15, jan. 1991.
[44] K. V. Andersen e F. M. Poulsen, “The three-dimensional structure of acyl-coenzyme A binding protein from bovine liver: structural refinement using heteronuclear
multidimensional NMR spectroscopy”, J. Biomol. NMR, vol. 3, no. 3, p. 271-284, maio
1993.
[45] M. Wikström, T. Drakenberg, S. Forsén, U. Sjöbring, e L. Björck, “Three-dimensional solution structure of an immunoglobulin light chain-binding domain of protein L. Comparison with the IgG-binding domains of protein G”, Biochemistry, vol. 33, no. 47, p. 14011-14017, nov. 1994.
33 [46] H. Gouda, H. Torigoe, A. Saito, M. Sato, Y. Arata, e I. Shimada, “Three-dimensional
solution structure of the B domain of staphylococcal protein A: comparisons of the solution and crystal structures”, Biochemistry, vol. 31, no. 40, p. 9665-9672, out. 1992. [47] W. Xu, S. C. Harrison, e M. J. Eck, “Three-dimensional structure of the tyrosine kinase
c-Src”, , Published online: 13 February 1997; | doi:10.1038/385595a0, vol. 385, no. 6617, p. 595-602, fev. 1997.
[48] H. Schindelin, M. A. Marahiel, e U. Heinemann, “Universal nucleic acid-binding domain revealed by crystal structure of the B. subtilis major cold-shock protein”, ,
Published online: 08 July 1993; | doi:10.1038/364164a0, vol. 364, no. 6433, p. 164-168,
jul. 1993.
[49] V. Sobolev, A. Sorokine, J. Prilusky, E. E. Abola, e M. Edelman, “Automated analysis of interatomic contacts in proteins.”, Bioinformatics, vol. 15, no. 4, p. 327 -332, abr.
1999.
[50] “SMOG@ctbp: Structure-based MOdels in Gromacs”. [Online]. Available: http://smog.ucsd.edu/. [Accessed: 07-mar-2012].
[51] “Gromacs - Gromacs”. [Online]. Available: http://www.gromacs.org/. [Accessed: 09- mar-2012].
[52] H. J. C. Berendsen, D. van der Spoel, e R. van Drunen, “GROMACS: A message- passing parallel molecular dynamics implementation”, Computer Physics
Communications, vol. 91, no. 1-3, p. 43-56, set. 1995.
[53] E. Lindahl, B. Hess, e D. van der Spoel, “GROMACS 3.0: a package for molecular simulation and trajectory analysis”, Journal of Molecular Modeling, vol. 7, no. 8, p. 306-
317, 2001.
[54] D. Van Der Spoel, E. Lindahl, B. Hess, G. Groenhof, A. E. Mark, e H. J. C. Berendsen, “GROMACS: Fast, flexible, and free”, Journal of Computational Chemistry, vol. 26, no.
16, p. 1701-1718, dez. 2005.
[55] B. Hess, C. Kutzner, D. van der Spoel, e E. Lindahl, “GROMACS 4: Algorithms for Highly Efficient, Load-Balanced, and Scalable Molecular Simulation”, J. Chem. Theory
Comput., vol. 4, no. 3, p. 435-447, 2008.
[56] S. Kumar, J. M. Rosenberg, D. Bouzida, R. H. Swendsen, e P. A. Kollman, “THE weighted histogram analysis method for freeǦenergy calculations on biomolecules. I. The method”, Journal of Computational Chemistry, vol. 13, no. 8, p. 1011-1021, out.
34 [57] S. Kumar, J. M. Rosenberg, D. Bouzida, R. H. Swendsen, e P. A. Kollman,
“Multidimensional freeǦenergy calculations using the weighted histogram analysis method”, Journal of Computational Chemistry, vol. 16, no. 11, p. 1339-1350, nov. 1995.
[58] “Núcleo de Computação Científica”. [Online]. Available:
http://www.unesp.br/grid/index_cat3_areas.php. [Accessed: 09-mar-2012].
[59] K. W. Plaxco, K. T. Simons, e D. Baker, “Contact order, transition state placement and the refolding rates of single domain proteins”, Journal of Molecular Biology, vol. 277,
no. 4, p. 985-994, abr. 1998.
[60] “Calculate the Contact Order of Proteins: Baker Laboratory, Department of Biochemistry, University of Washington.” [Online]. Available:
http://depts.washington.edu/bakerpg/contact_order/. [Accessed: 09-mar-2012]. [61] Y. Harpaz, N. Elmasry, A. R. Fersht, e K. Henrick, “Direct observation of better
hydration at the N terminus of an alpha-helix with glycine rather than alanine as the N- cap residue”, Proc. Natl. Acad. Sci. U.S.A., vol. 91, no. 1, p. 311-315, jan. 1994.
[62] J. Kuszewski, A. M. Gronenborn, e G. M. Clore, “Improving the Packing and Accuracy of NMR Structures with a Pseudopotential for the Radius of Gyration”, J. Am. Chem. Soc., vol. 121, no. 10, p. 2337-2338, 1999.
[63] A. Musacchio, M. Noble, R. Pauptit, R. Wierenga, e M. Saraste, “Crystal structure of a Src-homology 3 (SH3) domain”, , Published online: 29 October 1992; |
doi:10.1038/359851a0, vol. 359, no. 6398, p. 851-855, out. 1992.
[64] H. Schindelin, M. A. Marahiel, e U. Heinemann, “Universal nucleic acid-binding domain revealed by crystal structure of the B. subtilis major cold-shock protein”, ,
Published online: 08 July 1993; | doi:10.1038/364164a0, vol. 364, no. 6433, p. 164-168,