Summary

Simulation et échantillonnage basés sur la structure des mouvements des protéines du facteur de transcription le long de l’ADN, du passage à l’échelle atomique à la diffusion à grain grossier

Published: March 01, 2022
doi:

Summary

L’objectif de ce protocole est de révéler la dynamique structurelle de la diffusion unidimensionnelle des protéines le long de l’ADN, en utilisant une protéine du domaine WRKY du facteur de transcription végétale comme système exemplaire. Pour ce faire, des simulations de dynamique moléculaire atomistique et à gros grains ainsi que des échantillonnages informatiques approfondis ont été mis en œuvre.

Abstract

Le glissement unidimensionnel (1-D) de la protéine du facteur de transcription (TF) le long de l’ADN est essentiel pour faciliter la diffusion du TF afin de localiser le site d’ADN cible pour la régulation génétique. La détection de la résolution de la paire de bases (pb) du glissement tf ou du pas sur l’ADN est encore expérimentalement difficile. Nous avons récemment effectué des simulations de dynamique moléculaire (MD) entièrement atomiques capturant un pas spontané de 1 pb d’une petite protéine TF de domaine WRKY le long de l’ADN. Basé sur le chemin de pas WRKY de 10 μs obtenu à partir de telles simulations, le protocole montre ici comment effectuer des échantillonnages conformationnels plus étendus des systèmes TF-ADN, en construisant le modèle d’état de Markov (MSM) pour le pas de protéine 1-bp, avec différents nombres de micro- et macro-états testés pour la construction MSM. Afin d’examiner la recherche par diffusion 1D processive de la protéine TF le long de l’ADN avec la base structurelle, le protocole montre en outre comment mener des simulations MD à grains grossiers (CG) pour échantillonner la dynamique à longue échelle du système. De telles modélisations et simulations CG sont particulièrement utiles pour révéler les impacts électrostatiques protéine-ADN sur les mouvements de diffusion processifs de la protéine TF au-dessus de dizaines de microsecondes, par rapport aux mouvements de pas de protéines submicrosecondes à microsecondes révélés par les simulations de tous les atomes.

Introduction

Les facteurs de transcription (TF) recherchent l’ADN cible pour lier et réguler la transcription des gènes et les activités connexes1. Mis à part la diffusion tridimensionnelle (3D), la diffusion facilitée de TF a été suggérée comme étant essentielle pour la recherche d’ADN cible, dans laquelle les protéines peuvent également glisser ou sauter le long de l’ADN unidimensionnel (1D), ou sauter avec transfert intersegmental sur l’ADN 2,3,4,5,6,7.

Dans une étude récente, nous avons mené des dizaines de microsecondes (μs) de simulations de dynamique moléculaire d’équilibre (MD) d’équilibre tout atome sur une plante TF – la protéine du domaine WRKY sur l’ADN8. Un pas complet de 1 bp de WRKY sur l’ADN poly-A en quelques microsecondes a été capturé. Les mouvements de la protéine le long du sillon de l’ADN et la dynamique de rupture-reformage des liaisons hydrogène (HB) ont été observés. Bien qu’une telle trajectoire représente un chemin échantillonné, un paysage global de pas de protéines fait encore défaut. Ici, nous montrons comment étendre les échantillonnages informatiques autour de la voie d’étape protéique initialement capturée avec le modèle d’état de Markov (MSM) construit, qui ont été largement mis en œuvre pour simuler une variété de systèmes biomoléculaires impliquant des changements conformationnels substantiels et une séparation à l’échelle de temps 9,10,11,12,13,14,15,16, 17,18,19. Le but est de révéler l’ensemble conformationnel et les états méta-stables de la diffusion de la protéine TF le long de l’ADN pour une étape cyclique.

Alors que la simulation MD ci-dessus révèle la résolution atomique des mouvements des protéines pour 1 pb sur l’ADN, la dynamique structurelle de la diffusion processive à long terme du TF le long de l’ADN à la même haute résolution est difficilement accessible. La réalisation de simulations de DM à grains grossiers (CG) au niveau des résidus est toutefois techniquement accessible. L’échelle de temps de simulation CG peut être effectivement étendue à des dizaines ou des centaines de fois plus que les simulations atomiques 20,21,22,23,24,25,26,27,28,29. Ici, nous montrons les simulations CG réalisées en implémentant le logiciel CafeMol développé par Takada lab30.

Dans le protocole actuel, nous présentons d’abord les simulations atomiques de la protéine du domaine WRKY le long de l’ADN poly-A et la construction MSM, qui se concentrent sur l’échantillonnage des mouvements de pas de la protéine pour seulement 1 pb le long de l’ADN. Ensuite, nous présentons la modélisation CG et les simulations du même système protéine-ADN, qui étendent l’échantillonnage informatique à la diffusion processive protéique sur des dizaines de bps le long de l’ADN.

Ici, nous utilisons le logiciel GROMACS31,32,33 pour effectuer des simulations MD et MSMbuilder34 pour construire le MSM pour des instantanés conformationnels échantillonnés, ainsi que pour utiliser VMD35 pour visualiser les biomolécules. Le protocole exige que l’utilisateur puisse installer et implémenter le logiciel ci-dessus. L’installation et la mise en œuvre du logiciel CafeMol30 sont alors nécessaires pour réaliser les simulations CG MD. D’autres analyses des trajectoires et de la visualisation sont également effectuées dans VMD.

Protocol

1. Construction du modèle d’état de Markov (MSM) à partir de simulations md atomiques Voie spontanée de pas protéique et collecte des structures initiales Utilisez une trajectoire MD8 de 10 μs entièrement atome obtenue précédemment pour extraire 10000 images uniformément d’un chemin de pas « vers l’avant » de 1 bp (c’est-à-dire une trame pour chaque nanoseconde). Le nombre total de trames doit être suffisamment grand pour inclure toutes les …

Representative Results

Glissement couplé à la rotation ou pas de 1 bp de WRKY de la construction MSMToutes les conformations protéiques sur l’ADN sont mappées au mouvement longitudinal X et à l’angle de rotation de la protéine COM le long de l’ADN (voir la figure 3A). Le couplage linéaire de ces deux degrés indique un pas couplé à la rotation de la protéine du domaine WRKY sur l’ADN. Les conformations peuvent être regroupées en 3 macro-états (S1, S2 et S3) dans le MSM. Le…

Discussion

Ce travail porte sur la façon de mener des simulations et des échantillonnages informatiques basés sur la structure pour révéler un facteur de transcription ou une protéine TF se déplaçant le long de l’ADN, non seulement au détail atomique du pas, mais aussi dans la diffusion processive, ce qui est essentiel pour la diffusion facilitée de TF dans la recherche de cible d’ADN. Pour ce faire, le modèle d’état de Markov ou MSM d’une petite protéine du domaine TF WRKY marchant pour 1-bp le long de l’ADN…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a été soutenu par les subventions #11775016 et #11635002 de la NSFC. JY a été soutenu par le CMCF de l’UCI via NSF DMS 1763272 et la subvention de la Fondation Simons #594598 et fonds de démarrage de l’UCI. LTD a été soutenu par la Fondation des sciences naturelles de Shanghai #20ZR1425400 et #21JC1403100. Nous reconnaissons également le soutien informatique du Beijing Computational Science Research Center (CSRC).

Materials

CafeMol Kyoto University coarse-grained (CG) simulations
GROMACS University of Groningen Royal Institute of Technology Uppsala University molecular dynamics simulations software
Matlab MathWorks Numerical calculation software
MSMbuilder Stanford University build MSM
VMD UNIVERSITY OF ILLINOIS AT URBANA-CHAMPAIGN molecular visualization program

References

  1. Latchman, D. S. Transcription factors: an overview. The International Journal of Biochemistry & Cell Biology. 29 (12), 1305-1312 (1997).
  2. Berg, O. G., von Hippel, P. H. Selection of DNA binding sites by regulatory proteins. Statistical-mechanical theory and application to operators and promoters. Journal of Molecular Biology. 193 (4), 723-750 (1987).
  3. von Hippel, P. H., Berg, O. G. Facilitated target location in biological systems. The Journal of Biological Chemistry. 264 (2), 675-678 (1989).
  4. Halford, S. E., Marko, J. F. How do site-specific DNA-binding proteins find their targets. Nucleic Acids Research. 32 (10), 3040-3052 (2004).
  5. Slusky, M., Mirny, L. A. Kinetics of protein-DNA interaction: facilitated target location in sequence-dependent potential. Biophysical Journal. 87 (6), 4021-4035 (2004).
  6. Bauer, M., Metzler, R. Generalized facilitated diffusion model for DNA-binding proteins with search and recognition states. Biophysical Journal. 102 (10), 2321-2330 (2012).
  7. Shvets, A. A., Kochugaeva, M. P., Kolomeisky, A. B. Mechanisms of Protein Search for Targets on DNA: Theoretical Insights. Molecules. 23 (9), 2106 (2018).
  8. Dai, L., Xu, Y., Du, Z., Su, X. D., Yu, J. Revealing atomic-scale molecular diffusion of a plant-transcription factor WRKY domain protein along DNA. Proceedings of the National Academy of Sciences of the United States of America. 118 (23), 2102621118 (2021).
  9. Chodera, J. D., Singhal, N., Pande, V. S., Dill, K. A., Swope, W. C. Automatic discovery of metastable states for the construction of Markov models of macromolecular conformational dynamics. The Journal of Chemical Physics. 126 (15), 155101 (2007).
  10. Pan, A. C., Roux, B. Building Markov state models along pathways to determine free energies and rates of transitions. The Journal of Chemical Physics. 129 (6), 064107 (2008).
  11. Bowman, G. R., Huang, X., Pande, V. S. Using generalized ensemble simulations and Markov state models to identify conformational states. Methods. 49 (2), 197-201 (2009).
  12. Prinz, J. H., et al. Markov models of molecular kinetics: Generation and validation. The Journal of chemical physics. 134 (17), 174105 (2011).
  13. Chodera, J. D., Noé, F. Markov state models of biomolecular conformational dynamics. Current Opinion in Structural Biology. 25, 135-144 (2014).
  14. Malmstrom, R. D., Lee, C. T., Van Wart, A. T., Amaro, R. E. On the Application of Molecular-Dynamics Based Markov State Models to Functional Proteins. Journal of Chemical Theory and Computation. 10 (7), 2648-2657 (2014).
  15. Husic, B. E., Pande, V. S. Markov State Models: From an Art to a Science. Journal of the American Chemical Society. 140 (7), 2386-2396 (2018).
  16. Sittel, F., Stock, G. Perspective: Identification of collective variables and metastable states of protein dynamics. The Journal of chemical physics. 149 (15), 150901 (2018).
  17. Wang, W., Cao, S., Zhu, L., Huang, X. Constructing Markov State Models to elucidate the functional conformational changes of complex biomolecules. WIREs Computational Molecular Science. 8, 1343 (2018).
  18. Peng, S., et al. Target search and recognition mechanisms of glycosylase AlkD revealed by scanning FRET-FCS and Markov state models. Proceedings of the National Academy of Sciences of the United States of America. 117 (36), 21889-21895 (2020).
  19. Tian, J., Wang, L., Da, L. T. Atomic resolution of short-range sliding dynamics of thymine DNA glycosylase along DNA minor-groove for lesion recognition. Nucleic Acids Research. 49 (3), 1278-1293 (2021).
  20. Chu, J. -. W., Izveko, S., Voth, G. The multiscale challenge for biomolecular systems: coarse-grained modeling. Molecular Simulation. 32 (3-4), 211-218 (2006).
  21. Marrink, S. J., Risselada, H. J., Yefimov, S., Tieleman, D. P., De Vries, A. H. The MARTINI force field: coarse grained model for biomolecular simulations. The Journal of Physical Chemistry B. 111 (27), 7812-7824 (2007).
  22. Givaty, O., Levy, Y. Protein sliding along DNA: dynamics and structural characterization. Journal of Molecular Biology. 385 (4), 1087-1097 (2009).
  23. Khazanov, N., Levy, Y. Sliding of p53 along DNA can be modulated by its oligomeric state and by cross-talks between its constituent domains. Journal of Molecular Biology. 408 (2), 335-355 (2011).
  24. Riniker, S., Allison, J. R., van Gunsteren, W. F. On developing coarse-grained models for biomolecular simulation: a review. Physical Chemistry Chemical Physics : PCCP. 14 (36), 12423-12430 (2012).
  25. Kmiecik, S., et al. Coarse-Grained Protein Models and Their Applications. Chemical Reviews. 116 (14), 7898-7936 (2006).
  26. Bhattacherjee, A., Krepel, D., Levy, Y. Coarse-grained models for studying protein diffusion along DNA. WIREs Computational Molecular Science. 6, 515-531 (2016).
  27. Wang, J., et al. Machine Learning of Coarse-Grained Molecular Dynamics Force Fields. ACS Central Science. 5 (5), 755-767 (2019).
  28. Joshi, S. Y., Deshmukh, S. A. A review of advancements in coarse-grained molecular dynamics simulations. Molecular Simulation. 47 (10-11), 786-803 (2021).
  29. Bigman, L. S., Greenblatt, H. M., Levy, Y. What Are the Molecular Requirements for Protein Sliding along DNA. The Journal of Physical Chemistry B. 125 (12), 3119-3131 (2021).
  30. Kenzaki, H., et al. CafeMol: A Coarse-Grained Biomolecular Simulator for Simulating Proteins at Work. Journal of Chemical Theory and Computation. 7 (6), 1979-1989 (2011).
  31. Berendsen, H. J. C., vander Spoel, D., van Drunen, R. GROMACS: a message-passing parallel molecular dynamics implementation. Computer Physics Communications. 91 (1-3), 43-56 (1995).
  32. vander Spoel, D., et al. GROMACS: fast, flexible, and free. Journal of Computational Chemistry. 26 (16), 1701-1718 (2005).
  33. Abraham, M. J., et al. GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers. SoftwareX. 1-2, 19-25 (2015).
  34. Harrigan, M. P., et al. MSMBuilder: Statistical Models for Biomolecular Dynamics. Biophysical journal. 112 (1), 10-15 (2017).
  35. Humphrey, W., Dalke, A., Schulten, K. VMD: visual molecular dynamics. Journal of Molecular Graphics. 14 (1), 33-38 (1996).
  36. Izrailev, S., et al. Steered Molecular Dynamics. Computational Molecular Dynamics: Challenges, Methods, Ideas. 4, 39-65 (1999).
  37. Schlitter, J., Engels, M., Krüger, P. Targeted molecular dynamics: a new approach for searching pathways of conformational transitions. Journal of Molecular Graphics. 12 (2), 84-89 (1994).
  38. Maragliano, L., Fischer, A., Vanden-Eijnden, E., Ciccotti, G. String method in collective variables: minimum free energy paths and isocommittor surfaces. The Journal of Chemical Physics. 125 (2), 24106 (2006).
  39. Weiss, D. R., Levitt, M. Can morphing methods predict intermediate structures. Journal of Molecular Biology. 385 (2), 665-674 (2009).
  40. Xu, Y. P., Xu, H., Wang, B., Su, X. D. Crystal structures of N-terminal WRKY transcription factors and DNA complexes. Protein. 11 (3), 208-213 (2020).
  41. Higham, D. J., Higham, N. J. MATLAB guide. Society for Industrial and Applied Mathematics. , (2016).
  42. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A K-Means Clustering Algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  43. Gonzalez, T. F. Clustering to minimize the maximum intercluster distance. Theoretical Computer Science. 38, 293-306 (1985).
  44. Zhao, Y., Sheong, F. K., Sun, J., Sander, P., Huang, X. A fast parallel clustering algorithm for molecular simulation trajectories. Journal of Computational Chemistry. 34 (2), 95-104 (2013).
  45. Ivani, I., et al. Parmbsc1: a refined force field for DNA simulations. Nature Methods. 13 (1), 55-58 (2016).
  46. Naritomi, Y., Fuchigami, S. Slow dynamics of a protein backbone in molecular dynamics simulation revealed by time-structure based independent component analysis. The Journal of Chemical Physics. 139 (21), 215102 (2013).
  47. Naritomi, Y., Fuchigami, S. Slow dynamics in protein fluctuations revealed by time-structure based independent component analysis: the case of domain motions. The Journal of Chemical Physics. 134 (6), 065101 (2011).
  48. Pérez-Hernández, G., Paul, F., Giorgino, T., De Fabritiis, G., Noé, F. Identification of slow molecular order parameters for Markov model construction. The Journal of Chemical Physics. 139 (1), 015102 (2013).
  49. McGibbon, R. T., Pande, V. S. Variational cross-validation of slow dynamical modes in molecular kinetics. The Journal of Chemical Physics. 142 (12), 124105 (2015).
  50. Deuflhard, P., Weber, M. Robust Perron cluster analysis in conformation dynamics. Linear Algebra and its Applications. 398, 161-184 (2005).
  51. Silva, D. A., et al. Millisecond dynamics of RNA polymerase II translocation at atomic resolution. Proceedings of the National Academy of Sciences of the United States of America. 111 (21), 7665-7670 (2014).
  52. Swope, W. C., Pitera, J. W., Suits, F. Describing Protein Folding Kinetics by Molecular Dynamics Simulations. 1. Theory. The Journal of Physical Chemistry B. 108 (21), 6571-6581 (2004).
  53. Clementi, C., Nymeyer, H., Onuchic, J. N. Topological and energetic factors: what determines the structural details of the transition state ensemble and "en-route" intermediates for protein folding? An investigation for small globular proteins. Journal of molecular biology. 298 (5), 937-953 (2000).
  54. Hinckley, D. M., Freeman, G. S., Whitmer, J. K., De Pablo, J. J. An experimentally-informed coarse-grained 3-Site-Per-Nucleotide model of DNA: structure, thermodynamics, and dynamics of hybridization. The Journal of chemical physics. 139 (14), 144903 (2013).
  55. Debye, P., Huckel, E. The theory of the electrolyte II-The border law for electrical conductivity. Physikalische Zeitschrift. 24, 305-325 (1923).
  56. Berendsen, H. J., Postma, J. V., van Gunsteren, W. F., DiNola, A., Haak, J. R. Molecular dynamics with coupling to an external bath. The Journal of Chemical Physics. 81, 3684-3690 (1984).
  57. Bowman, G. R. Improved coarse-graining of Markov state models via explicit consideration of statistical uncertainty. The Journal of Chemical Physics. 137 (13), 134111 (2012).
  58. Jain, A., Stock, G. Identifying metastable states of folding proteins. Journal of Chemical Theory and Computation. 8 (10), 3810-3819 (2012).
  59. Röblitz, S., Weber, M. Fuzzy spectral clustering by PCCA+: application to Markov state models and data classification. Advances in Data Analysis and Classification. 7, 147-179 (2013).
  60. Mardt, A., Pasquali, L., Wu, H., Noé, F. VAMPnets for deep learning of molecular kinetics. Nature Communications. 9 (1), 5 (2018).
  61. Wang, W., Liang, T., Sheong, F. K., Fan, X., Huang, X. An efficient Bayesian kinetic lumping algorithm to identify metastable conformational states via Gibbs sampling. The Journal of Chemical Physics. 149 (7), 072337 (2018).
  62. Chen, W., Sidky, H., Ferguson, A. L. Nonlinear discovery of slow molecular modes using state-free reversible VAMPnets. The Journal of Chemical Physics. 150 (21), 214114 (2019).
  63. Gu, H., et al. RPnet: a reverse-projection-based neural network for coarse-graining metastable conformational states for protein dynamics. Physical Chemistry Chemical Physics :PCCP. 24 (3), 1462-1474 (2022).
  64. Lane, T. J., Bowman, G. R., Beauchamp, K., Voelz, V. A., Pande, V. S. Markov state model reveals folding and functional dynamics in ultra-long MD trajectories. Journal of the American Chemical Society. 133 (45), 18413-18419 (2011).
  65. Konovalov, K. A., Unarta, I. C., Cao, S., Goonetilleke, E. C., Huang, X. Markov State Models to Study the Functional Dynamics of Proteins in the Wake of Machine Learning. JACS Au. 1 (9), 1330-1341 (2021).
  66. Cao, S., Montoya-Castillo, A., Wang, W., Markland, T. E., Huang, X. On the advantages of exploiting memory in Markov state models for biomolecular dynamics. The Journal of Chemical Physics. 153 (1), 014105 (2020).
  67. Brandani, G. B., Takada, S. Chromatin remodelers couple inchworm motion with twist-defect formation to slide nucleosomal DNA. PLoS Computational Biology. 14 (11), 1006512 (2018).
  68. Tan, C., Terakawa, T., Takada, S. Dynamic Coupling among Protein Binding, Sliding, and DNA Bending Revealed by Molecular Dynamics. Journal of the American Chemical Society. 138 (27), 8512-8522 (2016).
  69. Terakawa, T., Takada, S. p53 dynamics upon response element recognition explored by molecular simulations. Scientific reports. 5, 17107 (2015).
  70. Brandani, G. B., Niina, T., Tan, C., Takada, S. DNA sliding in nucleosomes via twist defect propagation revealed by molecular simulations. Nucleic Acids Research. 46 (6), 2788-2801 (2018).
  71. Knotts, T. A., Rathore, N., Schwartz, D. C., de Pablo, J. J. A coarse grain model for DNA. The Journal of Chemical Physics. 126 (8), 084901 (2007).
  72. Freeman, G. S., Hinckley, D. M., Lequieu, J. P., Whitmer, J. K., de Pablo, J. J. Coarse-grained modeling of DNA curvature. The Journal of Chemical Physics. 141 (16), 165103 (2014).
check_url/kr/63406?article_type=t

Play Video

Cite This Article
E, C., Dai, L., Tian, J., Da, L., Yu, J. Structure-Based Simulation and Sampling of Transcription Factor Protein Movements along DNA from Atomic-Scale Stepping to Coarse-Grained Diffusion. J. Vis. Exp. (181), e63406, doi:10.3791/63406 (2022).

View Video