Summary

Simulazione basata sulla struttura e campionamento dei movimenti proteici del fattore di trascrizione lungo il DNA dallo stepping su scala atomica alla diffusione a grana grossa

Published: March 01, 2022
doi:

Summary

L’obiettivo di questo protocollo è quello di rivelare le dinamiche strutturali della diffusione unidimensionale delle proteine lungo il DNA, utilizzando una proteina di dominio WRKY del fattore di trascrizione vegetale come sistema esemplare. Per fare questo, sono state implementate simulazioni di dinamica molecolare sia atomistiche che a grana grossa insieme a vasti campionamenti computazionali.

Abstract

Lo scorrimento unidimensionale (1-D) della proteina del fattore di trascrizione (TF) lungo il DNA è essenziale per facilitare la diffusione del TF per individuare il sito del DNA bersaglio per la regolazione genetica. Rilevare la risoluzione della coppia di basi (bp) del TF che scivola o calpesta il DNA è ancora sperimentalmente impegnativo. Recentemente abbiamo eseguito simulazioni di dinamica molecolare all-atom (MD) catturando il passo spontaneo di 1 bp di una piccola proteina TF del dominio WRKY lungo il DNA. Sulla base del percorso di stepping WRKY da 10 μs ottenuto da tali simulazioni, il protocollo mostra qui come condurre campionamenti conformazionali più estesi dei sistemi TF-DNA, costruendo il modello di stato di Markov (MSM) per lo stepping proteico 1-bp, con vari numeri di micro e macro-stati testati per la costruzione MSM. Al fine di esaminare la ricerca diffusionale 1-D processiva della proteina TF insieme al DNA con basi strutturali, il protocollo mostra inoltre come condurre simulazioni MD a grana grossa (CG) per campionare la dinamica su scala a lungo termine del sistema. Tali modelli e simulazioni CG sono particolarmente utili per rivelare gli impatti elettrostatici proteina-DNA sui movimenti diffusionali processivi della proteina TF superiori a decine di microsecondi, rispetto ai movimenti di stepping proteico da sub-microsecondi a microsecondi rivelati dalle simulazioni di tutti gli atomi.

Introduction

I fattori di trascrizione (TF) cercano il DNA bersaglio per legare e regolare la trascrizione genica e le attività correlate1. Oltre alla diffusione tridimensionale (3D), la diffusione facilitata del TF è stata suggerita come essenziale per la ricerca del DNA target, in cui le proteine possono anche scivolare o saltare lungo il DNA unidimensionale (1D), o saltare con trasferimento intersegmentale sul DNA 2,3,4,5,6,7.

In un recente studio, abbiamo condotto decine di microsecondi (μs) simulazioni di dinamica molecolare di equilibrio all-atomo (MD) su una pianta TF – la proteina del dominio WRKY sul DNA8. È stato catturato un passo completo di 1 bp di WRKY sul DNA poly-A entro microsecondi. Sono stati osservati i movimenti della proteina lungo il solco del DNA e le dinamiche di rottura-reforming dei legami idrogeno (HBs). Mentre una tale traiettoria rappresenta un percorso campionato, un panorama generale di stepping proteico è ancora carente. Qui, mostriamo come espandere i campionamenti computazionali attorno al percorso di stepping proteico inizialmente catturato con il modello di stato di Markov costruito (MSM), che è stato ampiamente implementato per simulare una varietà di sistemi biomolecolari che comportano sostanziali cambiamenti conformazionali e separazione su scala temporale 9,10,11,12,13,14,15,16, 17,18,19. Lo scopo è quello di rivelare l’insieme conformazionale e gli stati meta-stabili della diffusione della proteina TF lungo il DNA per un passo ciclico.

Mentre la simulazione MD di cui sopra rivela la risoluzione atomica dei movimenti proteici per 1 bp sul DNA, la dinamica strutturale della diffusione processiva a lungo termine del TF lungo il DNA alla stessa alta risoluzione è difficilmente accessibile. Condurre simulazioni MD a grana grossa (CG) a livello di residuo è tuttavia tecnicamente accessibile. La scala temporale di simulazione CG può essere efficacemente estesa a decine o centinaia di volte più lunga delle simulazioni atomiche 20,21,22,23,24,25,26,27,28,29. Qui, mostriamo le simulazioni CG condotte implementando il software CafeMol sviluppato da Takada lab30.

Nel protocollo attuale, presentiamo le simulazioni atomiche della proteina del dominio WRKY lungo il DNA poly-A e la costruzione MSM prima, che si concentrano sul campionamento dei movimenti di stepping proteico per solo 1 bp lungo il DNA. Quindi presentiamo la modellazione CG e le simulazioni dello stesso sistema proteina-DNA, che estendono il campionamento computazionale alla diffusione processiva della proteina su decine di bps lungo il DNA.

Qui, utilizziamo il software GROMACS31,32,33 per condurre simulazioni MD e MSMbuilder34 per costruire MSM per snapshot conformazionali campionati, nonché per utilizzare VMD35 per visualizzare le biomolecole. Il protocollo richiede che l’utente sia in grado di installare e implementare il software di cui sopra. L’installazione e l’implementazione del software CafeMol30 è quindi necessaria per condurre le simulazioni CG MD. Ulteriori analisi delle traiettorie e la visualizzazione sono condotte anche in VMD.

Protocol

1. Costruzione del modello di stato di Markov (MSM) da simulazioni MD atomiche Percorso spontaneo di stepping proteico e raccolta iniziale delle strutture Utilizzareuna traiettoria MD all-atom 8 da 10 μs ottenuta in precedenza per estrarre 10000 fotogrammi in modo uniforme da un percorso di stepping “in avanti” da 1 bp (cioè un fotogramma per ogni nanosecondo). Il numero totale di fotogrammi deve essere sufficientemente grande da includere tutte le conformazion…

Representative Results

Scorrimento accoppiato a rotazione o stepping di 1 bp di WRKY dalla costruzione MSMTutte le conformazioni proteiche sul DNA sono mappate al movimento longitudinale X e all’angolo di rotazione della proteina COM lungo il DNA (vedi Figura 3A). L’accoppiamento lineare di questi due gradi indica uno stepping accoppiato alla rotazione della proteina del dominio WRKY sul DNA. Le conformazioni possono essere ulteriormente raggruppate in 3 macrostati (S1, S2 e S3) nel MSM. Il pa…

Discussion

Questo lavoro affronta come condurre simulazioni computazionali basate sulla struttura e campionamenti per rivelare un fattore di trascrizione o una proteina TF che si muove lungo il DNA, non solo al dettaglio atomico del passo, ma anche nella diffusione processiva, che è essenziale per la diffusione facilitata del TF nella ricerca del bersaglio del DNA. Per fare ciò, è stato costruito per la prima volta il modello di stato di Markov o MSM di una piccola proteina di dominio TF WRKY che cammina per 1-bp lungo il DNA po…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Questo lavoro è stato supportato da NSFC Grant #11775016 e #11635002. JY è stato supportato dal CMCF dell’UCI tramite NSF DMS 1763272 e dalla simons Foundation grant #594598 e dal fondo di start-up dell’UCI. LTD è stata sostenuta dalla Natural Science Foundation di Shanghai #20ZR1425400 e #21JC1403100. Riconosciamo anche il supporto computazionale del Beijing Computational Science Research Center (CSRC).

Materials

CafeMol Kyoto University coarse-grained (CG) simulations
GROMACS University of Groningen Royal Institute of Technology Uppsala University molecular dynamics simulations software
Matlab MathWorks Numerical calculation software
MSMbuilder Stanford University build MSM
VMD UNIVERSITY OF ILLINOIS AT URBANA-CHAMPAIGN molecular visualization program

References

  1. Latchman, D. S. Transcription factors: an overview. The International Journal of Biochemistry & Cell Biology. 29 (12), 1305-1312 (1997).
  2. Berg, O. G., von Hippel, P. H. Selection of DNA binding sites by regulatory proteins. Statistical-mechanical theory and application to operators and promoters. Journal of Molecular Biology. 193 (4), 723-750 (1987).
  3. von Hippel, P. H., Berg, O. G. Facilitated target location in biological systems. The Journal of Biological Chemistry. 264 (2), 675-678 (1989).
  4. Halford, S. E., Marko, J. F. How do site-specific DNA-binding proteins find their targets. Nucleic Acids Research. 32 (10), 3040-3052 (2004).
  5. Slusky, M., Mirny, L. A. Kinetics of protein-DNA interaction: facilitated target location in sequence-dependent potential. Biophysical Journal. 87 (6), 4021-4035 (2004).
  6. Bauer, M., Metzler, R. Generalized facilitated diffusion model for DNA-binding proteins with search and recognition states. Biophysical Journal. 102 (10), 2321-2330 (2012).
  7. Shvets, A. A., Kochugaeva, M. P., Kolomeisky, A. B. Mechanisms of Protein Search for Targets on DNA: Theoretical Insights. Molecules. 23 (9), 2106 (2018).
  8. Dai, L., Xu, Y., Du, Z., Su, X. D., Yu, J. Revealing atomic-scale molecular diffusion of a plant-transcription factor WRKY domain protein along DNA. Proceedings of the National Academy of Sciences of the United States of America. 118 (23), 2102621118 (2021).
  9. Chodera, J. D., Singhal, N., Pande, V. S., Dill, K. A., Swope, W. C. Automatic discovery of metastable states for the construction of Markov models of macromolecular conformational dynamics. The Journal of Chemical Physics. 126 (15), 155101 (2007).
  10. Pan, A. C., Roux, B. Building Markov state models along pathways to determine free energies and rates of transitions. The Journal of Chemical Physics. 129 (6), 064107 (2008).
  11. Bowman, G. R., Huang, X., Pande, V. S. Using generalized ensemble simulations and Markov state models to identify conformational states. Methods. 49 (2), 197-201 (2009).
  12. Prinz, J. H., et al. Markov models of molecular kinetics: Generation and validation. The Journal of chemical physics. 134 (17), 174105 (2011).
  13. Chodera, J. D., Noé, F. Markov state models of biomolecular conformational dynamics. Current Opinion in Structural Biology. 25, 135-144 (2014).
  14. Malmstrom, R. D., Lee, C. T., Van Wart, A. T., Amaro, R. E. On the Application of Molecular-Dynamics Based Markov State Models to Functional Proteins. Journal of Chemical Theory and Computation. 10 (7), 2648-2657 (2014).
  15. Husic, B. E., Pande, V. S. Markov State Models: From an Art to a Science. Journal of the American Chemical Society. 140 (7), 2386-2396 (2018).
  16. Sittel, F., Stock, G. Perspective: Identification of collective variables and metastable states of protein dynamics. The Journal of chemical physics. 149 (15), 150901 (2018).
  17. Wang, W., Cao, S., Zhu, L., Huang, X. Constructing Markov State Models to elucidate the functional conformational changes of complex biomolecules. WIREs Computational Molecular Science. 8, 1343 (2018).
  18. Peng, S., et al. Target search and recognition mechanisms of glycosylase AlkD revealed by scanning FRET-FCS and Markov state models. Proceedings of the National Academy of Sciences of the United States of America. 117 (36), 21889-21895 (2020).
  19. Tian, J., Wang, L., Da, L. T. Atomic resolution of short-range sliding dynamics of thymine DNA glycosylase along DNA minor-groove for lesion recognition. Nucleic Acids Research. 49 (3), 1278-1293 (2021).
  20. Chu, J. -. W., Izveko, S., Voth, G. The multiscale challenge for biomolecular systems: coarse-grained modeling. Molecular Simulation. 32 (3-4), 211-218 (2006).
  21. Marrink, S. J., Risselada, H. J., Yefimov, S., Tieleman, D. P., De Vries, A. H. The MARTINI force field: coarse grained model for biomolecular simulations. The Journal of Physical Chemistry B. 111 (27), 7812-7824 (2007).
  22. Givaty, O., Levy, Y. Protein sliding along DNA: dynamics and structural characterization. Journal of Molecular Biology. 385 (4), 1087-1097 (2009).
  23. Khazanov, N., Levy, Y. Sliding of p53 along DNA can be modulated by its oligomeric state and by cross-talks between its constituent domains. Journal of Molecular Biology. 408 (2), 335-355 (2011).
  24. Riniker, S., Allison, J. R., van Gunsteren, W. F. On developing coarse-grained models for biomolecular simulation: a review. Physical Chemistry Chemical Physics : PCCP. 14 (36), 12423-12430 (2012).
  25. Kmiecik, S., et al. Coarse-Grained Protein Models and Their Applications. Chemical Reviews. 116 (14), 7898-7936 (2006).
  26. Bhattacherjee, A., Krepel, D., Levy, Y. Coarse-grained models for studying protein diffusion along DNA. WIREs Computational Molecular Science. 6, 515-531 (2016).
  27. Wang, J., et al. Machine Learning of Coarse-Grained Molecular Dynamics Force Fields. ACS Central Science. 5 (5), 755-767 (2019).
  28. Joshi, S. Y., Deshmukh, S. A. A review of advancements in coarse-grained molecular dynamics simulations. Molecular Simulation. 47 (10-11), 786-803 (2021).
  29. Bigman, L. S., Greenblatt, H. M., Levy, Y. What Are the Molecular Requirements for Protein Sliding along DNA. The Journal of Physical Chemistry B. 125 (12), 3119-3131 (2021).
  30. Kenzaki, H., et al. CafeMol: A Coarse-Grained Biomolecular Simulator for Simulating Proteins at Work. Journal of Chemical Theory and Computation. 7 (6), 1979-1989 (2011).
  31. Berendsen, H. J. C., vander Spoel, D., van Drunen, R. GROMACS: a message-passing parallel molecular dynamics implementation. Computer Physics Communications. 91 (1-3), 43-56 (1995).
  32. vander Spoel, D., et al. GROMACS: fast, flexible, and free. Journal of Computational Chemistry. 26 (16), 1701-1718 (2005).
  33. Abraham, M. J., et al. GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers. SoftwareX. 1-2, 19-25 (2015).
  34. Harrigan, M. P., et al. MSMBuilder: Statistical Models for Biomolecular Dynamics. Biophysical journal. 112 (1), 10-15 (2017).
  35. Humphrey, W., Dalke, A., Schulten, K. VMD: visual molecular dynamics. Journal of Molecular Graphics. 14 (1), 33-38 (1996).
  36. Izrailev, S., et al. Steered Molecular Dynamics. Computational Molecular Dynamics: Challenges, Methods, Ideas. 4, 39-65 (1999).
  37. Schlitter, J., Engels, M., Krüger, P. Targeted molecular dynamics: a new approach for searching pathways of conformational transitions. Journal of Molecular Graphics. 12 (2), 84-89 (1994).
  38. Maragliano, L., Fischer, A., Vanden-Eijnden, E., Ciccotti, G. String method in collective variables: minimum free energy paths and isocommittor surfaces. The Journal of Chemical Physics. 125 (2), 24106 (2006).
  39. Weiss, D. R., Levitt, M. Can morphing methods predict intermediate structures. Journal of Molecular Biology. 385 (2), 665-674 (2009).
  40. Xu, Y. P., Xu, H., Wang, B., Su, X. D. Crystal structures of N-terminal WRKY transcription factors and DNA complexes. Protein. 11 (3), 208-213 (2020).
  41. Higham, D. J., Higham, N. J. MATLAB guide. Society for Industrial and Applied Mathematics. , (2016).
  42. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A K-Means Clustering Algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  43. Gonzalez, T. F. Clustering to minimize the maximum intercluster distance. Theoretical Computer Science. 38, 293-306 (1985).
  44. Zhao, Y., Sheong, F. K., Sun, J., Sander, P., Huang, X. A fast parallel clustering algorithm for molecular simulation trajectories. Journal of Computational Chemistry. 34 (2), 95-104 (2013).
  45. Ivani, I., et al. Parmbsc1: a refined force field for DNA simulations. Nature Methods. 13 (1), 55-58 (2016).
  46. Naritomi, Y., Fuchigami, S. Slow dynamics of a protein backbone in molecular dynamics simulation revealed by time-structure based independent component analysis. The Journal of Chemical Physics. 139 (21), 215102 (2013).
  47. Naritomi, Y., Fuchigami, S. Slow dynamics in protein fluctuations revealed by time-structure based independent component analysis: the case of domain motions. The Journal of Chemical Physics. 134 (6), 065101 (2011).
  48. Pérez-Hernández, G., Paul, F., Giorgino, T., De Fabritiis, G., Noé, F. Identification of slow molecular order parameters for Markov model construction. The Journal of Chemical Physics. 139 (1), 015102 (2013).
  49. McGibbon, R. T., Pande, V. S. Variational cross-validation of slow dynamical modes in molecular kinetics. The Journal of Chemical Physics. 142 (12), 124105 (2015).
  50. Deuflhard, P., Weber, M. Robust Perron cluster analysis in conformation dynamics. Linear Algebra and its Applications. 398, 161-184 (2005).
  51. Silva, D. A., et al. Millisecond dynamics of RNA polymerase II translocation at atomic resolution. Proceedings of the National Academy of Sciences of the United States of America. 111 (21), 7665-7670 (2014).
  52. Swope, W. C., Pitera, J. W., Suits, F. Describing Protein Folding Kinetics by Molecular Dynamics Simulations. 1. Theory. The Journal of Physical Chemistry B. 108 (21), 6571-6581 (2004).
  53. Clementi, C., Nymeyer, H., Onuchic, J. N. Topological and energetic factors: what determines the structural details of the transition state ensemble and "en-route" intermediates for protein folding? An investigation for small globular proteins. Journal of molecular biology. 298 (5), 937-953 (2000).
  54. Hinckley, D. M., Freeman, G. S., Whitmer, J. K., De Pablo, J. J. An experimentally-informed coarse-grained 3-Site-Per-Nucleotide model of DNA: structure, thermodynamics, and dynamics of hybridization. The Journal of chemical physics. 139 (14), 144903 (2013).
  55. Debye, P., Huckel, E. The theory of the electrolyte II-The border law for electrical conductivity. Physikalische Zeitschrift. 24, 305-325 (1923).
  56. Berendsen, H. J., Postma, J. V., van Gunsteren, W. F., DiNola, A., Haak, J. R. Molecular dynamics with coupling to an external bath. The Journal of Chemical Physics. 81, 3684-3690 (1984).
  57. Bowman, G. R. Improved coarse-graining of Markov state models via explicit consideration of statistical uncertainty. The Journal of Chemical Physics. 137 (13), 134111 (2012).
  58. Jain, A., Stock, G. Identifying metastable states of folding proteins. Journal of Chemical Theory and Computation. 8 (10), 3810-3819 (2012).
  59. Röblitz, S., Weber, M. Fuzzy spectral clustering by PCCA+: application to Markov state models and data classification. Advances in Data Analysis and Classification. 7, 147-179 (2013).
  60. Mardt, A., Pasquali, L., Wu, H., Noé, F. VAMPnets for deep learning of molecular kinetics. Nature Communications. 9 (1), 5 (2018).
  61. Wang, W., Liang, T., Sheong, F. K., Fan, X., Huang, X. An efficient Bayesian kinetic lumping algorithm to identify metastable conformational states via Gibbs sampling. The Journal of Chemical Physics. 149 (7), 072337 (2018).
  62. Chen, W., Sidky, H., Ferguson, A. L. Nonlinear discovery of slow molecular modes using state-free reversible VAMPnets. The Journal of Chemical Physics. 150 (21), 214114 (2019).
  63. Gu, H., et al. RPnet: a reverse-projection-based neural network for coarse-graining metastable conformational states for protein dynamics. Physical Chemistry Chemical Physics :PCCP. 24 (3), 1462-1474 (2022).
  64. Lane, T. J., Bowman, G. R., Beauchamp, K., Voelz, V. A., Pande, V. S. Markov state model reveals folding and functional dynamics in ultra-long MD trajectories. Journal of the American Chemical Society. 133 (45), 18413-18419 (2011).
  65. Konovalov, K. A., Unarta, I. C., Cao, S., Goonetilleke, E. C., Huang, X. Markov State Models to Study the Functional Dynamics of Proteins in the Wake of Machine Learning. JACS Au. 1 (9), 1330-1341 (2021).
  66. Cao, S., Montoya-Castillo, A., Wang, W., Markland, T. E., Huang, X. On the advantages of exploiting memory in Markov state models for biomolecular dynamics. The Journal of Chemical Physics. 153 (1), 014105 (2020).
  67. Brandani, G. B., Takada, S. Chromatin remodelers couple inchworm motion with twist-defect formation to slide nucleosomal DNA. PLoS Computational Biology. 14 (11), 1006512 (2018).
  68. Tan, C., Terakawa, T., Takada, S. Dynamic Coupling among Protein Binding, Sliding, and DNA Bending Revealed by Molecular Dynamics. Journal of the American Chemical Society. 138 (27), 8512-8522 (2016).
  69. Terakawa, T., Takada, S. p53 dynamics upon response element recognition explored by molecular simulations. Scientific reports. 5, 17107 (2015).
  70. Brandani, G. B., Niina, T., Tan, C., Takada, S. DNA sliding in nucleosomes via twist defect propagation revealed by molecular simulations. Nucleic Acids Research. 46 (6), 2788-2801 (2018).
  71. Knotts, T. A., Rathore, N., Schwartz, D. C., de Pablo, J. J. A coarse grain model for DNA. The Journal of Chemical Physics. 126 (8), 084901 (2007).
  72. Freeman, G. S., Hinckley, D. M., Lequieu, J. P., Whitmer, J. K., de Pablo, J. J. Coarse-grained modeling of DNA curvature. The Journal of Chemical Physics. 141 (16), 165103 (2014).
check_url/63406?article_type=t

Play Video

Cite This Article
E, C., Dai, L., Tian, J., Da, L., Yu, J. Structure-Based Simulation and Sampling of Transcription Factor Protein Movements along DNA from Atomic-Scale Stepping to Coarse-Grained Diffusion. J. Vis. Exp. (181), e63406, doi:10.3791/63406 (2022).

View Video