Summary

Simulação baseada em estrutura e amostragem de movimentos de proteína do fator de transcrição ao longo do DNA de pisando em escala atômica para difusão grosseira

Published: March 01, 2022
doi:

Summary

O objetivo deste protocolo é revelar a dinâmica estrutural da difusão unidimensional de proteína ao longo do DNA, usando um fator de transcrição vegetal proteína de domínio WRKY como um sistema exemplar. Para isso, foram implementadas simulações de dinâmica molecular atomística e grosseira, juntamente com extensas amostras computacionais.

Abstract

O deslizamento unidimensional (1-D) da proteína fator de transcrição (TF) ao longo do DNA é essencial para a difusão facilitada do TF para localizar o local de DNA alvo para regulação genética. Detectar a resolução do par de bases (bp) do TF deslizando ou pisando no DNA ainda é experimentalmente desafiador. Recentemente realizamos simulações de dinâmica molecular de todos os átomos (MD) capturando um passo espontâneo de 1 bp de uma pequena proteína TF de domínio WRKY ao longo do DNA. Com base no caminho de 10 μs WRKY obtido a partir de tais simulações, o protocolo aqui mostra como realizar amostras conformais mais extensas dos sistemas TF-DNA, construindo o modelo de estado markov (MSM) para a pisada de proteína de 1 bp, com vários números de micro e macro-estados testados para a construção do MSM. A fim de examinar a busca difusiva 1D processiva da proteína TF ao longo do DNA com base estrutural, o protocolo mostra ainda como realizar simulações de MD de grãos grosseiros (CG) para amostrar dinâmicas de escala de longo prazo do sistema. Tais modelagem e simulações de CG são particularmente úteis para revelar os impactos eletrostáticos de DNA proteico nos movimentos difusivos processivos da proteína TF acima de dezenas de microssegundos, em comparação com sub-microsegundos a movimentos de pisando proteicos microsegundos revelados a partir das simulações de todos os átomos.

Introduction

Fatores de transcrição (TF) buscam o DNA alvo para vincular e regular a transcrição genética e as atividades relacionadas1. Além da difusão tridimensional (3D), a difusão facilitada de TF tem sido sugerida como essencial para a busca de DNA alvo, na qual as proteínas também podem deslizar ou saltar ao longo do DNA unidimensional (1D) ou saltar com transferência intersegmental no DNA 2,3,4,5,6,7.

Em um estudo recente, realizamos dezenas de microssegundos (μs) de todas as simulações de dinâmica molecular de equilíbrio átomo (MD) em uma planta TF – a proteína de domínio WRKY no DNA8. Um passo completo de 1 bp de WRKY em DNA poli-A dentro de microssegundos foi capturado. Os movimentos da proteína ao longo da dinâmica de quebra de cadeias de DNA e de hidrogênio (HBs) foram observados. Embora tal trajetória represente um caminho amostrado, uma paisagem global de intensificação de proteínas ainda é a falta. Aqui, mostramos como expandir as amostras computacionais ao redor do caminho de avanço proteico inicialmente capturado com o modelo de estado markov construído (MSM), que foram amplamente implementados para simular uma variedade de sistemas biomoleculares envolvendo mudanças conformais substanciais e separação em escala de tempo 9,10,11,12,13,14,15,16, 17,18,19. O objetivo é revelar o conjunto conformacional e os estados meta-estáveis da difusão da proteína TF ao longo do DNA para um passo cíclico.

Enquanto a simulação de MD acima revela a resolução atômica dos movimentos proteicos para 1 bp no DNA, a dinâmica estrutural da difusão processiva de longa data do TF ao longo do DNA na mesma alta resolução dificilmente é acessível. A realização de simulações de MD de grãos grosseiros (CG) ao nível de resíduo é tecnicamente acessível. A escala de tempo de simulação cg pode ser efetivamente estendida para dezenas ou centenas de vezes mais do que as simulações atômicas 20,21,22,23,24,25,26,27,28,29. Aqui, mostramos as simulações de CG conduzidas pela implementação do software CafeMol desenvolvido pelo laboratório Takada30.

No protocolo atual, apresentamos as simulações atômicas da proteína de domínio WRKY ao longo do DNA poli-A e da construção do MSM primeiro, que se concentram na amostragem dos movimentos de intensificação da proteína por apenas 1 bp ao longo do DNA. Em seguida, apresentamos a modelagem CG e simulações do mesmo sistema proteína-DNA, que estendem a amostragem computacional à difusão processiva de proteína sobre dezenas de bps ao longo do DNA.

Aqui, usamos o software GROMACS31,32,33 para realizar simulações de MD e MSMbuilder34 para construir o MSM para instantâneos conformacionais amostrados, bem como para usar o VMD35 para visualizar as biomoléculas. O protocolo exige que o usuário seja capaz de instalar e implementar o software acima. A instalação e implementação do software CafeMol30 é então necessária para a realização das simulações de CG MD. Outras análises das trajetórias e visualização também são realizadas em VMD.

Protocol

1. Construção do modelo de estado markov (MSM) a partir de simulações atômicas de MD Caminho de passo de proteína espontânea e coleta de estruturas iniciais Use uma trajetória de 10 μs md de 10 μs de todos os átomos8 para extrair 10000 quadros uniformemente de um caminho de 1 bp “para a frente” (ou seja, um quadro para cada nanossegundo). O número total de quadros precisa ser suficientemente grande para incluir todas as conformações representativas….

Representative Results

Deslizamento acoplado de rotação ou 1 bp de piso de WRKY da construção msmTodas as conformações proteicas no DNA são mapeadas para o movimento longitudinal X e ângulo de rotação da proteína COM ao longo do DNA (ver Figura 3A). O acoplamento linear desses dois graus indica um passo acoplado de rotação da proteína de domínio WRKY no DNA. As conformações podem ser agrupadas em 3 macroestações (S1, S2 e S3) no MSM. O passo para a frente do WRKY segue entã…

Discussion

Este trabalho aborda como realizar simulações computacionais baseadas em estrutura e amostras para revelar um fator de transcrição ou proteína TF movendo-se ao longo do DNA, não apenas no detalhe atômico da pisada, mas também na difusão processiva, que é essencial para a difusão facilitada de TF na busca de alvos de DNA. Para isso, o modelo de estado markov ou MSM de uma pequena proteína de domínio TF WRKY pisando para 1-bp ao longo de DNA poli-A homogêneo foi construído pela primeira vez, de modo que um c…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabalho foi apoiado pelo NSFC Grant #11775016 e #11635002. JY tem sido apoiado pelo CMCF da UCI via NSF DMS 1763272 e pela Fundação Simons grant #594598 e fundo de start-up da UCI. A LTD foi apoiada pela Natural Science Foundation de Shanghai #20ZR1425400 e #21JC1403100. Também reconhecemos o apoio computacional do Centro de Pesquisa em Ciência Computacional de Pequim (CSRC).

Materials

CafeMol Kyoto University coarse-grained (CG) simulations
GROMACS University of Groningen Royal Institute of Technology Uppsala University molecular dynamics simulations software
Matlab MathWorks Numerical calculation software
MSMbuilder Stanford University build MSM
VMD UNIVERSITY OF ILLINOIS AT URBANA-CHAMPAIGN molecular visualization program

References

  1. Latchman, D. S. Transcription factors: an overview. The International Journal of Biochemistry & Cell Biology. 29 (12), 1305-1312 (1997).
  2. Berg, O. G., von Hippel, P. H. Selection of DNA binding sites by regulatory proteins. Statistical-mechanical theory and application to operators and promoters. Journal of Molecular Biology. 193 (4), 723-750 (1987).
  3. von Hippel, P. H., Berg, O. G. Facilitated target location in biological systems. The Journal of Biological Chemistry. 264 (2), 675-678 (1989).
  4. Halford, S. E., Marko, J. F. How do site-specific DNA-binding proteins find their targets. Nucleic Acids Research. 32 (10), 3040-3052 (2004).
  5. Slusky, M., Mirny, L. A. Kinetics of protein-DNA interaction: facilitated target location in sequence-dependent potential. Biophysical Journal. 87 (6), 4021-4035 (2004).
  6. Bauer, M., Metzler, R. Generalized facilitated diffusion model for DNA-binding proteins with search and recognition states. Biophysical Journal. 102 (10), 2321-2330 (2012).
  7. Shvets, A. A., Kochugaeva, M. P., Kolomeisky, A. B. Mechanisms of Protein Search for Targets on DNA: Theoretical Insights. Molecules. 23 (9), 2106 (2018).
  8. Dai, L., Xu, Y., Du, Z., Su, X. D., Yu, J. Revealing atomic-scale molecular diffusion of a plant-transcription factor WRKY domain protein along DNA. Proceedings of the National Academy of Sciences of the United States of America. 118 (23), 2102621118 (2021).
  9. Chodera, J. D., Singhal, N., Pande, V. S., Dill, K. A., Swope, W. C. Automatic discovery of metastable states for the construction of Markov models of macromolecular conformational dynamics. The Journal of Chemical Physics. 126 (15), 155101 (2007).
  10. Pan, A. C., Roux, B. Building Markov state models along pathways to determine free energies and rates of transitions. The Journal of Chemical Physics. 129 (6), 064107 (2008).
  11. Bowman, G. R., Huang, X., Pande, V. S. Using generalized ensemble simulations and Markov state models to identify conformational states. Methods. 49 (2), 197-201 (2009).
  12. Prinz, J. H., et al. Markov models of molecular kinetics: Generation and validation. The Journal of chemical physics. 134 (17), 174105 (2011).
  13. Chodera, J. D., Noé, F. Markov state models of biomolecular conformational dynamics. Current Opinion in Structural Biology. 25, 135-144 (2014).
  14. Malmstrom, R. D., Lee, C. T., Van Wart, A. T., Amaro, R. E. On the Application of Molecular-Dynamics Based Markov State Models to Functional Proteins. Journal of Chemical Theory and Computation. 10 (7), 2648-2657 (2014).
  15. Husic, B. E., Pande, V. S. Markov State Models: From an Art to a Science. Journal of the American Chemical Society. 140 (7), 2386-2396 (2018).
  16. Sittel, F., Stock, G. Perspective: Identification of collective variables and metastable states of protein dynamics. The Journal of chemical physics. 149 (15), 150901 (2018).
  17. Wang, W., Cao, S., Zhu, L., Huang, X. Constructing Markov State Models to elucidate the functional conformational changes of complex biomolecules. WIREs Computational Molecular Science. 8, 1343 (2018).
  18. Peng, S., et al. Target search and recognition mechanisms of glycosylase AlkD revealed by scanning FRET-FCS and Markov state models. Proceedings of the National Academy of Sciences of the United States of America. 117 (36), 21889-21895 (2020).
  19. Tian, J., Wang, L., Da, L. T. Atomic resolution of short-range sliding dynamics of thymine DNA glycosylase along DNA minor-groove for lesion recognition. Nucleic Acids Research. 49 (3), 1278-1293 (2021).
  20. Chu, J. -. W., Izveko, S., Voth, G. The multiscale challenge for biomolecular systems: coarse-grained modeling. Molecular Simulation. 32 (3-4), 211-218 (2006).
  21. Marrink, S. J., Risselada, H. J., Yefimov, S., Tieleman, D. P., De Vries, A. H. The MARTINI force field: coarse grained model for biomolecular simulations. The Journal of Physical Chemistry B. 111 (27), 7812-7824 (2007).
  22. Givaty, O., Levy, Y. Protein sliding along DNA: dynamics and structural characterization. Journal of Molecular Biology. 385 (4), 1087-1097 (2009).
  23. Khazanov, N., Levy, Y. Sliding of p53 along DNA can be modulated by its oligomeric state and by cross-talks between its constituent domains. Journal of Molecular Biology. 408 (2), 335-355 (2011).
  24. Riniker, S., Allison, J. R., van Gunsteren, W. F. On developing coarse-grained models for biomolecular simulation: a review. Physical Chemistry Chemical Physics : PCCP. 14 (36), 12423-12430 (2012).
  25. Kmiecik, S., et al. Coarse-Grained Protein Models and Their Applications. Chemical Reviews. 116 (14), 7898-7936 (2006).
  26. Bhattacherjee, A., Krepel, D., Levy, Y. Coarse-grained models for studying protein diffusion along DNA. WIREs Computational Molecular Science. 6, 515-531 (2016).
  27. Wang, J., et al. Machine Learning of Coarse-Grained Molecular Dynamics Force Fields. ACS Central Science. 5 (5), 755-767 (2019).
  28. Joshi, S. Y., Deshmukh, S. A. A review of advancements in coarse-grained molecular dynamics simulations. Molecular Simulation. 47 (10-11), 786-803 (2021).
  29. Bigman, L. S., Greenblatt, H. M., Levy, Y. What Are the Molecular Requirements for Protein Sliding along DNA. The Journal of Physical Chemistry B. 125 (12), 3119-3131 (2021).
  30. Kenzaki, H., et al. CafeMol: A Coarse-Grained Biomolecular Simulator for Simulating Proteins at Work. Journal of Chemical Theory and Computation. 7 (6), 1979-1989 (2011).
  31. Berendsen, H. J. C., vander Spoel, D., van Drunen, R. GROMACS: a message-passing parallel molecular dynamics implementation. Computer Physics Communications. 91 (1-3), 43-56 (1995).
  32. vander Spoel, D., et al. GROMACS: fast, flexible, and free. Journal of Computational Chemistry. 26 (16), 1701-1718 (2005).
  33. Abraham, M. J., et al. GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers. SoftwareX. 1-2, 19-25 (2015).
  34. Harrigan, M. P., et al. MSMBuilder: Statistical Models for Biomolecular Dynamics. Biophysical journal. 112 (1), 10-15 (2017).
  35. Humphrey, W., Dalke, A., Schulten, K. VMD: visual molecular dynamics. Journal of Molecular Graphics. 14 (1), 33-38 (1996).
  36. Izrailev, S., et al. Steered Molecular Dynamics. Computational Molecular Dynamics: Challenges, Methods, Ideas. 4, 39-65 (1999).
  37. Schlitter, J., Engels, M., Krüger, P. Targeted molecular dynamics: a new approach for searching pathways of conformational transitions. Journal of Molecular Graphics. 12 (2), 84-89 (1994).
  38. Maragliano, L., Fischer, A., Vanden-Eijnden, E., Ciccotti, G. String method in collective variables: minimum free energy paths and isocommittor surfaces. The Journal of Chemical Physics. 125 (2), 24106 (2006).
  39. Weiss, D. R., Levitt, M. Can morphing methods predict intermediate structures. Journal of Molecular Biology. 385 (2), 665-674 (2009).
  40. Xu, Y. P., Xu, H., Wang, B., Su, X. D. Crystal structures of N-terminal WRKY transcription factors and DNA complexes. Protein. 11 (3), 208-213 (2020).
  41. Higham, D. J., Higham, N. J. MATLAB guide. Society for Industrial and Applied Mathematics. , (2016).
  42. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A K-Means Clustering Algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  43. Gonzalez, T. F. Clustering to minimize the maximum intercluster distance. Theoretical Computer Science. 38, 293-306 (1985).
  44. Zhao, Y., Sheong, F. K., Sun, J., Sander, P., Huang, X. A fast parallel clustering algorithm for molecular simulation trajectories. Journal of Computational Chemistry. 34 (2), 95-104 (2013).
  45. Ivani, I., et al. Parmbsc1: a refined force field for DNA simulations. Nature Methods. 13 (1), 55-58 (2016).
  46. Naritomi, Y., Fuchigami, S. Slow dynamics of a protein backbone in molecular dynamics simulation revealed by time-structure based independent component analysis. The Journal of Chemical Physics. 139 (21), 215102 (2013).
  47. Naritomi, Y., Fuchigami, S. Slow dynamics in protein fluctuations revealed by time-structure based independent component analysis: the case of domain motions. The Journal of Chemical Physics. 134 (6), 065101 (2011).
  48. Pérez-Hernández, G., Paul, F., Giorgino, T., De Fabritiis, G., Noé, F. Identification of slow molecular order parameters for Markov model construction. The Journal of Chemical Physics. 139 (1), 015102 (2013).
  49. McGibbon, R. T., Pande, V. S. Variational cross-validation of slow dynamical modes in molecular kinetics. The Journal of Chemical Physics. 142 (12), 124105 (2015).
  50. Deuflhard, P., Weber, M. Robust Perron cluster analysis in conformation dynamics. Linear Algebra and its Applications. 398, 161-184 (2005).
  51. Silva, D. A., et al. Millisecond dynamics of RNA polymerase II translocation at atomic resolution. Proceedings of the National Academy of Sciences of the United States of America. 111 (21), 7665-7670 (2014).
  52. Swope, W. C., Pitera, J. W., Suits, F. Describing Protein Folding Kinetics by Molecular Dynamics Simulations. 1. Theory. The Journal of Physical Chemistry B. 108 (21), 6571-6581 (2004).
  53. Clementi, C., Nymeyer, H., Onuchic, J. N. Topological and energetic factors: what determines the structural details of the transition state ensemble and "en-route" intermediates for protein folding? An investigation for small globular proteins. Journal of molecular biology. 298 (5), 937-953 (2000).
  54. Hinckley, D. M., Freeman, G. S., Whitmer, J. K., De Pablo, J. J. An experimentally-informed coarse-grained 3-Site-Per-Nucleotide model of DNA: structure, thermodynamics, and dynamics of hybridization. The Journal of chemical physics. 139 (14), 144903 (2013).
  55. Debye, P., Huckel, E. The theory of the electrolyte II-The border law for electrical conductivity. Physikalische Zeitschrift. 24, 305-325 (1923).
  56. Berendsen, H. J., Postma, J. V., van Gunsteren, W. F., DiNola, A., Haak, J. R. Molecular dynamics with coupling to an external bath. The Journal of Chemical Physics. 81, 3684-3690 (1984).
  57. Bowman, G. R. Improved coarse-graining of Markov state models via explicit consideration of statistical uncertainty. The Journal of Chemical Physics. 137 (13), 134111 (2012).
  58. Jain, A., Stock, G. Identifying metastable states of folding proteins. Journal of Chemical Theory and Computation. 8 (10), 3810-3819 (2012).
  59. Röblitz, S., Weber, M. Fuzzy spectral clustering by PCCA+: application to Markov state models and data classification. Advances in Data Analysis and Classification. 7, 147-179 (2013).
  60. Mardt, A., Pasquali, L., Wu, H., Noé, F. VAMPnets for deep learning of molecular kinetics. Nature Communications. 9 (1), 5 (2018).
  61. Wang, W., Liang, T., Sheong, F. K., Fan, X., Huang, X. An efficient Bayesian kinetic lumping algorithm to identify metastable conformational states via Gibbs sampling. The Journal of Chemical Physics. 149 (7), 072337 (2018).
  62. Chen, W., Sidky, H., Ferguson, A. L. Nonlinear discovery of slow molecular modes using state-free reversible VAMPnets. The Journal of Chemical Physics. 150 (21), 214114 (2019).
  63. Gu, H., et al. RPnet: a reverse-projection-based neural network for coarse-graining metastable conformational states for protein dynamics. Physical Chemistry Chemical Physics :PCCP. 24 (3), 1462-1474 (2022).
  64. Lane, T. J., Bowman, G. R., Beauchamp, K., Voelz, V. A., Pande, V. S. Markov state model reveals folding and functional dynamics in ultra-long MD trajectories. Journal of the American Chemical Society. 133 (45), 18413-18419 (2011).
  65. Konovalov, K. A., Unarta, I. C., Cao, S., Goonetilleke, E. C., Huang, X. Markov State Models to Study the Functional Dynamics of Proteins in the Wake of Machine Learning. JACS Au. 1 (9), 1330-1341 (2021).
  66. Cao, S., Montoya-Castillo, A., Wang, W., Markland, T. E., Huang, X. On the advantages of exploiting memory in Markov state models for biomolecular dynamics. The Journal of Chemical Physics. 153 (1), 014105 (2020).
  67. Brandani, G. B., Takada, S. Chromatin remodelers couple inchworm motion with twist-defect formation to slide nucleosomal DNA. PLoS Computational Biology. 14 (11), 1006512 (2018).
  68. Tan, C., Terakawa, T., Takada, S. Dynamic Coupling among Protein Binding, Sliding, and DNA Bending Revealed by Molecular Dynamics. Journal of the American Chemical Society. 138 (27), 8512-8522 (2016).
  69. Terakawa, T., Takada, S. p53 dynamics upon response element recognition explored by molecular simulations. Scientific reports. 5, 17107 (2015).
  70. Brandani, G. B., Niina, T., Tan, C., Takada, S. DNA sliding in nucleosomes via twist defect propagation revealed by molecular simulations. Nucleic Acids Research. 46 (6), 2788-2801 (2018).
  71. Knotts, T. A., Rathore, N., Schwartz, D. C., de Pablo, J. J. A coarse grain model for DNA. The Journal of Chemical Physics. 126 (8), 084901 (2007).
  72. Freeman, G. S., Hinckley, D. M., Lequieu, J. P., Whitmer, J. K., de Pablo, J. J. Coarse-grained modeling of DNA curvature. The Journal of Chemical Physics. 141 (16), 165103 (2014).
check_url/63406?article_type=t

Play Video

Cite This Article
E, C., Dai, L., Tian, J., Da, L., Yu, J. Structure-Based Simulation and Sampling of Transcription Factor Protein Movements along DNA from Atomic-Scale Stepping to Coarse-Grained Diffusion. J. Vis. Exp. (181), e63406, doi:10.3791/63406 (2022).

View Video