Summary

구조 기반 시뮬레이션 및 원자 스케일 스테핑에서 거친 입자 확산에 이르기까지 DNA를 따른 전사 인자 단백질 움직임의 샘플링

Published: March 01, 2022
doi:

Summary

이 프로토콜의 목표는 식물 전사 인자 WRKY 도메인 단백질을 모범적 인 시스템으로 사용하여 DNA를 따라 단백질의 일차원 확산의 구조적 역학을 밝히는 것입니다. 이를 위해 원자 론적 및 거친 입자 역학 시뮬레이션과 광범위한 계산 샘플링이 구현되었습니다.

Abstract

DNA를 따라 전사 인자 (TF) 단백질의 1차원 (1-D) 슬라이딩은 유전자 조절을 위한 표적 DNA 부위를 찾기 위한 TF의 확산을 용이하게 하는데 필수적이다. DNA를 슬라이딩하거나 밟는 TF의 염기쌍(bp) 분해능을 검출하는 것은 여전히 실험적으로 어려운 과제이다. 우리는 최근에 DNA를 따라 작은 WRKY 도메인 TF 단백질의 자발적인 1-bp 스테핑을 포착하는 모든 원자 분자 역학 (MD) 시뮬레이션을 수행했습니다. 이러한 시뮬레이션으로부터 수득된 10μs WRKY 스테핑 경로에 기초하여, 여기의 프로토콜은 MSM 구축을 위해 시험된 다양한 수의 마이크로- 및 매크로-상태와 함께 1-bp 단백질 스테핑을 위한 마르코프 상태 모델(MSM)을 구성함으로써, TF-DNA 시스템의 보다 광범위한 입체 형태 샘플링을 수행하는 방법을 보여준다. DNA와 함께 TF 단백질의 처리적인 1-D 확산 탐색을 구조적 기초와 함께 검사하기 위해, 프로토콜은 시스템의 장시간 스케일 다이내믹을 샘플링하기 위해 거친 그레인 (CG) MD 시뮬레이션을 수행하는 방법을 추가로 보여줍니다. 이러한 CG 모델링 및 시뮬레이션은 모든 원자 시뮬레이션으로부터 밝혀진 서브마이크로초 내지 마이크로초 단백질 스테핑 모션과 비교하여 수십 마이크로초 이상의 TF 단백질의 처리적 확산 운동에 대한 단백질-DNA 정전기적 영향을 밝히는데 특히 유용하다.

Introduction

전사 인자 (TF)는 유전자 전사 및 관련 활성에 결합하고 조절하기 위해 표적 DNA를 검색한다1. 3차원 (3D) 확산 이외에도, TF의 촉진된 확산은 표적 DNA 탐색에 필수적인 것으로 제안되었으며, 여기서 단백질은 또한 1차원 (1D) DNA를 따라 미끄러 지거나 홉 또는 DNA 2,3,4,5,6,7 상의 분절 간 전달로 점프할 수 있다.

최근 연구에서, 우리는 DNA8 상의 WRKY 도메인 단백질인 식물 TF에 대해 수십 마이크로초(μs) 모든 원자 평형 분자 역학(MD) 시뮬레이션을 수행하였다. 마이크로초 내에 폴리-A DNA에 대한 WRKY의 완전한 1-bp 스테핑이 포착되었다. DNA 홈과 수소 결합 (HBs)을 따라 단백질의 움직임이 파괴 – 개질 역학이 관찰되었습니다. 이러한 궤적은 하나의 샘플링 된 경로를 나타내는 반면, 전체 단백질 스테핑 환경은 여전히 부족합니다. 여기에서, 우리는 실질적인 형태 변화 및 시간 척도 분리를 포함하는 다양한 생체 분자 시스템을 시뮬레이션하기 위해 널리 구현 된 건설 된 Markov 상태 모델 (MSM)을 사용하여 초기 포획 된 단백질 스테핑 경로 주위에서 계산 샘플링을 확장하는 방법을 보여줍니다 9,10,11,12,13,14,15,16, 17,18,19. 목적은 하나의 순환 단계를 위해 DNA를 따라 확산된 TF 단백질의 형태적 앙상블 및 메타-안정 상태를 밝히는 것이다.

위의 MD 시뮬레이션은 DNA 상에서 1bp에 대한 단백질 이동의 원자 분해능을 나타내지만, 동일한 고해상도에서 DNA를 따라 TF의 오랜 시간 공정 확산의 구조적 역학은 거의 접근 할 수 없다. 그러나 잔류 물 수준에서 거친 그레인 (CG) MD 시뮬레이션을 수행하는 것은 기술적으로 접근 할 수 있습니다. CG 시뮬레이션 시간 척도는 원자 시뮬레이션 20,21,22,23,24,25,26,27,28,29보다 수십 배 또는 수백 배 더 길게 효과적으로 확장될 수 있다. 여기서는 타카다 랩30에서 개발한 CafeMol 소프트웨어를 구현하여 수행한 CG 시뮬레이션을 보여줍니다.

현재 프로토콜에서는 폴리-A DNA와 MSM 구축을 따라 WRKY 도메인 단백질의 원자 시뮬레이션을 먼저 제시하며, 이는 DNA를 따라 단지 1 bp에 대한 단백질 스테핑 모션을 샘플링하는 데 중점을 둡니다. 그런 다음 동일한 단백질-DNA 시스템의 CG 모델링 및 시뮬레이션을 제시하여 전산 샘플링을 DNA를 따라 수십 bps에 걸쳐 단백질 처리 확산으로 확장합니다.

여기서, 우리는 GROMACS 31,32,33 소프트웨어를 사용하여 MD 시뮬레이션을 수행하고 MSMbuilder 34를 사용하여 샘플링 된 형태 스냅 샷을위한 MSM을 구성하고 VMD 35를 사용하여 생체 분자를 시각화합니다. 이 프로토콜은 사용자가 위의 소프트웨어를 설치하고 구현할 수 있어야합니다. CafeMol30 소프트웨어의 설치 및 구현은 CG MD 시뮬레이션을 수행하는 데 필요합니다. 궤적 및 시각화에 대한 추가 분석도 VMD에서 수행됩니다.

Protocol

1. 원자 MD 시뮬레이션에서 마르코프 상태 모델 (MSM)의 구축 자발적인 단백질 스테핑 경로 및 초기 구조 수집 이전에 수득된 10-μs 전원자 MD 궤적8 을 사용하여 “순방향” 1-bp 스테핑 경로(즉, 각 나노초마다 하나의 프레임)로부터 10000개의 프레임을 고르게 추출한다. 프레임의 총 수는 모든 대표적인 형태를 포함하기에 충분히 커야 한다. 파일 …

Representative Results

MSM 구조에서 WRKY의 회전 결합 슬라이딩 또는 1bp 스테핑DNA 상의 모든 단백질 입체형태는 DNA를 따라 단백질 COM의 종방향 이동 X 및 회전 각도에 매핑된다( 도 3A 참조). 이 두 도의 선형 결합은 DNA 상의 WRKY 도메인 단백질의 회전 결합 스테핑을 나타낸다. 상기 형태들은 MSM에서 3개의 매크로스테이트들(S1, S2, 및 S3)로 더 클러스터링될 수 있다. WRKY의 전진 단계는 매?…

Discussion

이 작업은 구조 기반 계산 시뮬레이션 및 샘플링을 수행하여 DNA를 따라 이동하는 전사 인자 또는 TF 단백질을 스테핑의 원자 세부 사항뿐만 아니라 DNA 표적 검색에서 TF의 촉진 확산에 필수적인 프로세스 확산에서도 밝히는 방법을 다룹니다. 이를 위해, 균질한 폴리-A DNA를 따라 1-bp를 밟는 작은 TF 도메인 단백질 WRKY 스테핑의 마르코프 상태 모델 또는 MSM이 먼저 구축되어, 단백질-DNA 계면에서의 집?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

이 작업은 NSFC Grant #11775016 및 #11635002에서 지원되었습니다. JY는 NSF DMS 1763272와 UCI의 Simons Foundation 보조금 #594598 및 창업 기금을 통해 UCI의 CMCF의 지원을 받았습니다. LTD는 상하이 #20ZR1425400 및 #21JC1403100의 자연 과학 재단의 지원을 받고 있습니다. 우리는 또한 베이징 전산 과학 연구 센터 (CSRC)의 전산 지원을 인정합니다.

Materials

CafeMol Kyoto University coarse-grained (CG) simulations
GROMACS University of Groningen Royal Institute of Technology Uppsala University molecular dynamics simulations software
Matlab MathWorks Numerical calculation software
MSMbuilder Stanford University build MSM
VMD UNIVERSITY OF ILLINOIS AT URBANA-CHAMPAIGN molecular visualization program

References

  1. Latchman, D. S. Transcription factors: an overview. The International Journal of Biochemistry & Cell Biology. 29 (12), 1305-1312 (1997).
  2. Berg, O. G., von Hippel, P. H. Selection of DNA binding sites by regulatory proteins. Statistical-mechanical theory and application to operators and promoters. Journal of Molecular Biology. 193 (4), 723-750 (1987).
  3. von Hippel, P. H., Berg, O. G. Facilitated target location in biological systems. The Journal of Biological Chemistry. 264 (2), 675-678 (1989).
  4. Halford, S. E., Marko, J. F. How do site-specific DNA-binding proteins find their targets. Nucleic Acids Research. 32 (10), 3040-3052 (2004).
  5. Slusky, M., Mirny, L. A. Kinetics of protein-DNA interaction: facilitated target location in sequence-dependent potential. Biophysical Journal. 87 (6), 4021-4035 (2004).
  6. Bauer, M., Metzler, R. Generalized facilitated diffusion model for DNA-binding proteins with search and recognition states. Biophysical Journal. 102 (10), 2321-2330 (2012).
  7. Shvets, A. A., Kochugaeva, M. P., Kolomeisky, A. B. Mechanisms of Protein Search for Targets on DNA: Theoretical Insights. Molecules. 23 (9), 2106 (2018).
  8. Dai, L., Xu, Y., Du, Z., Su, X. D., Yu, J. Revealing atomic-scale molecular diffusion of a plant-transcription factor WRKY domain protein along DNA. Proceedings of the National Academy of Sciences of the United States of America. 118 (23), 2102621118 (2021).
  9. Chodera, J. D., Singhal, N., Pande, V. S., Dill, K. A., Swope, W. C. Automatic discovery of metastable states for the construction of Markov models of macromolecular conformational dynamics. The Journal of Chemical Physics. 126 (15), 155101 (2007).
  10. Pan, A. C., Roux, B. Building Markov state models along pathways to determine free energies and rates of transitions. The Journal of Chemical Physics. 129 (6), 064107 (2008).
  11. Bowman, G. R., Huang, X., Pande, V. S. Using generalized ensemble simulations and Markov state models to identify conformational states. Methods. 49 (2), 197-201 (2009).
  12. Prinz, J. H., et al. Markov models of molecular kinetics: Generation and validation. The Journal of chemical physics. 134 (17), 174105 (2011).
  13. Chodera, J. D., Noé, F. Markov state models of biomolecular conformational dynamics. Current Opinion in Structural Biology. 25, 135-144 (2014).
  14. Malmstrom, R. D., Lee, C. T., Van Wart, A. T., Amaro, R. E. On the Application of Molecular-Dynamics Based Markov State Models to Functional Proteins. Journal of Chemical Theory and Computation. 10 (7), 2648-2657 (2014).
  15. Husic, B. E., Pande, V. S. Markov State Models: From an Art to a Science. Journal of the American Chemical Society. 140 (7), 2386-2396 (2018).
  16. Sittel, F., Stock, G. Perspective: Identification of collective variables and metastable states of protein dynamics. The Journal of chemical physics. 149 (15), 150901 (2018).
  17. Wang, W., Cao, S., Zhu, L., Huang, X. Constructing Markov State Models to elucidate the functional conformational changes of complex biomolecules. WIREs Computational Molecular Science. 8, 1343 (2018).
  18. Peng, S., et al. Target search and recognition mechanisms of glycosylase AlkD revealed by scanning FRET-FCS and Markov state models. Proceedings of the National Academy of Sciences of the United States of America. 117 (36), 21889-21895 (2020).
  19. Tian, J., Wang, L., Da, L. T. Atomic resolution of short-range sliding dynamics of thymine DNA glycosylase along DNA minor-groove for lesion recognition. Nucleic Acids Research. 49 (3), 1278-1293 (2021).
  20. Chu, J. -. W., Izveko, S., Voth, G. The multiscale challenge for biomolecular systems: coarse-grained modeling. Molecular Simulation. 32 (3-4), 211-218 (2006).
  21. Marrink, S. J., Risselada, H. J., Yefimov, S., Tieleman, D. P., De Vries, A. H. The MARTINI force field: coarse grained model for biomolecular simulations. The Journal of Physical Chemistry B. 111 (27), 7812-7824 (2007).
  22. Givaty, O., Levy, Y. Protein sliding along DNA: dynamics and structural characterization. Journal of Molecular Biology. 385 (4), 1087-1097 (2009).
  23. Khazanov, N., Levy, Y. Sliding of p53 along DNA can be modulated by its oligomeric state and by cross-talks between its constituent domains. Journal of Molecular Biology. 408 (2), 335-355 (2011).
  24. Riniker, S., Allison, J. R., van Gunsteren, W. F. On developing coarse-grained models for biomolecular simulation: a review. Physical Chemistry Chemical Physics : PCCP. 14 (36), 12423-12430 (2012).
  25. Kmiecik, S., et al. Coarse-Grained Protein Models and Their Applications. Chemical Reviews. 116 (14), 7898-7936 (2006).
  26. Bhattacherjee, A., Krepel, D., Levy, Y. Coarse-grained models for studying protein diffusion along DNA. WIREs Computational Molecular Science. 6, 515-531 (2016).
  27. Wang, J., et al. Machine Learning of Coarse-Grained Molecular Dynamics Force Fields. ACS Central Science. 5 (5), 755-767 (2019).
  28. Joshi, S. Y., Deshmukh, S. A. A review of advancements in coarse-grained molecular dynamics simulations. Molecular Simulation. 47 (10-11), 786-803 (2021).
  29. Bigman, L. S., Greenblatt, H. M., Levy, Y. What Are the Molecular Requirements for Protein Sliding along DNA. The Journal of Physical Chemistry B. 125 (12), 3119-3131 (2021).
  30. Kenzaki, H., et al. CafeMol: A Coarse-Grained Biomolecular Simulator for Simulating Proteins at Work. Journal of Chemical Theory and Computation. 7 (6), 1979-1989 (2011).
  31. Berendsen, H. J. C., vander Spoel, D., van Drunen, R. GROMACS: a message-passing parallel molecular dynamics implementation. Computer Physics Communications. 91 (1-3), 43-56 (1995).
  32. vander Spoel, D., et al. GROMACS: fast, flexible, and free. Journal of Computational Chemistry. 26 (16), 1701-1718 (2005).
  33. Abraham, M. J., et al. GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers. SoftwareX. 1-2, 19-25 (2015).
  34. Harrigan, M. P., et al. MSMBuilder: Statistical Models for Biomolecular Dynamics. Biophysical journal. 112 (1), 10-15 (2017).
  35. Humphrey, W., Dalke, A., Schulten, K. VMD: visual molecular dynamics. Journal of Molecular Graphics. 14 (1), 33-38 (1996).
  36. Izrailev, S., et al. Steered Molecular Dynamics. Computational Molecular Dynamics: Challenges, Methods, Ideas. 4, 39-65 (1999).
  37. Schlitter, J., Engels, M., Krüger, P. Targeted molecular dynamics: a new approach for searching pathways of conformational transitions. Journal of Molecular Graphics. 12 (2), 84-89 (1994).
  38. Maragliano, L., Fischer, A., Vanden-Eijnden, E., Ciccotti, G. String method in collective variables: minimum free energy paths and isocommittor surfaces. The Journal of Chemical Physics. 125 (2), 24106 (2006).
  39. Weiss, D. R., Levitt, M. Can morphing methods predict intermediate structures. Journal of Molecular Biology. 385 (2), 665-674 (2009).
  40. Xu, Y. P., Xu, H., Wang, B., Su, X. D. Crystal structures of N-terminal WRKY transcription factors and DNA complexes. Protein. 11 (3), 208-213 (2020).
  41. Higham, D. J., Higham, N. J. MATLAB guide. Society for Industrial and Applied Mathematics. , (2016).
  42. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A K-Means Clustering Algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  43. Gonzalez, T. F. Clustering to minimize the maximum intercluster distance. Theoretical Computer Science. 38, 293-306 (1985).
  44. Zhao, Y., Sheong, F. K., Sun, J., Sander, P., Huang, X. A fast parallel clustering algorithm for molecular simulation trajectories. Journal of Computational Chemistry. 34 (2), 95-104 (2013).
  45. Ivani, I., et al. Parmbsc1: a refined force field for DNA simulations. Nature Methods. 13 (1), 55-58 (2016).
  46. Naritomi, Y., Fuchigami, S. Slow dynamics of a protein backbone in molecular dynamics simulation revealed by time-structure based independent component analysis. The Journal of Chemical Physics. 139 (21), 215102 (2013).
  47. Naritomi, Y., Fuchigami, S. Slow dynamics in protein fluctuations revealed by time-structure based independent component analysis: the case of domain motions. The Journal of Chemical Physics. 134 (6), 065101 (2011).
  48. Pérez-Hernández, G., Paul, F., Giorgino, T., De Fabritiis, G., Noé, F. Identification of slow molecular order parameters for Markov model construction. The Journal of Chemical Physics. 139 (1), 015102 (2013).
  49. McGibbon, R. T., Pande, V. S. Variational cross-validation of slow dynamical modes in molecular kinetics. The Journal of Chemical Physics. 142 (12), 124105 (2015).
  50. Deuflhard, P., Weber, M. Robust Perron cluster analysis in conformation dynamics. Linear Algebra and its Applications. 398, 161-184 (2005).
  51. Silva, D. A., et al. Millisecond dynamics of RNA polymerase II translocation at atomic resolution. Proceedings of the National Academy of Sciences of the United States of America. 111 (21), 7665-7670 (2014).
  52. Swope, W. C., Pitera, J. W., Suits, F. Describing Protein Folding Kinetics by Molecular Dynamics Simulations. 1. Theory. The Journal of Physical Chemistry B. 108 (21), 6571-6581 (2004).
  53. Clementi, C., Nymeyer, H., Onuchic, J. N. Topological and energetic factors: what determines the structural details of the transition state ensemble and "en-route" intermediates for protein folding? An investigation for small globular proteins. Journal of molecular biology. 298 (5), 937-953 (2000).
  54. Hinckley, D. M., Freeman, G. S., Whitmer, J. K., De Pablo, J. J. An experimentally-informed coarse-grained 3-Site-Per-Nucleotide model of DNA: structure, thermodynamics, and dynamics of hybridization. The Journal of chemical physics. 139 (14), 144903 (2013).
  55. Debye, P., Huckel, E. The theory of the electrolyte II-The border law for electrical conductivity. Physikalische Zeitschrift. 24, 305-325 (1923).
  56. Berendsen, H. J., Postma, J. V., van Gunsteren, W. F., DiNola, A., Haak, J. R. Molecular dynamics with coupling to an external bath. The Journal of Chemical Physics. 81, 3684-3690 (1984).
  57. Bowman, G. R. Improved coarse-graining of Markov state models via explicit consideration of statistical uncertainty. The Journal of Chemical Physics. 137 (13), 134111 (2012).
  58. Jain, A., Stock, G. Identifying metastable states of folding proteins. Journal of Chemical Theory and Computation. 8 (10), 3810-3819 (2012).
  59. Röblitz, S., Weber, M. Fuzzy spectral clustering by PCCA+: application to Markov state models and data classification. Advances in Data Analysis and Classification. 7, 147-179 (2013).
  60. Mardt, A., Pasquali, L., Wu, H., Noé, F. VAMPnets for deep learning of molecular kinetics. Nature Communications. 9 (1), 5 (2018).
  61. Wang, W., Liang, T., Sheong, F. K., Fan, X., Huang, X. An efficient Bayesian kinetic lumping algorithm to identify metastable conformational states via Gibbs sampling. The Journal of Chemical Physics. 149 (7), 072337 (2018).
  62. Chen, W., Sidky, H., Ferguson, A. L. Nonlinear discovery of slow molecular modes using state-free reversible VAMPnets. The Journal of Chemical Physics. 150 (21), 214114 (2019).
  63. Gu, H., et al. RPnet: a reverse-projection-based neural network for coarse-graining metastable conformational states for protein dynamics. Physical Chemistry Chemical Physics :PCCP. 24 (3), 1462-1474 (2022).
  64. Lane, T. J., Bowman, G. R., Beauchamp, K., Voelz, V. A., Pande, V. S. Markov state model reveals folding and functional dynamics in ultra-long MD trajectories. Journal of the American Chemical Society. 133 (45), 18413-18419 (2011).
  65. Konovalov, K. A., Unarta, I. C., Cao, S., Goonetilleke, E. C., Huang, X. Markov State Models to Study the Functional Dynamics of Proteins in the Wake of Machine Learning. JACS Au. 1 (9), 1330-1341 (2021).
  66. Cao, S., Montoya-Castillo, A., Wang, W., Markland, T. E., Huang, X. On the advantages of exploiting memory in Markov state models for biomolecular dynamics. The Journal of Chemical Physics. 153 (1), 014105 (2020).
  67. Brandani, G. B., Takada, S. Chromatin remodelers couple inchworm motion with twist-defect formation to slide nucleosomal DNA. PLoS Computational Biology. 14 (11), 1006512 (2018).
  68. Tan, C., Terakawa, T., Takada, S. Dynamic Coupling among Protein Binding, Sliding, and DNA Bending Revealed by Molecular Dynamics. Journal of the American Chemical Society. 138 (27), 8512-8522 (2016).
  69. Terakawa, T., Takada, S. p53 dynamics upon response element recognition explored by molecular simulations. Scientific reports. 5, 17107 (2015).
  70. Brandani, G. B., Niina, T., Tan, C., Takada, S. DNA sliding in nucleosomes via twist defect propagation revealed by molecular simulations. Nucleic Acids Research. 46 (6), 2788-2801 (2018).
  71. Knotts, T. A., Rathore, N., Schwartz, D. C., de Pablo, J. J. A coarse grain model for DNA. The Journal of Chemical Physics. 126 (8), 084901 (2007).
  72. Freeman, G. S., Hinckley, D. M., Lequieu, J. P., Whitmer, J. K., de Pablo, J. J. Coarse-grained modeling of DNA curvature. The Journal of Chemical Physics. 141 (16), 165103 (2014).

Play Video

Cite This Article
E, C., Dai, L., Tian, J., Da, L., Yu, J. Structure-Based Simulation and Sampling of Transcription Factor Protein Movements along DNA from Atomic-Scale Stepping to Coarse-Grained Diffusion. J. Vis. Exp. (181), e63406, doi:10.3791/63406 (2022).

View Video