Summary

JUMPn: 프로테오믹스의 단백질 공동 발현 클러스터링 및 네트워크 분석을 위한 간소화된 응용 프로그램

Published: October 19, 2021
doi:

Summary

우리는 데이터 전처리, 공동 발현 클러스터링, 경로 농축 및 단백질 – 단백질 상호 작용 네트워크 분석을 포함한 상세한 프로토콜과 함께 정량적 단백체학 데이터에 대한 네트워크 분석을 수행하고 시각화하는 시스템 생물학 도구 JUMPn을 제시합니다.

Abstract

최근 질량 분광법 기반 프로테오믹스 기술이 발전함에 따라 수백 개의 프로테옴에 대한 심층 프로파일링이 점점 더 실현 가능해졌습니다. 그러나 이러한 귀중한 데이터 세트에서 생물학적 통찰력을 도출하는 것은 어렵습니다. 여기서 우리는 시스템 생물학 기반 소프트웨어 JUMPn 및 프로테옴을 모듈(예를 들어, 단백질 복합체)에 의해 연결된 샘플 및 단백질-단백질 상호작용(PPI) 네트워크에 걸쳐 단백질 공동발현 클러스터로 구성하기 위한 관련 프로토콜을 소개한다. R/Shiny 플랫폼을 사용하는 JUMPn 소프트웨어는 통합 데이터 시각화 및 사용자 친화적인 인터페이스를 통해 공동 발현 클러스터링, 경로 농축 및 PPI 모듈 감지 분석을 간소화합니다. 프로토콜의 주요 단계는 JUMPn 소프트웨어의 설치, 차등적으로 발현된 단백질 또는 (dys) 조절된 프로테옴의 정의, 의미있는 공동발현 클러스터 및 PPI 모듈의 결정, 및 결과 시각화를 포함한다. 프로토콜이 등압 표지-기반 프로테옴 프로파일을 사용하여 입증되는 반면, JUMPn은 일반적으로 광범위한 정량적 데이터세트(예를 들어, 무표지 프로테오믹스)에 적용가능하다. 따라서 JUMPn 소프트웨어 및 프로토콜은 정량적 프로테오믹스에서 생물학적 해석을 용이하게 하는 강력한 도구를 제공합니다.

Introduction

질량 분광법 기반 산탄 총 프로테오믹스는 복잡한 샘플1의 프로테옴 다양성을 분석하기 위한 핵심 접근법이 되었다. 질량 분광법 계측2,3, 크로마토그래피4,5, 이온 이동성 검출6, 획득 방법(데이터 독립적7 및 데이터 의존적 획득8), 정량화 접근법(다중플렉스 등압 펩티드 라벨링 방법, 예를 들어, TMT9,10 및 무라벨 정량화11,12) 및 데이터 분석 전략의 최근 발전과 함께/ 소프트웨어 개발 13,14,15,16,17,18, 전체 프로테옴 (예를 들어, 10,000개 이상의 단백질)의 정량화는 이제19,20,21 루틴이다. 그러나 이러한 심층적 인 양적 데이터 세트에서 기계론적 통찰력을 얻는 방법은 여전히22에 도전적입니다. 이러한 데이터 세트를 조사하기위한 초기 시도는 주로 데이터의 개별 요소의 주석에 의존하여 각 구성 요소 (단백질)를 독립적으로 처리했습니다. 그러나, 생물학적 시스템 및 그들의 행동은 개별 구성요소(23)를 검사함으로써 단독으로 설명될 수 없다. 따라서, 정량화된 생체분자를 상호작용 네트워크의 맥락에 배치하는 시스템 접근법은 인간 질병의 배아 발생, 면역 반응 및 병인(24)과 같은 복잡한 시스템 및 연관된 과정의 이해를 위해 필수적이다.

네트워크 기반 시스템 생물학은 대규모 정량적 프로테오믹스 데이터 25,26,27,28,29,30,31,32,33을 분석하기 위한 강력한 패러다임으로 부상했다. 개념적으로, 포유동물 세포와 같은 복잡한 시스템은 계층적 네트워크(34,35)로서 모델링될 수 있는데, 여기서 전체 시스템은 계층으로 표현된다: 먼저 다수의 큰 컴포넌트들에 의해, 각각은 더 작은 서브시스템들에 의해 반복적으로 모델링된다. 기술적으로, 프로테옴 역학의 구조는 공동-발현된 단백질 클러스터의 상호 연결된 네트워크(공동-발현된 유전자/단백질이 종종 조절(36)의 유사한 생물학적 기능 또는 메카니즘을 공유하기 때문에) 및 물리적으로 상호작용하는 PPI 모듈(37)에 의해 제시될 수 있다. 최근의 예로서25로서, 우리는 T 세포 활성화 동안 전체 프로테옴 및 포스포프로테옴의 시간적 프로파일을 생성하고, T 세포 정지 종료를 매개하는 기능적 모듈을 확인하기 위해 PPI와 함께 통합적 공동발현 네트워크를 사용하였다. 다수의 생물에너지-관련 모듈들이 강조되고 실험적으로 검증되었다(예를 들어, 미토리보솜 및 복합 IV 모듈(25), 및 단일-탄소 모듈(38)). 또 다른 예26에서, 우리는 알츠하이머 병의 발병기전을 연구하기 위해 우리의 접근법을 더욱 확장하고, 질병 진행과 관련된 단백질 모듈 및 분자를 성공적으로 우선 순위화했다. 중요하게도, 우리의 편향되지 않은 발견들 중 다수는 독립적인 환자 코호트(26,29) 및/또는 질병 마우스 모델(26)에 의해 검증되었다. 이들 예는 정량적 프로테오믹스 및 다른 오믹스 통합으로 분자 메커니즘을 해부하기 위한 시스템 생물학 접근법의 힘을 예시하였다.

여기에서는 네트워크 기반 시스템 생물학 접근법을 사용하여 정량적 프로테오믹스 데이터를 탐구하는 간소화된 소프트웨어인 JUMPn을 소개합니다. JUMPn은 확립된 JUMP 프로테오믹스 소프트웨어 제품군(13,14,39)의 하류 구성 요소로서 기능하며, 시스템 생물학 접근법을 사용하여 개별 단백질 정량화에서 생물학적으로 의미있는 경로 및 단백질 모듈로의 격차를 메우는 것을 목표로 한다. JUMPn은 차등적으로 발현된(또는 가장 가변적인) 단백질의 정량화 매트릭스를 입력으로 취함으로써, 프로테옴을 샘플과 조밀하게 연결된 PPI 모듈(예를 들어, 단백질 복합체)에 걸쳐 공동발현되는 단백질 클러스터의 계층화된 계층으로 조직하는 것을 목표로 하며, 이는 과대표현(또는 농축) 분석에 의해 공개 경로 데이터베이스와 추가로 주석이 첨부된다(도 1). JUMPn은 사용자 친화적인 인터페이스를 위해 R/Shiny 플랫폼(40)과 함께 개발되었으며 세 가지 주요 기능 모듈, 즉 공발현 클러스터링 분석, 경로 농축 분석 및 PPI 네트워크 분석을 통합합니다(그림 1). 각 분석 후 결과는 자동으로 시각화되고 R/shiny 위젯 기능을 통해 조정할 수 있으며 Microsoft Excel 형식의 게시 테이블로 쉽게 다운로드할 수 있습니다. 다음 프로토콜에서는 정량적 전체 프로테옴 데이터를 예로 들어 JUMPn 소프트웨어 설치, 차등적으로 발현된 단백질 또는 (dys) 조절된 프로테옴의 정의, 공동 발현 네트워크 분석 및 PPI 모듈 분석, 결과 시각화 및 해석, 문제 해결 등을 포함하여 JUMPn을 사용하는 주요 단계를 설명합니다. JUMPn 소프트웨어는 GitHub41에서 무료로 사용할 수 있습니다.

Protocol

참고: 이 프로토콜에서, JUMPn의 사용은 TMT 등압 라벨 시약(27)에 의해 정량화된 B 세포 분화 동안 전체 프로테옴 프로파일링의 공개된 데이터세트를 이용함으로써 예시된다. 1. JUMPn 소프트웨어 설정 참고: JUMPn 소프트웨어를 설정하기 위한 두 가지 옵션이 제공됩니다: (i) 개인적인 용도로 로컬 컴퓨터에 설치; (ii) 여러 사용자를 위해 원격 Shin…

Representative Results

우리는 JUMPn 성능을 최적화하고 평가하기 위해 게시 된 심층 단백체 데이터 세트 25,26,27,30 (그림 5 및 그림 6)과 데이터 시뮬레이션 57 (표 1)을 사용했습니다. WGCNA를 통한 공동발현 단백질 클러스터링 분석의 경우, 시료 간에 ?…

Discussion

여기서 우리는 JUMPn 소프트웨어와 그 프로토콜을 소개했는데, 이는 심층 정량적 단백체 데이터25,26,27,30,64를 사용하여 분자 메커니즘을 해부하기위한 여러 프로젝트에 적용되었습니다. JUMPn 소프트웨어 및 프로토콜은 공동 발현 네트워크 분석을 위한 DE 단백질의 고려, 포괄?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

기금 지원은 NIH (National Institutes of Health) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 및 U54NS110435) 및 ALSAC (미국 레바논 시리아 관련 자선 단체)가 제공했습니다. MS 분석은 St. Jude Children’s Research Hospital의 Proteomics and Metabolomics Center에서 수행되었으며, NIH Cancer Center Support Grant (P30CA021765)가 부분적으로 지원했습니다. 내용은 전적으로 저자의 책임이며 반드시 국립 보건원 (National Institutes of Health)의 공식 견해를 나타내는 것은 아닙니다.

Materials

MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. Apple Inc. MacBook Pro 13'' Hardware used for software development and testing
Anoconda Anaconda, Inc. version 4.9.2 https://docs.anaconda.com/anaconda/install/
miniconda Anaconda, Inc. version 4.9.2 https://docs.conda.io/en/latest/miniconda.html
RStudio RStudio Public-benefit corporation version 4.0.3 https://www.rstudio.com/products/rstudio/download/
Shiny Server RStudio Public-benefit corporation https://shiny.rstudio.com/articles/shinyapps.html

References

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537, 347-355 (2016).
  2. Senko, M. W., et al. Novel parallelized quadrupole/linear ion trap/orbitrap tribrid mass spectrometer improving proteome coverage and peptide identification rates. Analytical Chemistry. 85, 11710-11714 (2013).
  3. Eliuk, S., Makarov, A. Evolution of orbitrap mass spectrometry instrumentation. Annual Review of Analytical Chemistry. 8, 61-80 (2015).
  4. Wang, H., et al. Systematic optimization of long gradient chromatography mass spectrometry for deep analysis of brain proteome. Journal of Proteome Research. 14, 829-838 (2015).
  5. Blue, L. E. Recent advances in capillary ultrahigh pressure liquid chromatography. Journal of Chromatography A. 1523, 17-39 (2017).
  6. Meier, F., et al. Online parallel accumulation-serial fragmentation (PASEF) with a novel trapped ion mobility mass spectrometer. Molecular & Cellular Proteomics. 17, 2534-2545 (2018).
  7. Ludwig, C., et al. Data-independent acquisition-based SWATH-MS for quantitative proteomics: a tutorial. Molecular Systems Biology. 14 (8), 8126 (2018).
  8. Zhang, Y. Y., Fonslow, B. R., Shan, B., Baek, M. C., Yates, J. R. Protein analysis by shotgun/bottom-up proteomics. Chemical Reviews. 113, 2343-2394 (2013).
  9. Wang, Z., et al. 27-Plex tandem mass tag mass spectrometry for profiling brain proteome in Alzheimer’s disease. Analytical Chemistry. 92, 7162-7170 (2020).
  10. Li, J. M., et al. TMTpro reagents: a set of isobaric labeling mass tags enables simultaneous proteome-wide measurements across 16 samples. Nature Methods. 17 (4), 399-404 (2020).
  11. Collins, B. C., et al. Multi-laboratory assessment of reproducibility, qualitative and quantitative performance of SWATH-mass spectrometry. Nature Communications. 8 (1), 291 (2017).
  12. Navarro, P., et al. A multicenter study benchmarks software tools for label-free proteome quantification. Nature Biotechnology. 34, 1130 (2016).
  13. Wang, X. S., et al. A tag-based database search tool for peptide identification with high sensitivity and accuracy. Molecular & Cellular Proteomics. 13, 3663-3673 (2014).
  14. Li, Y. X., et al. JUMPg: An integrative proteogenomics pipeline identifying unannotated proteins in human brain and cancer cells. Journal of Proteome Research. 15, 2309-2320 (2016).
  15. Cox, J., Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nature Biotechnology. 26, 1367-1372 (2008).
  16. Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., Nesvizhskii, A. I. MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics. Nature Methods. 14, 513 (2017).
  17. Chi, H., et al. Comprehensive identification of peptides in tandem mass spectra using an efficient open search engine. Nature Biotechnology. 36, 1059 (2018).
  18. Demichev, V., Messner, C. B., Vernardis, S. I., Lilley, K. S., Ralser, M. DIA-NN neural networks and interference correction enable deep proteome coverage in high throughput. Nature Methods. 17, 41 (2020).
  19. High, A. A., et al. Deep proteome profiling by isobaric labeling, extensive liquid chromatography, mass spectrometry, and software-assisted quantification. Journal of Visualized Experiments: JoVE. (129), e56474 (2017).
  20. Wang, Z., et al. High-throughput and deep-proteome profiling by 16-plex tandem mass tag labeling coupled with two-dimensional chromatography and mass spectrometry. Journal of Visualized Experiments: JoVE. (162), e61684 (2020).
  21. Meier, F., Geyer, P. E., Winter, S. V., Cox, J., Mann, M. BoxCar acquisition method enables single-shot proteomics at a depth of 10,000 proteins in 100 minutes. Nature Methods. 15, 440 (2018).
  22. Sinitcyn, P., Rudolph, J. D., Cox, J. Computational methods for understanding mass spectrometry-based shotgun proteomics data. Annual Review of Biomedical Data Science. 1, 207-234 (2018).
  23. Ideker, T., Galitski, T., Hood, L. A new approach to decoding life: Systems biology. Annual Review of Genomics and Human Genetics. 2, 343-372 (2001).
  24. Barabasi, A. L., Oltvai, Z. N. Network biology: understanding the cell’s functional organization. Nature Reviews Genetics. 5, 101-113 (2004).
  25. Tan, H., et al. Integrative proteomics and phosphoproteomics profiling reveals dynamic signaling networks and bioenergetics pathways underlying T cell activation. Immunity. 46, 488-503 (2017).
  26. Bai, B., et al. Deep multilayer brain proteomics identifies molecular networks in alzheimer’s disease progression. Neuron. 105, 975-991 (2020).
  27. Zeng, H., et al. Discrete roles and bifurcation of PTEN signaling and mTORC1-mediated anabolic metabolism underlie IL-7-driven B lymphopoiesis. Science Advances. 4, 5701 (2018).
  28. Seyfried, N. T., et al. A multi-network approach identifies protein-specific co-expression in asymptomatic and symptomatic Alzheimer’s disease. Cell Systems. 4, 60-72 (2017).
  29. Johnson, E. C. B., et al. Large-scale proteomic analysis of Alzheimer’s disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation. Nature Medicine. 26, 769-780 (2020).
  30. Stewart, E., et al. Identification of therapeutic targets in rhabdomyosarcoma through integrated genomic, epigenomic, and proteomic analyses. Cancer Cell. 34, 411-426 (2018).
  31. Rudolph, J. D., Cox, J. A network module for the perseus software for computational proteomics facilitates proteome interaction graph analysis. Journal of Proteome Research. 18, 2052-2064 (2019).
  32. Zhang, B., et al. Proteogenomic characterization of human colon and rectal cancer. Nature. 513, 382 (2014).
  33. Petralia, F., et al. Integrated proteogenomic characterization across major histological types of pediatric brain cancer. Cell. 183, 1962 (2020).
  34. Dutkowski, J., et al. A gene ontology inferred from molecular networks. Nature Biotechnology. 31, 38 (2013).
  35. Yu, M. K., et al. Translation of genotype to phenotype by a hierarchy of cell subsystems. Cell Systems. 2, 77-88 (2016).
  36. Jansen, R., Greenbaum, D., Gerstein, M. Relating whole-genome expression data with protein-protein interactions. Genome Research. 12, 37-46 (2002).
  37. Huttlin, E. L., et al. Architecture of the human interactome defines protein communities and disease networks. Nature. 545, 505-509 (2017).
  38. Ron-Harel, N., et al. Mitochondrial biogenesis and proteome remodeling promote one-carbon metabolism for T cell activation. Cell Metabolism. 24, 104-117 (2016).
  39. Niu, M. M., et al. Extensive peptide fractionation and y(1) ion-based interference detection method for enabling accurate quantification by isobaric labeling and mass spectrometry. Analytical Chemistry. 89, 2956-2963 (2017).
  40. Chang, W. shiny: Web Application Framework for. Nature Protocols. 11, 2301-2319 (2021).
  41. . JUMPn Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0 (2021)
  42. . Anaconda Available from: https://docs.anaconda.com/anaconda/install/ (2021)
  43. . miniconda Available from: https://docs.conda.io/en/latest/miniconda.html (2021)
  44. . RStudio Available from: https://www.rstudio.com/products/rstudio/download/ (2021)
  45. . Shiny Server Available from: https://shiny.rstudio.com/articles/shinyapps.html (2021)
  46. Tyanova, S., Temu, T., Cox, J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics. Nature Protocol. 11, 2301-2319 (2016).
  47. . R code Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/JUMPn_preprocessing (2021)
  48. Florens, L., et al. Analyzing chromatin remodeling complexes using shotgun proteomics and normalized spectral abundance factors. Methods. 40, 303-311 (2006).
  49. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  50. Voineagu, I., et al. Transcriptomic analysis of autistic brain reveals convergent molecular pathology. Nature. 474, 380 (2011).
  51. Langfelder, P., Zhang, B., Horvath, S. Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut package for R. Bioinformatics. 24, 719-720 (2008).
  52. Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N., Barabasi, A. L. Hierarchical organization of modularity in metabolic networks. Science. 297, 1551-1555 (2002).
  53. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  54. Liberzon, A., et al. Molecular signatures database (MSigDB) 3.0. Bioinformatics. 27, 1739-1740 (2011).
  55. . FlyEn rich r Available from: https://maayanlab.cloud/FlyEnrichr/#stats (2021)
  56. . JUMPn GitHub Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/resources/example_fly (2021)
  57. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  58. Benjamini, Y., Hochberg, Y. Controlling the false discovery rate – a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society: Series B. 57, 289-300 (1995).
  59. Szklarczyk, D., et al. STRING v10: protein-protein interaction networks, integrated over the tree of life. Nucleic Acids Research. 43, 447-452 (2015).
  60. Szklarczyk, D., et al. STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2019).
  61. Huttlin, E. L., et al. The BioPlex network: A systematic exploration of the human interactome. Cell. 162, 425-440 (2015).
  62. Huttlin, E. L., et al. Dual proteome-scale networks reveal cell-specific remodeling of the human interactome. Cell. 184, 3022-3040 (2021).
  63. Li, T., et al. A scored human protein-protein interaction network to catalyze genomic interpretation. Nature Methods. 14, 61-64 (2017).
  64. Wang, H., et al. Deep multiomics profiling of brain tumors identifies signaling networks downstream of cancer driver genes. Nature Communications. 10, 3718 (2019).
  65. Gerstein, M. B., et al. Architecture of the human regulatory network derived from ENCODE data. Nature. 489, 91-100 (2012).
  66. Yu, J., Peng, J., Chi, H. Systems immunology: Integrating multi-omics data to infer regulatory networks and hidden drivers of immunity. Current Opinion in Systems Biology. 15, 19-29 (2019).
  67. Califano, A., Alvarez, M. J. The recurrent architecture of tumour initiation, progression and drug sensitivity. Nature Reviews Cancer. 17, 116-130 (2017).
  68. Hein, M. Y., et al. A human interactome in three quantitative dimensions organized by stoichiometries and abundances. Cell. 163, 712-723 (2015).
  69. Liang, Z., Xu, M., Teng, M. K., Niu, L. W. Comparison of protein interaction networks reveals species conservation and divergence. BMC Bioinformatics. 7, 457 (2006).
  70. Shou, C., et al. Measuring the evolutionary rewiring of biological networks. PLOS Computational Biology. 7, 1001050 (2011).
  71. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10, 1523 (2019).
  72. Cline, M. S., et al. Integration of biological networks and gene expression data using Cytoscape. Nature Protocols. 2, 2366-2382 (2007).
check_url/62796?article_type=t&slug=jumpn-streamlined-application-for-protein-co-expression-clustering

Play Video

Cite This Article
Vanderwall, D., Suresh, P., Fu, Y., Cho, J., Shaw, T. I., Mishra, A., High, A. A., Peng, J., Li, Y. JUMPn: A Streamlined Application for Protein Co-Expression Clustering and Network Analysis in Proteomics. J. Vis. Exp. (176), e62796, doi:10.3791/62796 (2021).

View Video