Summary

FDR 제어 기반 비표적 메타볼로임에 대한 식별 및 정량화의 통합 워크플로우

Published: September 20, 2022
doi:

Summary

우리는 XY-Meta와 metaX를 함께 통합하는 표적화되지 않은 대사 산물 워크 플로우를 구축했습니다. 이 프로토콜에서는 XY-Meta를 사용하여 오픈 액세스 스펙트럼 참조에서 데코이 스펙트럼 라이브러리를 생성하는 방법을 표시 한 다음 FDR 제어를 수행하고 대사체 스펙트럼을 확인한 후 metaX를 사용하여 대사 산물을 정량화했습니다.

Abstract

표적화되지 않은 대사체학 기술은 최근 몇 년 동안 널리 사용되고 있다. 그러나 빠르게 증가하는 처리량과 샘플 수는 엄청난 양의 스펙트럼을 생성하므로 질량 분광법 스펙트럼의 품질 관리에 대한 문제가 발생합니다. 거짓 긍정을 줄이려면 FDR(거짓 발견률) 품질 관리가 필요합니다. 최근에, 우리는 XY-Meta라는 Target-Decoy 전략을 기반으로 하는 비표적 대사체 식별의 FDR 제어를 위한 소프트웨어를 개발했습니다. 여기서는 XY-Meta와 metaX를 함께 통합하는 완벽한 분석 파이프라인을 시연했습니다. 이 프로토콜은 XY-meta를 사용하여 기존 참조 데이터베이스에서 데코이 데이터베이스를 생성하고 오픈 액세스 데이터 세트에서 대규모 대사체 식별을 위해 Target-Decoy 전략을 사용하여 FDR 제어를 수행하는 방법을 보여줍니다. 차등 분석 및 대사산물 주석은 대사산물 피크 검출 및 정량을 위해 metaX를 실행한 후에 수행되었다. 더 많은 연구자를 돕기 위해 우리는 생물 정보학 기술이나 컴퓨터 언어가 필요없이 이러한 분석을위한 사용자 친화적 인 클라우드 기반 분석 플랫폼을 개발했습니다.

Introduction

대사 산물은 생물학적 과정에서 중요한 역할을합니다. 대사 산물은 종종 에너지 전달, 호르몬 조절, 신경 전달 물질의 조절, 세포 통신 및 단백질 번역 후 변형 등 1,2,3,4와 같은 다양한 과정의 조절자입니다. 표적화되지 않은 대사체학은 수많은 대사 산물 5,6에 대한 세계적인 시각을 제공합니다. 질량 분광법 및 크로마토그래피 기술의 발전으로 대사체 MS/MS 스펙트럼의 처리량 은 최근 몇 년 동안 7,8,9,10,11 급속히 증가하고 있습니다. 이러한 거대한 데이터 세트에서 대사 산물을 식별하기 위해 MZmine 12, MS-FINDER 13, CFM-ID 14, MetFrag15 및 SLAW 16과 같은 다양한 주석 소프트웨어 11이 개발되었습니다. 그러나 이러한 식별에는 종종 많은 가양성이 포함되어 있습니다. 그 이유는 다음과 같습니다 : (1) MS / MS 스펙트럼에는 피크 정합을 오도 할 수있는 임의의 잡음이 포함되어 있습니다. (2) 이성질체와 단편화 에너지의 차이는 다중 스펙트럼 지문을 유발하여 참조 라이브러리의 볼륨을 증가시킵니다. (3) 참조 라이브러리의 품질은 다양합니다. 좋은 참조 스펙트럼 라이브러리를 구축하기위한 적절한 표준이 필요합니다. 따라서, 비표적 대사체학에 대한 체계적인 허위 발견률(FDR) 조절은 기능적 대사체 연구 7,8,9,17에 필수적이다.

경험적 베이즈 접근법과 Target-Decoy 전략은 FDR 통제 문제를 일반적으로 다루었습니다. Kerstin Scheubert et al.은 단편화 트리 기반 방법으로부터 생성된 디코이 데이터베이스에 대한 Target-Decoy 전략이 FDR 제어9를 위한 최선의 방법임을 보여주었다. Xusheng Wang et al. 화학에서 옥텟 규칙에 기초한 디코이 생성 방법을 설계하고 FDR 추정17의 정밀도를 개선했습니다. decoy 데이터베이스를 생성하기 위한 스펙트럼 라이브러리는 더 나은 성능(18)을 위해 입증되었다. 여기에서는 스펙트럼 라이브러리 기반 방법을 개선하고 FDR 추정의 정밀도를 더욱 향상시킬 수있는 XY-Meta19 라는 소프트웨어를 개발했습니다. 기존 참조 스펙트럼 라이브러리를 사용하여 Target-Decoy 체계 하에서 FDR 제어를위한 디코이 라이브러리를 생성합니다. XY-Meta는 자체 스펙트럼 매칭 및 코사인 유사성 알고리즘을 지원합니다. 그것은 전통적인 검색 및 반복 검색 모드를 허용합니다. FDR 평가 단계에서는 Target-Decoy 연결 모드와 분리 모드를 지원합니다. 유연성을 높이기 위해 XY-Meta는 외부 디코이 라이브러리를 수용합니다.

대사 산물의 피크 검출 및 정량화는 또한 표적화되지 않은 대사체 분석의 중요한 단계입니다. 피크 검출은 대사체 식별을위한 주요 방법입니다. 일반적으로, 대사산물의 피크 검출의 정확도는 질량 분광분석법의 잡음 신호, 대사산물의 낮은 풍부도, 오염물 및 대사산물(20)의 분해 생성물과 같은 다수의 인자에 의해 영향을 받았다. 샘플의 수가 너무 많거나 액체 크로마토그래피 컬럼이 표적화되지 않은 대사체의 실험에서 대체되었을 때, 현저한 배치 효과가 나타날 수 있으며, 이는 대사체 정량화에 대한 주요 과제21,22,23이다. 현재 XCMS 24, Workflow4Metabolomic25, iMet-Q26 및 metaX19와 같은 소프트웨어는 표적화되지 않은 대사체의 피크 검출 및 정량을 수행 할 수 있지만 metaX의 파이프 라인이보다 완전하고 사용하기 쉽다는 것이 좋습니다. 여기에서는 XY-Meta를 사용하여 공개적으로 이용 가능한 데이터 세트 msv000084112에 대한 식별 및 FDR 제어 과정과 metaX를 사용한 대사 산물의 피크 검출 및 정량화를 시연합니다. 이 워크플로에는 두 개의 그룹만 필요하며 각 그룹에는 두 개 이상의 샘플이 필요합니다. MS/MS 스펙트럼 데이터는 질량 분광계 플랫폼, 이온화 모드, 전하 모드 및 샘플 유형에 관계없이 필요하며 샘플 기반 정규화 및 피크 기반 정규화를 지원할 수 있습니다. 이 예에 따라 연구자들은 다루기 쉬운 방법으로 대사체학 식별 및 정량화를 수행 할 수 있습니다. 이 파이프라인을 사용하려면 R 프로그래밍 기능이 필요합니다. 프로그래밍 지식없이 연구원을 돕기 위해 우리는 대사체 분석을위한 클라우드 분석 플랫폼도 개발했습니다. 우리는 보충 자료 5에서이 클라우드 분석 플랫폼을 시연했습니다.

Protocol

1. 분석을 위해 대사체학 데이터 세트 준비 참고: 이 데모에서는 QC 샘플 없이 대사체학 데이터 세트를 사용합니다. 케이스 및 제어 그룹에 대한 데이터가 필요합니다. 데모를 위해 GNPS 데이터베이스27에서 공용 데이터 세트를 사용합니다. 웹 페이지로 이동하 https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. 데이터 집합 찾아보기를 …

Representative Results

msv000084112의 원시 데이터는 msconvert에 의해 변환되고.exe mgf 파일을 생성하였다(보충 자료 S6). XY-메타는 /database 폴더 아래에 GNPS-NIST14-MATCHES_Decoy.mgf 파일을 생성했습니다. 이것은 원래의 참조 스펙트럼 라이브러리 GNPS-NIST14-MATCHES.mgf에서 생성 된 데코이 라이브러리입니다. 이 디코이 라이브러리는 재사용할 수 있습니다. 이 decoy 라이브러리를 다시 사용할 때 사용자는…

Discussion

표적화되지 않은 대사 산물의 FDR 제어는 큰 도전이었습니다. 여기에서, 우리는 FDR 통제를 통한 대규모 비표적 대사체학 분석 (질적 및 양적)의 완전한 파이프 라인을 시연했습니다. 이것은 MS 분석에서 매우 일반적인 오탐을 효과적으로 줄입니다.

연구에 적합한 참조 스펙트럼 라이브러리를 준비하는 것이 핵심 포인트입니다. 성공적이고 민감한 MS/MS 식별을 위해서는 적절한 ?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

이 작업은 국가 핵심 연구 개발 프로그램 (2018YFC0910200 / 2017YFA0505001)과 광동 키 R & D 프로그램 (2019B020226001)의 지원을 받습니다.

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Play Video

Cite This Article
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video