Summary

Un flusso di lavoro integrato di identificazione e quantificazione sul metaboloma non mirato basato sul controllo FDR

Published: September 20, 2022
doi:

Summary

Abbiamo costruito un flusso di lavoro metabolomico non mirato che integrava XY-Meta e metaX insieme. In questo protocollo, abbiamo mostrato come utilizzare XY-Meta per generare una libreria spettrale esca dal riferimento spettrale ad accesso aperto, quindi eseguito il controllo FDR e utilizzato il metaX per quantificare i metaboliti dopo aver identificato gli spettri di metabolomica.

Abstract

Le tecniche di metabolomica non mirata sono state ampiamente utilizzate negli ultimi anni. Tuttavia, il rapido aumento della produttività e del numero di campioni crea un’enorme quantità di spettri, ponendo sfide per il controllo di qualità degli spettri della spettrometria di massa. Per ridurre i falsi positivi, è necessario il controllo di qualità del tasso di falsa scoperta (FDR). Recentemente, abbiamo sviluppato un software per il controllo FDR dell’identificazione del metaboloma non mirato che si basa su una strategia Target-Decoy denominata XY-Meta. Qui, abbiamo dimostrato una pipeline di analisi completa che integra XY-Meta e metaX insieme. Questo protocollo mostra come utilizzare XY-meta per generare un database esca da un database di riferimento esistente ed eseguire il controllo FDR utilizzando la strategia Target-Decoy per l’identificazione del metaboloma su larga scala su un set di dati ad accesso aperto. L’analisi differenziale e l’annotazione dei metaboliti sono state eseguite dopo l’esecuzione di metaX per il rilevamento e la quantificazione dei picchi dei metaboliti. Al fine di aiutare più ricercatori, abbiamo anche sviluppato una piattaforma di analisi basata su cloud di facile utilizzo per queste analisi, senza la necessità di competenze bioinformatiche o di linguaggi informatici.

Introduction

I metaboliti svolgono un ruolo importante nei processi biologici. I metaboliti sono spesso regolatori di vari processi come il trasferimento di energia, la regolazione ormonale, la regolazione dei neurotrasmettitori, le comunicazioni cellulari e le modifiche proteiche post-traduzionali, ecc. 1,2,3,4. La metabolomica non mirata fornisce una visione globale di numerosi metaboliti 5,6. Con i progressi nella spettrometria di massa e nelle tecnologie di cromatografia, il throughput degli spettri MS/MS del metaboloma è in rapido aumento negli ultimi anni 7,8,9,10,11. Per identificare i metaboliti da questi enormi set di dati, sono stati sviluppati vari software di annotazione11, come MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 e SLAW16. Tuttavia, queste identificazioni spesso contengono molti falsi positivi. I motivi includono: (1) Gli spettri MS/MS contengono rumore casuale, che può fuorviare la corrispondenza dei picchi. (2) Gli isomeri e le differenze nelle energie di frammentazione causano impronte digitali multiple degli spettri e quindi aumentano il volume della libreria di riferimento. (3) La qualità delle librerie di riferimento varia. È necessario uno standard adeguato per costruire una buona libreria spettrale di riferimento. Pertanto, un controllo sistematico del tasso di falsa scoperta (FDR) per la metabolomica non mirata è essenziale per la ricerca sul metaboloma funzionale 7,8,9,17.

Sia l’approccio Empiric Bayes che la strategia Target-Decoy hanno affrontato il problema del controllo FDR in generale. Kerstin Scheubert et al. hanno dimostrato che la strategia Target-Decoy sul database esca generato dal metodo basato sulla frammentazione ad albero è il metodo migliore per il controllo FDR9. Xusheng Wang et al. hanno progettato un metodo per la generazione di esca basato sulla regola dell’ottetto in chimica e hanno migliorato la precisione della stima FDR17. La libreria spettrale per la generazione del database esca è stata dimostrata per prestazioni migliori18. Qui, abbiamo migliorato il metodo basato su libreria spettrale e sviluppato un software chiamato XY-Meta19 che può migliorare ulteriormente la precisione della stima FDR. Utilizza la libreria spettrale di riferimento esistente per generare una libreria esca per il controllo FDR nello schema Target-Decoy. XY-Meta supporta i propri algoritmi di corrispondenza degli spettri e di somiglianza del coseno. Consente la ricerca convenzionale e le modalità di ricerca iterativa. Nella fase di valutazione FDR, supporta la modalità concatenata Target-Decoy e la modalità separata. Per una maggiore flessibilità, XY-Meta accetta librerie di esca esterne.

Il rilevamento dei picchi e la quantificazione dei metaboliti è anche un passo importante dell’analisi del metaboloma non mirato. Il rilevamento dei picchi è il metodo principale per l’identificazione del metaboloma. In generale, l’accuratezza del rilevamento dei picchi dei metaboliti è stata influenzata da molteplici fattori, come i segnali di rumore della spettrometria di massa, la bassa abbondanza di metaboliti, contaminanti e prodotti di degradazione dei metaboliti20. Quando il numero di campioni di è troppo grande o la colonna di cromatografia liquida è stata sostituita in esperimenti di metaboloma non mirato, possono apparire notevoli effetti batch, che è una grande sfida per la quantificazione del metaboloma 21,22,23. Attualmente, software come XCMS24, Workflow4Metabolomic25, iMet-Q26 e metaX19 possono eseguire il rilevamento dei picchi e la quantificazione del metaboloma non mirato, ma suggeriamo che la pipeline di metaX sia più completa e più facile da usare. Qui, dimostriamo il processo di identificazione e controllo FDR per un set di dati pubblicamente disponibile msv000084112 utilizzando XY-Meta e il rilevamento e la quantificazione dei picchi dei metaboliti utilizzando metaX. Questo flusso di lavoro richiede solo due gruppi e ogni gruppo richiede almeno due esempi. I dati degli spettri MS/MS sono necessari, indipendentemente dalla piattaforma dello spettrometro di massa, dalla modalità di ionizzazione, dalla modalità di carica e dal tipo di campione, e possono supportare la normalizzazione basata su campioni e la normalizzazione basata su picchi. Seguendo questo esempio, i ricercatori possono eseguire l’identificazione e la quantificazione della metabolomica in modo facile da gestire. L’utilizzo di questa pipeline richiede funzionalità di programmazione R. Per aiutare il ricercatore senza alcuna conoscenza di programmazione, abbiamo anche sviluppato una piattaforma di analisi cloud per l’analisi metabolomica. Abbiamo dimostrato questa piattaforma di analisi cloud nel Materiale supplementare 5.

Protocol

1. Preparare set di dati di metabolomica per l’analisi NOTA: in questa dimostrazione vengono utilizzati set di dati di metabolomica senza campione QC. Sono necessari dati per i gruppi di casi e di controllo. Per la dimostrazione, utilizziamo un set di dati pubblico nel database PNL27. Vai alla pagina web https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Fare clic su Sfoglia set di dati. Cerca la parola chiave …

Representative Results

I dati grezzi di msv000084112 sono stati convertiti da msconvert.exe e generati file mgf (materiale supplementare S6). XY-Meta ha generato il file GNPS-NIST14-MATCHES_Decoy.mgf nella cartella /database. Questa è la libreria esca generata dalla libreria spettrale di riferimento originale GNPS-NIST14-MATCHES.mgf. Questa libreria di esca può essere riutilizzata. Quando si riutilizza questa libreria di esca, l’utente deve impostare il decoy_pattern come 1 nel file parameter.defa…

Discussion

Il controllo FDR dei metaboliti non mirati è stata una grande sfida. Qui, abbiamo dimostrato una pipeline completa di analisi metabolomica non mirata su larga scala (qualitativa e quantitativa) con controllo FDR. Ciò riduce efficacemente i falsi positivi, che sono molto comuni nell’analisi della SM.

Preparare una libreria spettrale di riferimento appropriata per il tuo studio è un punto chiave. Un’identificazione MS/MS corretta e sensibile richiede non solo algoritmi di corrispondenza adegu…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Questo lavoro è supportato dal National Key Research and Development Program (2018YFC0910200/2017YFA0505001) e dal Guangdong Key R&D Program (2019B020226001).

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/kr/63625?article_type=t

Play Video

Cite This Article
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video