Summary

Um fluxo de trabalho integrado de identificação e quantificação no metabolome não-alvo baseado em controle FDR

Published: September 20, 2022
doi:

Summary

Construímos um fluxo de trabalho metabolômico não-acompanhado que integrou XY-Meta e metaX juntos. Neste protocolo, exibimos como usar o XY-Meta para gerar uma biblioteca espectral chamariz a partir da referência de espectro de acesso aberto e, em seguida, executamos o controle FDR e usamos o metaX para quantificar os metabólitos depois de identificar o espectro metabolômico.

Abstract

Técnicas de metabolômica não-alvo estão sendo amplamente utilizadas nos últimos anos. No entanto, o rápido aumento do rendimento e o número de amostras criam uma enorme quantidade de espectros, estabelecendo desafios para o controle de qualidade do espectrometria de massa. Para reduzir os falsos positivos, é necessário um controle de qualidade da taxa de descoberta falsa (FDR). Recentemente, desenvolvemos um software para controle FDR de identificação metabolome não direcionada que é baseado em uma estratégia de isca alvo chamada XY-Meta. Aqui, demonstramos um pipeline de análise completo que integra XY-Meta e metaX juntos. Este protocolo mostra como usar o XY-meta para gerar um banco de dados de isca a partir de um banco de dados de referência existente e executar o controle FDR usando a estratégia Target-Decoy para identificação metabolome em larga escala em um conjunto de dados de acesso aberto. A análise diferencial e a anotação dos metabólitos foram realizadas após a execução do metaX para picos metabólitos de detecção e quantitação. Para ajudar mais pesquisadores, também desenvolvemos uma plataforma de análise baseada em nuvem para essas análises, sem a necessidade de habilidades bioinformáticas ou qualquer linguagem de computador.

Introduction

Os metabólitos desempenham papéis importantes nos processos biológicos. Metabólitos são frequentemente reguladores de vários processos como transferência de energia, regulamentos hormonais, regulação de neurotransmissores, comunicações celulares e modificações pós-translacionais de proteínas, etc 1,2,3,4. Metabolômica não-alvo fornece uma visão global de numerosos metabólitos 5,6. Com os avanços nas tecnologias de espectrometria de massa e cromatografia, o rendimento dos espectros metabolome MS/MS está aumentando rapidamente nos últimos anos 7,8,9,10,11. Para identificar metabólitos desses enormes conjuntos de dados, vários softwares de anotação foram desenvolvidos11, como MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 e SLAW16. No entanto, essas identificações muitas vezes contêm muitos falsos positivos. As razões incluem: (1) Os espectros MS/MS contêm ruído aleatório, o que pode enganar a correspondência de pico. (2) Isômeros e diferenças nas energias de fragmentação causam múltiplas impressões digitais de espectro e, assim, aumentam o volume da biblioteca de referência. (3) A qualidade das bibliotecas de referência varia. É necessário um padrão adequado para construir uma boa biblioteca espectral de referência. Portanto, um controle sistemático de falsas taxas de descoberta (FDR) para metabolômica não-alvo é essencial para a pesquisa de metabolome funcional 7,8,9,17.

Tanto a abordagem empírica de Bayes quanto a estratégia target-decoy resolveram o problema de controle FDR em geral. Kerstin Scheubert et al. mostraram que a estratégia target-decoy no banco de dados de isca gerada a partir do método baseado em árvores de fragmentação é o melhor método para o controle FDR9. Xusheng Wang et al. projetaram um método para a geração de isca com base na regra do octeto em química e melhoraram a precisão da estimativa de FDR17. A biblioteca espectral para geração de banco de dados de isca foi demonstrada para melhor desempenho18. Aqui, melhoramos o método baseado em biblioteca espectral e desenvolvemos um software chamado XY-Meta19 que pode melhorar ainda mais a precisão da estimativa do FDR. Ele usa a biblioteca espectral de referência existente para gerar uma biblioteca de isca para o controle FDR sob o esquema Target-Decoy. XY-Meta suporta seus próprios algoritmos de correspondência de espectros e similaridade cossino. Permite modos convencionais de pesquisa e pesquisa iterativa. Na etapa de avaliação do FDR, ele suporta o modo concateado Target-Decoy e o modo separado. Para uma melhor flexibilidade, o XY-Meta aceita bibliotecas de isca externas.

A detecção e quantificação de picos de metabólitos também é um passo importante da análise metabolome não alvo. A detecção de picos é o principal método de identificação metabolome. Em geral, a precisão da detecção de pico de metabólitos foi afetada por múltiplos fatores, como sinais sonoros de espectrometria de massa, baixa abundância de metabólitos, contaminantes e produtos de degradação de metabólitos20. Quando o número de amostras é muito grande ou a coluna de cromatografia líquida foi substituída em experimentos de metabolome não-alvo, podem aparecer efeitos notáveis em lote, o que é um grande desafio para a quantitação metabolome 21,22,23. Atualmente, softwares como XCMS24, Workflow4Metabolomic25, iMet-Q26 e metaX19 podem realizar detecção de pico e quantitação de metabolome não-alvo, mas sugerimos que o pipeline de metaX é mais completo e fácil de usar. Aqui, demonstramos o processo de identificação e controle de FDR para um conjunto de dados disponível publicamente msv000084112 usando XY-Meta, e o pico de detecção e quantificação de metabólitos usando metaX. Este fluxo de trabalho requer apenas dois grupos, e cada grupo precisa de pelo menos duas amostras. Os dados de espectro de MS/MS são necessários, independentemente da plataforma de espectrômetro de massa, modo de ionização, modo de carga e tipo de amostra, e podem suportar a normalização baseada em amostras e a normalização baseada em picos. Seguindo este exemplo, os pesquisadores podem realizar a identificação e quantificação metabolômica de forma fácil de lidar. O uso deste pipeline requer capacidade de programação R. Para ajudar o pesquisador sem qualquer conhecimento de programação, também desenvolvemos uma plataforma de análise em nuvem para análise metabolômica. Demonstramos essa plataforma de análise de nuvem em Material Suplementar 5.

Protocol

1. Prepare os conjuntos de dados metabolômicos para análise NOTA: Nesta demonstração, usamos conjuntos de dados metabolômicos sem amostra de QC. São necessários dados para grupos de casos e controle. Para demonstração, usamos um conjunto de dados público no banco de dados GNPS27. Vá para a página https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Clique em Procurar Conjuntos de dados. Pesquise a pal…

Representative Results

Os dados brutos de msv000084112 foram convertidos por msconvert.exe e arquivos MGF (Material Suplementar S6). XY-Meta gerou arquivo GNPS-NIST14-MATCHES_Decoy.mgf em /pasta de banco de dados. Esta é a biblioteca de isca gerada a partir da biblioteca espectral de referência original GNPS-NIST14-MATCHES.mgf. Esta biblioteca de isca pode ser reutilizada. Ao reutilizar esta biblioteca de isca, o usuário deve definir o decoy_pattern como 1 em arquivo parameter.default e definir o…

Discussion

O controle fdr de metabólitos não-alvo tem sido um grande desafio. Aqui, demonstramos um pipeline completo de análise metabolômica não-alvo em larga escala (qualitativa e quantitativa) com controle FDR. Isso reduz efetivamente os falsos positivos, que são muito comuns na análise de ESM.

Preparar uma biblioteca espectral de referência apropriada para o seu estudo é um ponto-chave. Uma identificação de MS/MS bem-sucedida e sensível requer não apenas algoritmos adequados de correspon…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Este trabalho é apoiado pelo Programa Nacional de Pesquisa e Desenvolvimento de Chaves (2018YFC0910200/2017YFA0505001) e pelo Programa de P&D De Chaves de Guangdong (2019B0226001).

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

Riferimenti

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Play Video

Citazione di questo articolo
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video