Vi konstruerede en ikke-målrettet metabolomisk arbejdsgang, der integrerede XY-Meta og metaX sammen. I denne protokol viste vi, hvordan man bruger XY-Meta til at generere et lokkespektralbibliotek fra open access-spektrereference, og udførte derefter FDR-kontrol og brugte metaX til at kvantificere metabolitterne efter at have identificeret metabolomics-spektrene.
Ikke-målrettede metabolomics teknikker er blevet udbredt i de senere år. Den hurtigt stigende gennemstrømning og antallet af prøver skaber imidlertid en enorm mængde spektre, hvilket giver udfordringer for kvalitetskontrol af massespektrometrispektrene. For at reducere de falske positiver er falsk opdagelsesrate (FDR) kvalitetskontrol nødvendig. For nylig udviklede vi en software til FDR-kontrol af ikke-målrettet metabolomidentifikation, der er baseret på en Target-Decoy-strategi ved navn XY-Meta. Her demonstrerede vi en komplet analysepipeline, der integrerer XY-Meta og metaX sammen. Denne protokol viser, hvordan man bruger XY-meta til at generere en lokkedatabase fra en eksisterende referencedatabase og udføre FDR-kontrol ved hjælp af Target-Decoy-strategien til storstilet metabolomidentifikation på et open-access datasæt. Differentialanalysen og metabolitannoteringen blev udført efter at have kørt metaX for påvisning og kvantificering af metabolitter. For at hjælpe flere forskere udviklede vi også en brugervenlig cloud-baseret analyseplatform til disse analyser uden behov for bioinformatikfærdigheder eller computersprog.
Metabolitter spiller vigtige roller i biologiske processer. Metabolitter er ofte regulatorer af forskellige processer som energioverførsel, hormonreguleringer, regulering af neurotransmittere, cellulær kommunikation og protein posttranslationelle modifikationer osv. 1,2,3,4. Ikke-målrettet metabolomics giver et globalt overblik over talrige metabolitter 5,6. Med fremskridt inden for massespektrometri og kromatografiteknologier er gennemstrømningen af metabolom MS / MS-spektre hurtigt stigende i de senere år 7,8,9,10,11. For at identificere metabolitter fra disse enorme datasæt blev der udviklet forskellige annotationssoftware11, såsom MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 og SLAW16. Disse identifikationer indeholder dog ofte mange falske positiver. Årsagerne omfatter: (1) MS/MS-spektrene indeholder tilfældig støj, som kan vildlede peak matching. (2) Isomerer og forskelle i fragmenteringsenergier forårsager flere spektre fingeraftryk og øger dermed volumenet af referencebiblioteket. (3) Referencebibliotekernes kvalitet varierer. En ordentlig standard til at opbygge et godt referencespektralbibliotek er nødvendig. Derfor er en systematisk falsk opdagelseshastighed (FDR) kontrol for ikke-målrettet metabolomics afgørende for funktionel metabolomforskning 7,8,9,17.
Både Empirical Bayes-tilgangen og Target-Decoy-strategien tacklede FDR-kontrolproblemet generelt. Kerstin Scheubert et al. viste, at Target-Decoy-strategien på lokkedatabase genereret fra fragmenteringstræbaseret metode er den bedste metode til FDR-kontrol9. Xusheng Wang et al. designede en metode til lokkemadsgenerering baseret på oktetreglen i kemi og forbedrede præcisionen af FDR-estimering17. Spektralbiblioteket til generering af lokkedatabase blev demonstreret for bedre ydeevne18. Her forbedrede vi den spektrale biblioteksbaserede metode og udviklede en software kaldet XY-Meta19 , der yderligere kan forbedre FDR-estimeringens præcision. Det bruger det eksisterende referencespektralbibliotek til at generere et lokkebibliotek til FDR-kontrollen under Target-Decoy-ordningen. XY-Meta understøtter sine egne spektrematchnings- og cosinuslighedsalgoritmer. Det tillader konventionelle søge- og iterative søgetilstande. I trinnet med FDR-vurdering understøtter den Target-Decoy-sammenkædet tilstand og adskilt tilstand. For bedre fleksibilitet accepterer XY-Meta eksterne lokkebiblioteker.
Peak-detektion og kvantificering af metabolitter er også et vigtigt trin i ikke-målrettet metabolomanalyse. Peak detektion er den vigtigste metode til metabolomidentifikation. Generelt blev nøjagtigheden af maksimal påvisning af metabolitter påvirket af flere faktorer, såsom støjsignaler fra massespektrometri, lav forekomst af metabolitter, forurenende stoffer og nedbrydningsprodukter af metabolitter20. Når antallet af prøver af er for stort, eller væskekromatografikolonnen blev erstattet i forsøg med ikke-målrettet metabolom, kan der forekomme bemærkelsesværdige batcheffekter, hvilket er en stor udfordring for metabolomkvantificering 21,22,23. I øjeblikket kan software som XCMS24, Workflow4Metabolomic25, iMet-Q26 og metaX19 udføre peak detection og kvantificering af ikke-målrettet metabolom, men vi foreslår, at pipelinen af metaX er mere komplet og lettere at bruge. Her demonstrerer vi processen med identifikation og FDR-kontrol for et offentligt tilgængeligt datasæt msv000084112 ved hjælp af XY-Meta og peak-detektion og kvantificering af metabolitter ved hjælp af metaX. Denne arbejdsproces kræver kun to grupper, og hver gruppe skal bruge mindst to eksempler. MS/MS-spektredata er nødvendige, uanset massespektrometerplatform, ioniseringstilstand, opladningstilstand og prøvetype, og kan understøtte prøvebaseret normalisering og peak-baseret normalisering. Efter dette eksempel kan forskere udføre metabolomics identifikation og kvantificering på en let at håndtere måde. Brug af denne pipeline kræver R-programmeringskapacitet. For at hjælpe forskeren uden nogen programmeringskendskab udviklede vi også en cloud-analyseplatform til metabolomics-analyse. Vi demonstrerede denne cloud-analyseplatform i Supplementary Material 5.
FDR-kontrollen af ikke-målrettede metabolitter har været en stor udfordring. Her demonstrerede vi en komplet pipeline af storstilet ikke-målrettet metabolomics-analyse (kvalitativ og kvantitativ) med FDR-kontrol. Dette reducerer effektivt de falske positiver, som er meget almindelige i MS-analyse.
Forberedelse af et passende referencespektralbibliotek til din undersøgelse er et centralt punkt. En vellykket og følsom MS/MS-identifikation kræver ikke kun korrekte matchningsalgoritmer, men …
The authors have nothing to disclose.
Dette arbejde understøttes af National Key Research and Development Program (2018YFC0910200/2017YFA0505001) og Guangdong Key R&D Program (2019B020226001).
GNPS | open source | n/a | https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp |
XY-Meta | open source | n/a | https://github.com/DLI-ShenZhen/XY-Meta |
metaX | open source | n/a | https://github.com/wenbostar/metaX |
ProteoWizard | Free Download | 3.0.22116.18c918b-x86_64 | https://proteowizard.sourceforge.io/download.html |
CHI.Client | Free Download | ndp48-x86-x64-allos-enu | http://www.chi-biotech.com/technology.html?ty=ypt |