Wir haben einen ungezielten metabolomischen Workflow entwickelt, der XY-Meta und metaX zusammen integriert. In diesem Protokoll zeigten wir, wie XY-Meta verwendet werden kann, um eine Lockvogel-Spektralbibliothek aus der Open-Access-Spektrenreferenz zu generieren, und führten dann eine FDR-Kontrolle durch und verwendeten das metaX, um die Metaboliten nach der Identifizierung der Metabolomik-Spektren zu quantifizieren.
Ungezielte Metabolomik-Techniken sind in den letzten Jahren weit verbreitet. Der schnell steigende Durchsatz und die Anzahl der Proben erzeugen jedoch eine enorme Menge an Spektren, was die Qualitätskontrolle der Massenspektrometriespektren vor Herausforderungen stellt. Um die Fehlalarme zu reduzieren, ist eine Qualitätskontrolle der False Discovery Rate (FDR) erforderlich. Vor kurzem haben wir eine Software zur FDR-Kontrolle der ungezielten Identifizierung von Metabolomen entwickelt, die auf einer Target-Decoy-Strategie namens XY-Meta basiert. Hier demonstrierten wir eine komplette Analyse-Pipeline, die XY-Meta und metaX miteinander integriert. Dieses Protokoll zeigt, wie XY-meta verwendet wird, um eine Lockvogeldatenbank aus einer vorhandenen Referenzdatenbank zu generieren und eine FDR-Kontrolle mit der Target-Decoy-Strategie für die Identifizierung von Metabolomen in großem Maßstab in einem Open-Access-Datensatz durchzuführen. Die Differentialanalyse und die Annotation der Metaboliten wurden nach dem Ausführen von metaX für den Nachweis und die Quantifizierung von Metabolitenspitzen durchgeführt. Um mehr Forschern zu helfen, haben wir auch eine benutzerfreundliche Cloud-basierte Analyseplattform für diese Analysen entwickelt, ohne dass bioinformatische Kenntnisse oder Computersprachen erforderlich sind.
Metaboliten spielen eine wichtige Rolle in biologischen Prozessen. Metaboliten sind oft Regulatoren verschiedener Prozesse wie Energieübertragung, Hormonregulation, Regulation von Neurotransmittern, zellulärer Kommunikation und posttranslationalen Proteinmodifikationen usw. 1,2,3,4. Untargeted metabolomics bietet einen globalen Überblick über zahlreiche Metaboliten 5,6. Mit den Fortschritten in der Massenspektrometrie und Chromatographietechnologie nimmt der Durchsatz von Metabolom-MS/MS-Spektren in den letzten Jahren rapide zu 7,8,9,10,11. Um Metaboliten aus diesen riesigen Datensätzen zu identifizieren, wurden verschiedene Annotationssoftware11 entwickelt, wie MZmine12, MS-FINDER 13, CFM-ID 14,MetFrag 15 undSLAW 16. Diese Identifikationen enthalten jedoch oft viele Fehlalarme. Zu den Gründen gehören: (1) Die MS/MS-Spektren enthalten zufälliges Rauschen, das die Spitzenübereinstimmung irreführen kann. (2) Isomere und Unterschiede in den Fragmentierungsenergien verursachen mehrere Spektrenfingerabdrücke und erhöhen so das Volumen der Referenzbibliothek. (3) Die Qualität der Präsenzbibliotheken ist unterschiedlich. Ein geeigneter Standard, um eine gute Referenzspektralbibliothek zu erstellen, ist erforderlich. Daher ist eine systematische FDR-Kontrolle (False Discovery Rate) für ungezielte Metabolomik für die funktionelle Metabolomforschungunerlässlich 7,8,9,17.
Sowohl der empirische Bayes-Ansatz als auch die Target-Decoy-Strategie befassten sich mit dem FDR-Kontrollproblem im Allgemeinen. Kerstin Scheubert et al. zeigten, dass die Target-Decoy-Strategie auf der Lockvogeldatenbank, die aus der fragmentierten baumbasierten Methode generiert wurde, die beste Methode für die FDR-Kontrolle9 ist. Xusheng Wang et al. entwarfen eine Methode zur Lockvogelerzeugung, die auf der Oktettregel in der Chemie basiert und die Genauigkeit der FDR-Schätzung17 verbessert. Die Spektralbibliothek zur Generierung einer Lockvogeldatenbank wurde für eine bessere Leistungdemonstriert 18. Hier haben wir die auf der Spektralbibliothek basierende Methode verbessert und eine Software namens XY-Meta19 entwickelt, die die Genauigkeit der FDR-Schätzung weiter verbessern kann. Es verwendet die vorhandene Referenzspektralbibliothek, um eine Lockvogelbibliothek für die FDR-Kontrolle im Rahmen des Target-Decoy-Schemas zu generieren. XY-Meta unterstützt seine eigenen Spektrenanpassungs- und Kosinus-Ähnlichkeitsalgorithmen. Es ermöglicht konventionelle Such- und iterative Suchmodi. Im Schritt der FDR-Bewertung unterstützt es den Target-Decoy-Verkettungsmodus und den getrennten Modus. Für mehr Flexibilität akzeptiert XY-Meta externe Lockvogelbibliotheken.
Der Spitzennachweis und die Quantifizierung von Metaboliten ist ebenfalls ein wichtiger Schritt der ungezielten Metabolomanalyse. Die Peak-Detektion ist die Hauptmethode zur Identifizierung von Metabolomen. Im Allgemeinen wurde die Genauigkeit der Spitzendetektion von Metaboliten durch mehrere Faktoren beeinflusst, wie z. B. Rauschsignale der Massenspektrometrie, geringe Häufigkeit von Metaboliten, Verunreinigungen und Abbauprodukten von Metaboliten20. Wenn die Anzahl der Proben von zu groß ist oder die flüssige Chromatographiesäule in Experimenten mit ungezieltem Metabolom ersetzt wurde, können bemerkenswerte Chargeneffekte auftreten, was eine große Herausforderung für die Metabolomquantifizierung darstellt21,22,23. Derzeit können Software wie XCMS 24, Workflow4Metabolomic25, iMet-Q26 und metaX19 Spitzenerkennung und Quantifizierung von ungezielten Metabolomen durchführen, aber wir schlagen vor, dass die Pipeline von metaX vollständiger und einfacher zu bedienen ist. Hier demonstrieren wir den Prozess der Identifizierung und FDR-Kontrolle für einen öffentlich zugänglichen Datensatz msv000084112 mit XY-Meta und den Spitzennachweis und die Quantifizierung von Metaboliten mit metaX. Dieser Workflow erfordert nur zwei Gruppen, und jede Gruppe benötigt mindestens zwei Beispiele. MS/MS-Spektrendaten werden unabhängig von der Massenspektrometerplattform, dem Ionisationsmodus, dem Ladungsmodus und dem Probentyp benötigt und können die probenbasierte Normalisierung und die peakbasierte Normalisierung unterstützen. Nach diesem Beispiel können Forscher die Identifizierung und Quantifizierung von Metabolomics auf einfache Weise durchführen. Die Verwendung dieser Pipeline erfordert R-Programmierfunktionen. Um dem Forscher ohne Programmierkenntnisse zu helfen, haben wir auch eine Cloud-Analyseplattform für die Metabolomik-Analyse entwickelt. Wir haben diese Cloud-Analyseplattform in Supplementary Material 5 demonstriert.
Die FDR-Kontrolle von nicht zielgerichteten Metaboliten war eine große Herausforderung. Hier demonstrierten wir eine vollständige Pipeline von groß angelegten, ungezielten Metabolomik-Analysen (qualitativ und quantitativ) mit FDR-Kontrolle. Dies reduziert effektiv die falsch positiven Ergebnisse, die in der MS-Analyse sehr häufig vorkommen.
Die Vorbereitung einer geeigneten Referenzspektralbibliothek für Ihre Studie ist ein wichtiger Punkt. Eine erfolgreiche und sensitive MS/MS-Identifizi…
The authors have nothing to disclose.
Diese Arbeit wird durch das National Key Research and Development Program (2018YFC0910200/2017YFA0505001) und das Guangdong Key R&D Program (2019B020226001) unterstützt.
GNPS | open source | n/a | https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp |
XY-Meta | open source | n/a | https://github.com/DLI-ShenZhen/XY-Meta |
metaX | open source | n/a | https://github.com/wenbostar/metaX |
ProteoWizard | Free Download | 3.0.22116.18c918b-x86_64 | https://proteowizard.sourceforge.io/download.html |
CHI.Client | Free Download | ndp48-x86-x64-allos-enu | http://www.chi-biotech.com/technology.html?ty=ypt |