Nous avons construit un flux de travail métabolomique non ciblé qui intégrait XY-Meta et metaX ensemble. Dans ce protocole, nous avons montré comment utiliser XY-Meta pour générer une bibliothèque spectrale de leurre à partir de références de spectres en libre accès, puis effectué un contrôle FDR et utilisé le metaX pour quantifier les métabolites après avoir identifié les spectres métabolomiques.
Les techniques métabolomiques non ciblées sont largement utilisées ces dernières années. Cependant, l’augmentation rapide du débit et du nombre d’échantillons crée une énorme quantité de spectres, ce qui pose des défis pour le contrôle de la qualité des spectres de spectrométrie de masse. Pour réduire les faux positifs, un contrôle de la qualité du taux de fausse découverte (FDR) est nécessaire. Récemment, nous avons développé un logiciel pour le contrôle FDR de l’identification du métabolome non ciblé qui est basé sur une stratégie Target-Decoy nommée XY-Meta. Ici, nous avons démontré un pipeline d’analyse complet qui intègre XY-Meta et metaX ensemble. Ce protocole montre comment utiliser XY-meta pour générer une base de données de leurres à partir d’une base de données de référence existante et effectuer un contrôle FDR à l’aide de la stratégie Target-Decoy pour l’identification du métabolome à grande échelle sur un ensemble de données en libre accès. L’analyse différentielle et l’annotation des métabolites ont été effectuées après l’exécution de metaX pour la détection et la quantification des pics de métabolites. Afin d’aider davantage de chercheurs, nous avons également développé une plate-forme d’analyse conviviale basée sur le cloud pour ces analyses, sans avoir besoin de compétences en bioinformatique ou de langage informatique.
Les métabolites jouent un rôle important dans les processus biologiques. Les métabolites sont souvent des régulateurs de divers processus tels que le transfert d’énergie, les régulations hormonales, la régulation des neurotransmetteurs, les communications cellulaires et les modifications post-traductionnelles des protéines, etc. 1,2,3,4. La métabolomique non ciblée fournit une vue globale de nombreux métabolites 5,6. Avec les progrès de la spectrométrie de masse et des technologies de chromatographie, le débit des spectres MS/MS du métabolome augmente rapidement ces dernières années 7,8,9,10,11. Pour identifier les métabolites de ces énormes ensembles de données, divers logiciels d’annotation ont été développés11, tels que MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 et SLAW16. Cependant, ces identifications contiennent souvent de nombreux faux positifs. Les raisons incluent: (1) Les spectres MS / MS contiennent un bruit aléatoire, ce qui peut induire en erreur l’appariement des pics. (2) Les isomères et les différences d’énergies de fragmentation provoquent de multiples empreintes spectrales et augmentent ainsi le volume de la bibliothèque de référence. (3) La qualité des bibliothèques de référence varie. Une norme appropriée pour construire une bonne bibliothèque spectrale de référence est nécessaire. Par conséquent, un contrôle systématique du taux de fausse découverte (FDR) pour la métabolomique non ciblée est essentiel pour la recherche sur le métabolome fonctionnel 7,8,9,17.
L’approche empirique de Bayes et la stratégie Target-Decoy se sont toutes deux attaquées au problème du contrôle FDR en général. Kerstin Scheubert et al. ont montré que la stratégie Target-Decoy sur la base de données de leurres générée à partir de la méthode basée sur l’arbre de fragmentation est la meilleure méthode pour le contrôle FDR9. Xusheng Wang et al. ont conçu une méthode de génération de leurres basée sur la règle de l’octet en chimie et ont amélioré la précision de l’estimation FDR17. La bibliothèque spectrale pour la génération d’une base de données de leurres a été démontrée pour de meilleures performances18. Ici, nous avons amélioré la méthode basée sur la bibliothèque spectrale et développé un logiciel appelé XY-Meta19 qui peut encore améliorer la précision de l’estimation FDR. Il utilise la bibliothèque spectrale de référence existante pour générer une bibliothèque de leurres pour le contrôle FDR dans le cadre du schéma Target-Decoy. XY-Meta prend en charge ses propres algorithmes de correspondance spectrale et de similitude de cosinus. Il permet des modes de recherche conventionnels et de recherche itérative. Dans l’étape de l’évaluation FDR, il prend en charge le mode concaténé cible-leurre et le mode séparé. Pour une meilleure flexibilité, XY-Meta accepte les bibliothèques de leurres externes.
La détection et la quantification des pics de métabolites constituent également une étape importante de l’analyse du métabolome non ciblé. La détection des pics est la principale méthode d’identification du métabolome. En général, la précision de la détection des pics de métabolites a été affectée par de multiples facteurs, tels que les signaux sonores de spectrométrie de masse, la faible abondance de métabolites, les contaminants et les produits de dégradation des métabolites20. Lorsque le nombre d’échantillons de est trop grand ou que la colonne de chromatographie liquide a été remplacée dans des expériences de métabolome non ciblé, des effets de lot remarquables peuvent apparaître, ce qui constitue un défi majeur pour la quantification du métabolome 21,22,23. Actuellement, des logiciels comme XCMS24, Workflow4Metabolomic25, iMet-Q26 et metaX19 peuvent effectuer la détection de pointe et la quantification du métabolome non ciblé, mais nous suggérons que le pipeline de metaX est plus complet et plus facile à utiliser. Ici, nous démontrons le processus d’identification et de contrôle FDR pour un ensemble de données accessible au public msv000084112 à l’aide de XY-Meta, ainsi que la détection et la quantification des pics de métabolites à l’aide de metaX. Ce flux de travail ne nécessite que deux groupes et chaque groupe a besoin d’au moins deux exemples. Les données spectrales MS/MS sont nécessaires, indépendamment de la plate-forme du spectromètre de masse, du mode d’ionisation, du mode de charge et du type d’échantillon, et peuvent prendre en charge la normalisation basée sur l’échantillon et la normalisation basée sur les pics. En suivant cet exemple, les chercheurs peuvent effectuer l’identification et la quantification métabolomiques d’une manière facile à manipuler. L’utilisation de ce pipeline nécessite une capacité de programmation R. Pour aider le chercheur sans aucune connaissance en programmation, nous avons également développé une plate-forme d’analyse cloud pour l’analyse métabolomique. Nous avons fait la démonstration de cette plate-forme d’analyse cloud dans le document supplémentaire 5.
Le contrôle FDR des métabolites non ciblés a été un grand défi. Ici, nous avons démontré un pipeline complet d’analyse métabolomique non ciblée à grande échelle (qualitative et quantitative) avec contrôle FDR. Cela réduit efficacement les faux positifs, qui sont très fréquents dans l’analyse de la SEP.
La préparation d’une bibliothèque spectrale de référence appropriée pour votre étude est un point clé. Une identification MS/MS réussie et sensible nécessite non s…
The authors have nothing to disclose.
Ce travail est soutenu par le National Key Research and Development Program (2018YFC0910200/2017YFA0505001) et le Guangdong Key R&D Program (2019B020226001).
GNPS | open source | n/a | https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp |
XY-Meta | open source | n/a | https://github.com/DLI-ShenZhen/XY-Meta |
metaX | open source | n/a | https://github.com/wenbostar/metaX |
ProteoWizard | Free Download | 3.0.22116.18c918b-x86_64 | https://proteowizard.sourceforge.io/download.html |
CHI.Client | Free Download | ndp48-x86-x64-allos-enu | http://www.chi-biotech.com/technology.html?ty=ypt |