I denne protokol præsenterer vi en optimeret arbejdsgang, som kombinerer en effektiv og hurtig prøveforberedelse af mange prøver. Derudover giver vi en trinvis vejledning til at reducere analytiske variationer til evaluering af metaboliske GWAS-undersøgelser med høj kapacitet.
Både gaskromatografi-massespektrometri (GC-MS) og væskekromatografi-massespektrometri (LC-MS) er almindeligt anvendte metabolomics-tilgange til at detektere og kvantificere hundredtusindvis af metabolitfunktioner. Anvendelsen af disse teknikker på et stort antal prøver er imidlertid underlagt mere komplekse interaktioner, især for genom-dækkende associeringsundersøgelser (GWAS). Denne protokol beskriver en optimeret metabolisk arbejdsgang, som kombinerer et effektivt og hurtigt prøveforberedelse med analysen af et stort antal prøver til bælgplanteafgrøder. Denne let modificerede ekstraktionsmetode blev oprindeligt udviklet til analyse af plante- og dyrevæv og er baseret på ekstraktion i methyltert-butylether: methanolopløsningsmiddel for at muliggøre indfangning af polære og lipidmetabolitter. Derudover giver vi en trinvis vejledning til reduktion af analytiske variationer, som er afgørende for high-throughput evaluering af metabolisk varians i GWAS.
Storstilede “omics”-tilgange har gjort det muligt at analysere komplekse biologiske systemer 1,2,3 og yderligere forståelse af sammenhængen mellem genotyper og de resulterende fænotyper4. Metabolomics ved hjælp af ultra-højtydende væskekromatografi-massespektrometri (UHPLC-MS) og GC-MS muliggjorde påvisning af en overflod af metabolitegenskaber, hvoraf kun nogle er kommenteret til en vis grad, hvilket resulterer i en høj andel af ukendte metabolitter. Komplekse interaktioner kan udforskes ved at kombinere storskala metabolomics med den underliggende genotypiske variation af en forskelligartet population5. Håndtering af store prøvesæt er imidlertid i sagens natur forbundet med analytiske variationer, hvilket forvrænger evalueringen af metabolisk varians for yderligere downstream-processer. Specifikt er store problemer, der fører til analytiske variationer, baseret på maskinens ydeevne og instrumentelle drift over tid6. Integrationen af batch-til-batch-variation er udfordrende og især problematisk, når man analyserer store strukturerede plantepopulationer. Flere normaliseringsprocedurer blev foreslået for at korrigere for ikke-biologiske variationer, f.eks. brugen af interne, eksterne og isotopmærkede interne standarder for at korrigere for analytiske fejl, hvoraf hver især i sagens natur er forbundet med kendte problemer og faldgruber 7,8,9,10.
Ud over analytisk variation varierer valget af ekstraktionsprotokoller generelt afhængigt af analysemetoden. I sidste ende ønskes det at reducere materiale- og lønomkostninger samt nødvendigheden af at anvende flere alikvoter af den samme prøve til forskellige analytiske processer ved at udføre faseadskillelsesbaserede ekstraktionsmetoder. Disse metoder blev først introduceret ved anvendelse af chloroform: methanol/vandopløsningsmidler til fraktionering af polære og hydrofobe forbindelser11.
Denne protokol beskriver en hurtig rørledning med høj kapacitet til en multi-omics-platform til profilering af både polære metabolitter og lipider i bælgplantearter. Endvidere viser det, hvordan disse datasæt kan korrigeres korrekt for analytisk variation og normaliseres, før genotypiske oplysninger integreres for at detektere metabolit kvantitative træk loci (QTL) ved at udføre GWAS.
Både GC-MS og LC-MS er meget anvendte værktøjer til profilering af komplekse blandinger af forskellige metabolitklasser. Håndtering af store datasæt med disse værktøjer er i sagens natur forbundet med en ikke-biologisk variation, f.eks. analytisk variation, som forstyrrer og skævvrider fortolkningen af resultaterne. Denne protokol præsenterer en robust ekstraktionspipeline med høj kapacitet til omfattende metabolisk profilering for at eliminere variation af ikke-biologisk oprindelse og udføre store “omics” -undersøgelser. De mængder og koncentrationer, der blev anvendt i denne protokol, blev justeret for bælgplantearter i forskellige væv. Disse parametre kan dog ændres lidt og bruges også til store metaboliske prøver fra andre plantearter.
De tidligere15 beskrevne MTBE-baserede ekstraktioner kan bruges til at analysere derivatiserede metabolitter, halvpolære metabolitter og lipider. Dette kan udvides til protein- og plantehormonekstraktioner39, som ikke var omfattet af denne protokol. Andre ekstraktionsprotokoller er afhængige af dichlormethan:ethanolblandinger40,41. Af disse ekstraktionsprotokoller giver MTBE: methanolekstraktionsprotokollen et gunstigt og mindre farligt alternativ til de eksisterende chloroformbaserede ekstraktionsprotokoller42 og resulterer ikke i en proteinpellet som en interfase mellem polære og lipidfaser. Desuden er MTBE-metoder allerede blevet anvendt i flere undersøgelser for forskellige biologiske prøver 43,44,45.
Denne protokol diskuterer flere afgørende trin, der kan føre til potentiel variation under håndtering af et stort antal prøver, f.eks. under høst12,13, ekstraktion14 samt randomisering46. Desuden er der yderligere spørgsmål, der ikke er blevet diskuteret i denne protokol, der skal overvejes for at sikre metabolomiske data af høj kvalitet, f.eks. matrixeffekt og ionundertrykkelse14.
Effekten af QC-baserede normaliseringsmetoder afhænger i sagens natur af antallet af QC-prøver i hver batch. Som tidligere nævnt er QC’ernes variation relativt marginal sammenlignet med variationen mellem batcher i disse analysesystemer, som illustreret i figur 3, selv om antallet ville øge effekten. Samlet set er der andre QC-baserede normaliseringsmetoder, såsom systemisk fejlfjernelse ved hjælp af tilfældig skov (SERRF), som har vist sig at overgå de fleste af de andre normaliseringsmetoder såsom batch-wise-ratio, normalisering ved hjælp af et optimalt udvalg af flere interne standarder (NOMIS) og probabilistisk kvotientnormalisering (PQN)47 . SERRF er imidlertid afhængig af flere QC-prøver i hver batch, f.eks. hver tiende prøve, hvilket ikke er muligt under håndtering af et stort antal prøver. Den største fordel ved QC-baseret normalisering i forhold til andre datadrevne eller interne standardbaserede metoder er, at den bevarer den væsentlige biologiske variation, samtidig med at den imødekommer uønsket teknisk variation28. Læsere kan henvise til denne anmeldelse om håndtering af variation28.
Et hovedproblem i GWAS er antallet af falske positiver, der hovedsagelig stammer fra forbindelsen mellem kausale og ikke-kausale steder 48,49. For det andet korrigerer de konservative statistiske korrektionsmetoder, f.eks. Bonferroni og FDR, for antallet af uafhængige tests, som ikke er lig med antallet af analyserede SNP’er i GWAS på grund af sammenhængen mellem nærmeste SNP’er50,51 Derfor er det faktiske antal uafhængige tests ofte lavere. En anden måde at reducere den konservative statistiske tærskel på ville være at reducere antallet af testede SNP’er, der anvendes til GWAS baseret på koblingshenfald over definerede genomiske regioner52. Den GWAS-integrerede metabolomics-platform med høj kapacitet, der er beskrevet i denne protokol, har en bred vifte af applikationer. Det vil især lette forbedringer i afgrødeforædling ved at ændre metabolit/lipidsammensætningen for industrielt og ernæringsmæssigt ønskede niveauer. Samlet set har metabolomics givet en dybdegående indsigt i den genetiske arkitektur af en overflod af metabolitter og metabolisk diversificering, der opstod under afgrøde domesticering i løbet af de sidste årtier, hvilket indikerer det store potentiale i metabolomics-associeret avl53. De molekylærbiologiske tilgange til downstream QTL-validering omfatter generering af CRISPR/Cas9-mutantlinjer54, T-DNA-indsættelseslinjer55, stabile og/eller forbigående overekspressionslinjer56, VIGS, ex vivo metabolomics nærmer sig57 ved siden af den konventionelle tilgang til generering af kryds F2-populationer samt krydsvalidering i forskellige populationer.
Ved at udføre den nødvendige korrektion for de analytiske variationer som beskrevet ovenfor kan der udføres flere integrerede tilgange ud over GWAS, såsom metabolit-metabolit, metabolit-lipid-korrelationsanalyse, korrelationsanalyse til fænomendata for at kaste lys over mere komplekse træk og / eller co-ekspressionsanalyse for yderligere at opklare grundlaget for biologiske systemer58.
The authors have nothing to disclose.
M.B. understøttes af IMPRS-PMPG ‘Primary Metabolism and Plant Growth’. A.R.F. og S.A. anerkender den finansielle støtte fra EU’s Horizon 2020 Forsknings- og Innovationsprogram, projekt PlantaSYST (SGA-CSA nr. 739582 under FPA nr. 664620) og projekt INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |