Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization

Mustafa Bulut; Alisdair R. Fernie; Saleh Alseekh

doi:10.3791/62732

JoVE Journal > Biochemistry

Biochimie

Large-scale Multi-omics Genome-wide Association Studies (Mo-GWAS): Retningslinjer for prøveforberedelse og normalisering

Published: July 27, 2021

doi:

10.3791/62732

Mustafa Bulut, Alisdair R. Fernie², Saleh Alseekh²

¹Max-Planck-Institute of Molecular Plant Physiology, ²Center of Plant Systems Biology and Biotechnology

Summary

I denne protokol præsenterer vi en optimeret arbejdsgang, som kombinerer en effektiv og hurtig prøveforberedelse af mange prøver. Derudover giver vi en trinvis vejledning til at reducere analytiske variationer til evaluering af metaboliske GWAS-undersøgelser med høj kapacitet.

Abstract

Både gaskromatografi-massespektrometri (GC-MS) og væskekromatografi-massespektrometri (LC-MS) er almindeligt anvendte metabolomics-tilgange til at detektere og kvantificere hundredtusindvis af metabolitfunktioner. Anvendelsen af disse teknikker på et stort antal prøver er imidlertid underlagt mere komplekse interaktioner, især for genom-dækkende associeringsundersøgelser (GWAS). Denne protokol beskriver en optimeret metabolisk arbejdsgang, som kombinerer et effektivt og hurtigt prøveforberedelse med analysen af et stort antal prøver til bælgplanteafgrøder. Denne let modificerede ekstraktionsmetode blev oprindeligt udviklet til analyse af plante- og dyrevæv og er baseret på ekstraktion i methyltert-butylether: methanolopløsningsmiddel for at muliggøre indfangning af polære og lipidmetabolitter. Derudover giver vi en trinvis vejledning til reduktion af analytiske variationer, som er afgørende for high-throughput evaluering af metabolisk varians i GWAS.

Introduction

Storstilede “omics”-tilgange har gjort det muligt at analysere komplekse biologiske systemer ^1,2,3 og yderligere forståelse af sammenhængen mellem genotyper og de resulterende fænotyper⁴. Metabolomics ved hjælp af ultra-højtydende væskekromatografi-massespektrometri (UHPLC-MS) og GC-MS muliggjorde påvisning af en overflod af metabolitegenskaber, hvoraf kun nogle er kommenteret til en vis grad, hvilket resulterer i en høj andel af ukendte metabolitter. Komplekse interaktioner kan udforskes ved at kombinere storskala metabolomics med den underliggende genotypiske variation af en forskelligartet population⁵. Håndtering af store prøvesæt er imidlertid i sagens natur forbundet med analytiske variationer, hvilket forvrænger evalueringen af metabolisk varians for yderligere downstream-processer. Specifikt er store problemer, der fører til analytiske variationer, baseret på maskinens ydeevne og instrumentelle drift over tid⁶. Integrationen af batch-til-batch-variation er udfordrende og især problematisk, når man analyserer store strukturerede plantepopulationer. Flere normaliseringsprocedurer blev foreslået for at korrigere for ikke-biologiske variationer, f.eks. brugen af interne, eksterne og isotopmærkede interne standarder for at korrigere for analytiske fejl, hvoraf hver især i sagens natur er forbundet med kendte problemer og faldgruber 7,8,9,10.

Ud over analytisk variation varierer valget af ekstraktionsprotokoller generelt afhængigt af analysemetoden. I sidste ende ønskes det at reducere materiale- og lønomkostninger samt nødvendigheden af at anvende flere alikvoter af den samme prøve til forskellige analytiske processer ved at udføre faseadskillelsesbaserede ekstraktionsmetoder. Disse metoder blev først introduceret ved anvendelse af chloroform: methanol/vandopløsningsmidler til fraktionering af polære og hydrofobe forbindelser¹¹.

Denne protokol beskriver en hurtig rørledning med høj kapacitet til en multi-omics-platform til profilering af både polære metabolitter og lipider i bælgplantearter. Endvidere viser det, hvordan disse datasæt kan korrigeres korrekt for analytisk variation og normaliseres, før genotypiske oplysninger integreres for at detektere metabolit kvantitative træk loci (QTL) ved at udføre GWAS.

Protocol

1. Eksperimentelt design og plantedyrkning BEMÆRK: Opsætning af eksperimentet afhængigt af den eksperimentelle hypotese, f.eks. ved hjælp af en storskala GWAS-population reducerer behovet for flere replikater, da statistisk test vil blive udført baseret på haplotyperne for alle de enkelte SNP’er i stedet for tiltrædelsen. I modsætning hertil er flere replikater uundværlige i andre eksperimentelle tilgange. Følgende punkter skal overvejes under forberedelsen af eksperimentet. Medtag nok biologiske replikater, afhængigt af den eksperimentelle hypotese. Randomiser de biologiske replikater blokvis for at reducere lokal miljøbias under dyrkning, f.eks. drivhus, mark. Sørg for korrekt vedligeholdelse af planten under vækst. Behandl planter homogent for at reducere bias. 2. Forberedelse af biologisk plantemateriale Høst forberedelse Etikethøsterør (20 ml) indeholdende to metalperler med en diameter på 5 mm og to 8 mm med en diameter til homogenisering. Fyld en dewar med flydende nitrogen.BEMÆRK: Planter skal være i det vegetative stadium til høst af frisk blad og rodvæv. Høst biologiske prøver ved flashfrysning i flydende nitrogen. Der høstes så hurtigt som muligt for at udelukke døgnrytmens indflydelse på stofskiftet under langvarig høstperiode 12,13. Opbevar det høstede friske blad- og rodvæv til videre behandling ved -80 °C.BEMÆRK: Bladskæring til flashfrysning bør ikke tage længere tid end et par sekunder, da aktive biologiske processer efter bladspaltning ville ændre metaboliske profiler på grund af sårdannelse. For rødder skal du præclean rødderne ved at vaske med vand før flashfrysning i flydende nitrogen. Overskydende vand på rodoverfladen skal gennemblødes med papirvæv. Tørrede frø kan opbevares ved stuetemperatur; der kræves ingen frysning i flydende nitrogen. Slib vævet ved hjælp af en vævsblandermølle. Precool rørholderne i flydende nitrogen i et par minutter for at opretholde en lav temperatur, mens vævet slibes. Transporter de biologiske prøver i en nitrogenholdig dewar efter at have taget dem ud af -80 °C fryseren. Slib vævene for at opnå homogent pulver; brug 25 Hz i 1 minut og gentag efter frysning i flydende nitrogen, hvis vævet ikke er homogent formalet. Til slibning af tørrede frø skal du placere frøene i en slibekrukke med en metalperle på 15 mm i diameter. Anvende samme hyppighed og tid som nævnt i punkt 2.3.3.BEMÆRK: Rene og forkølede mørtler og pistler kan bruges, hvis en vævsblandermølle ikke er tilgængelig. Precool mærket 2 ml sikker lås mikrocentrifuge rør. 50 mg afvejes med en fejl på ±5 mg frisk plantemateriale ved hjælp af en analytisk vægt. Precool de værktøjer, der anvendes til overførsel af plantemateriale i flydende nitrogen. Sørg for, at plantematerialet forbliver frosset under vejningsprocessen.BEMÆRK: Udsæt ikke frisk plantemateriale for længe for stuetemperatur, da biologiske processer aktiveres ved at øge temperaturen og ændre metaboliske profiler14. Der genereres yderligere kvalitetskontrolprøver ved at samle en andel af hver prøve og veje 50 mg med en fejl på ±5 mg poolet frisk plantemateriale i forkølede 2 ml mikrocentrifugerør med sikker lås.BEMÆRK: Mindst tre QC-prøver anbefales for hver 60 prøver. QC-prøverne er afgørende for downstream-korrektion, normalisering og analyser. 3. Ekstraktionsreagenser Frisk væv, fx blade og rødderBEMÆRK: Prøveekstraktion er baseret på en tidligere beskrevet protokol15. Denne protokol er blevet ændret baseret på nuværende behov, f.eks. flere væv, forskellige interne standarder og store eksperimenter. Derudover er alle volumener og instrumentindstillinger, der er nævnt nedenfor, justeret til interne analytiske enheder. Protokolbrugere bør justere disse i henhold til deres analytiske enhed og biologiske prøver baseret på testprøver. Ekstraktionsblanding 1 (EM1): methyltert-butylether (MTBE)/methanol (MeOH) (3:1 v/v) Forbered en blanding af MTBE/MeOH i forholdet 3:1. For 100 ml ekstraktionsmiddel blandes 75 ml MTBE med 25 ml MeOH i en ren glasflaske.BEMÆRK: Opløsningsmidler skal håndteres forsigtigt i stinkhætten med korrekt sikkerhedsudstyr. Der tilsættes 45 μL 1,2-diheptadecanoyl-sn-glycero-3-phosphocholin (1 mg/ml i chloroform) som en intern standard for den UHPLC-MS-baserede lipidanalyse, 400 μL ribitol (1 mg/ml i vand) som intern standard for den GC-MS-baserede analyse og 125 μL isovitexin (1 mg/ml i MeOH/vand (1:1 v/v)) til UHPLC-MS-baseret metabolitanalyse.BEMÆRK: Tilføjelsen af interne standarder er nødvendig for normaliseringen efter analysen i henhold til analytiske behov. Da der er behov for 1 ml EM1 for hver prøve, skal der fremstilles en stamopløsning i henhold til den eksperimentelle prøvestørrelse, som skal anvendes til hele eksperimentet. EM1 skal opbevares ved -20 °C. Kontroller for fraværet af den anvendte interne standard og overlapning med andre forbindelser i de undersøgte arter. Flere standarder kan bruges; udvælgelsen af de interne standarder i denne protokol var baseret på tidligere test ved hjælp af almindelige bønneekstrakter16. Ekstraktionsblanding 2 (EM2) vand/methanol (MeOH) (3:1 v/v) For 100 ml EM2 tilsættes 75 ml dobbeltdestilleret vand og 25 ml MeOH i en ren glasflaske. Der tilsættes 500 μL EM2 pr. prøve, og der fremstilles en stamopløsning i henhold til den eksperimentelle prøvestørrelse, som skal anvendes til hele forsøget. Em2 opbevares ved 4 °C. Tørrede frø Ekstraktionsblanding 3 (EM3) methanol (MeOH)/vand (7:3 v/v) For 100 ml EM3 tilsættes 70 ml MeOH og 30 ml dobbeltdestilleret vand i en ren glasflaske. Forbered 1 ml EM3 for hver prøve. Der tilsættes 400 μL ribitol (1 mg/ml i vand) som interne standarder for den GC-MS-baserede analyse og 125 μL Isovitexin (1 mg/ml i MeOH/vand (1:1 v/v)) til UHPLC-MS-baseret metabolitanalyse.BEMÆRK: Forbered en stamopløsning i henhold til den eksperimentelle prøvestørrelse, og brug den til hele eksperimentet. Em3 opbevares ved 4 °C. 4. Ekstraktion af prøver Frisk væv, fx blade og rødder Forbered tre 1,5 ml mikrocentrifugerør med sikker lås til hver prøve. Opbevar EM1 i et -20 °C væskekølesystem. De friske prøver overføres fra -80 °C fryseren til tøris eller flydende nitrogen til transport. Der tilsættes 1 ml forkølet EM1 til hver 50 mg aliquot og hvirvel kort før is. Prøverne inkuberes på en orbitalryster ved 800 × g i 10 minutter ved 4 °C. Soniker prøverne i et iskølet sonikeringsbad i 10 minutter. Der tilsættes 500 μL EM2 ved hjælp af en pipette med flere kanaler for at undgå variation i tilsatte volumener. Tryk prøverne kortvarigt for at blande ekstraktionsblandingerne, inden de centrifugeres ved 11.200 × g i 5 minutter ved 4 °C. Efter faseadskillelse overføres 500 μL af den øvre lipidholdige fase til et forudmærket 1,5 ml mikrocentrifugerør med sikker lås. Fjern resten af den øvre fase.BEMÆRK: Vær forsigtig under overførsel, da denne øvre fase har et højt damptryk og har tendens til at lække ud fra pipetten. Overfør 150 μL og 300 μL af de nedre polære og halvpolære metabolitholdige faser i to 1,5 ml mikrocentrifugerør, der anvendes til henholdsvis GC-MS- og UHPLC-MS-analyse. Koncentrer alle de ekstraherede fraktioner ved at lade opløsningsvæskerne fordampe uden opvarmning ved hjælp af en vakuumkoncentrator og opbevares ved -80 °C. Tørrede frø Der fremstilles to 1,5 ml mikrocentrifugerør med sikker lås til hver prøve. Hold EM3 på is. Der anbringes en metalperle med en diameter på 5 mm i prøvealfocterne. Der tilsættes 1 ml EM3 i hver 50 mg aliquot, og prøverne homogeniseres ved 25 Hz i 2-3 minutter, før de lægges på is. Soniker prøverne i et iskølet sonikeringsbad i 10 minutter. Tryk prøverne kortvarigt inden centrifugering ved 11.200 × g i 5 minutter ved 4 °C. Overfør 150 μL og 300 μL af supernatanten i to 1,5 ml mikrocentrifugerør med sikker lås, der anvendes til henholdsvis GC-MS- og UHPLC-MS-analyse. Koncentrer alle ekstraherede fraktioner ved at lade opløsningsvæskerne fordampe uden opvarmning ved hjælp af en vakuumkoncentrator og opbevares ved -80 °C.BEMÆRK: Baseret på erfaring rådes brugerne til at udføre trin 4.2 for semipolære metabolitter og derivatiseret metabolitanalyse i tørrede frø. Udfør ekstraktionstrin 4.1 til analyse af tørret frølipid. 5. Analyse af lipider ved hjælp af UHPLC-MS Re-suspension de tørrede lipidfraktioner i 250 μL acetonitril: 2-propanol (7: 3, vol / vol). Soniker lipidfasen i 5 minutter, centrifuger ved 11.200 × g i 1 min. Overfør 90 μL af supernatanten til et hætteglas med glas til LC-MS. 2 μL af ekstrakterne injiceres i LC-MS. Lipidfraktionering udføres på en omvendt fase C8-søjle, der holdes ved 60 °C, og som løber med en strømning på 400 μL/min med gradvise ændringer af eluent A og B som vist i tabel 1. Massespektrene erhverves i positiv ioniseringstilstand med et masseområde på 150-1.500 m /z. Inkluder flere QC-prøver i alle daglige batcher og et tomt for at sikre korrektion for analytisk variation. Randomiser prøver blokvis i sekventiel rækkefølge. 6. Analyse af polære og halvpolære metabolitter ved hjælp af UHPLC-MS Den tørrede polære fase suspenderes igen i 180 μL methanol af UHPLC-kvalitet: vand (1:1 v/v). Soniker den polære fase i 2 minutter, centrifuger ved 11.200 × g i 1 min. Overfør 90 μL af supernatanten til et hætteglas med glas til LC-MS. 3 μL af ekstrakterne injiceres i LC-MS. Metabolitfraktionering udføres på en omvendt fase C18-kolonne med 40 °C løbende med en strømning på 400 μL/min med gradvise ændringer af eluent A og B som vist i tabel 1. Massespektrene erhverves i et masseområde på 100-1.500 m/z i en fuld MS-scanning og al ionfragmentering (AIF) induceret af højenergikollisionsdissociation (HCD) på 40 keV.BEMÆRK: Brug begge ioniseringstilstande. På grund af begrænset kapacitet, mens du kører et stort antal prøver, skal du dog køre testprøver i begge ioniseringstilstande for at bestemme den foretrukne ioniseringstilstand. Inkluder flere QC-prøver i alle daglige batcher og et tomt for at sikre korrektion for analytisk variation. Randomiser prøver blokvis i sekventiel rækkefølge. Kør en samlet QC i dataafhængig MS2 i både negative og positive ioniseringstilstande. Brug de opnåede massespektre i et senere trin (8.5) til anmærkning. 7. Analyse af derivatiserede metabolitter ved anvendelse af GC-MS17,18 BEMÆRK: Analysen af derivatiserede metabolitter er baseret på en tidligere beskrevet protokol17. Håndter alle derivatiseringsreagenser i røghætten. Sørg for, at N-methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) ikke kommer i kontakt med vand og fugtighed. Derivatiseringsreagens 1 (DR1) Methoxyaminhydrochlorid opløses i pyridin for at opnå en koncentration på 30 mg/ml DR1. Brug 40 μL DR1 for hver prøve. Forbered en stamopløsning i henhold til prøvestørrelsen, og opbevar ved stuetemperatur. Derivatiseringsreagens 2 (DR2) MSTFA opløses med 20 μL fedtsyremethylestere (FAME’er) pr. 1 ml MSTFA. Brug 70 μL DR2 for hver prøve. Forbered en stamopløsning i henhold til prøvestørrelsen. Opbevar MSTFA ved 4 ° C og FAME’erne ved -20 ° C.BEMÆRK: FAME’er omfatter methylcaprylat, methylpelargonat, methylcaprat, methyllaurat, methylmyristat, methylpalmitat, methylstearat, methyleicosanoat, methyldocosanoat, lignocersyremethylester, methylhexacosanoat, methyloctacosanoat og triacontansyremethylester, som opløses iCHCl3 i en koncentration på henholdsvis 0,8 μL/ml eller 0,4 mg/ml for flydende eller faste standarder. Tør pelleten fra polarfasen (opbevaret ved -80 °C) igen ved hjælp af en vakuumkoncentrator i 30 minutter for at undgå interferens af H2O med oprindelse under opbevaringen med de opløsningsmidler, der anvendes til downstream-derivatiseringen. Tilsæt 40 μL DR1. Prøverne rystes ved 950 × g i 2 timer ved 37 °C ved hjælp af en orbitalryster efterfulgt af en kort centrifugering af væsken. Tilsæt 70 μL DR2. Ryst igen ved 950 × g i 30 minutter ved 37 °C ved hjælp af en orbitalryster. Centrifuger kortvarigt ved stuetemperatur, før 90 μL overføres til hætteglas med glas til GC-MS-analyse. 1 μL til GC-MS splitless mode, afhængigt af metabolitkoncentrationerne, injiceres med en konstant heliumbærergasstrøm på 2 ml/min. Injektionstemperaturen indstilles til 230 °C ved hjælp af en 30 m MDN-35 kapillærsøjle.BEMÆRK: Yderligere oplysninger, f.eks. temperaturgradient, findes i tabel 1. Masseområdet er indstillet til 70-600 m/z med 20 scanninger/min. Inkluder split-tilstande for at muliggøre kvantificering af formodede overbelastningsforbindelser, hvilket sparer omkostninger og tid til ekstraktrestatisering i sådanne tilfælde. Inkluder flere QC-prøver i alle daglige batcher og et tomt for at sikre korrektion for analytisk variation. Randomiser prøver korrekt blokvis i sekventiel rækkefølge. 8. Kromatogrambehandling og sammensat annotation Filtrer kemisk støj ved at definere intensitetstærskler. Medtag alle QC-prøver under behandling af kromatogrammerne.BEMÆRK: For data i stor skala er støjfiltrering afgørende for at reducere computertid og processorkraft. Juster kromatogrammerne ved at definere et retentionstidsskiftvindue. Kontroller kromatogrammerne fra hver batch for at vurdere variationen inden for og mellem batch. Udfør topdetektion afhængigt af topformen, f.eks. højde og bredde for fuld bredde ved halvmaksimum (FWHM) beregninger. Klyngeisotoper for at reducere overflødige signaler og filtrere singletons fra.BEMÆRK: Se materialetabellen for detaljer om software, der anvendes til kromatogrambehandling. Der findes dybdegående protokoller om, hvordan man behandler kromatogrammer ved hjælp af forskellige frit tilgængelige softwareværktøjer, f.eks. MS-DIAL, MetAlign, MzMine og Xcalibur 19,20,21. Brug ddMS2-dataene for en samlet QC-prøve til sammensat annotation. Vurder molekylstrukturen ved at bestemme den monoisotopiske masse og observere almindelige neutrale tab, kendte ladede aglykegler og forskellige typer spaltninger, fx homolytiske eller heterolytiske16,22. For rapportering af metabolitdata skal du følge anbefalingen beskrevet i Fernie et al. 201123.BEMÆRK: Forskellige beregningsmetode metabolomics-tilgange kan bruges til at analysere metabolomics-data 24,25,26. 9. Normalisering af storskala metabolomics datasæt Kontroller fordelingen af de interne standarder og normaliser ved at korrigere for svaret på enkelte eller flere interne standarder. De maksimale intensiteter, der er opnået fra kromatogrammet, korrigeres over den nøjagtige prøvevægt ved at dividere spidsintensiteten med den alikvoterede homogeniserede prøvevægt fra trin 2.5. Korrekt for intensitetsdrift på tværs af serier med flere batcher. Udfør QC-baserede korrektionsmetoder såsom lokalt estimeret scatterplot-udjævning (LOESS)27 ved hjælp af R.BEMÆRK: Flere værktøjer og pakker er tilgængelige for at tackle driften af MS-ydeevnen under erhvervelsen af hele batcherne28,29. Sikre normal fordeling af træk ved datatransformation, f.eks. Box-Cox-transformation30 ved hjælp af boxcox () -funktionen fra R-pakken MASS til udførelse af GWAS. Udfør dataskalering, f.eks. Pareto-skalering, til multivariat analyse for at sikre korrekt vejning af forbindelser med lavt indhold af overflod31.BEMÆRK: Hvis det er muligt, skal du udføre et genopretningsassay for at undgå matrixeffekter, f.eks. ionundertrykkelse14. 10. Genom-dækkende associeringsundersøgelser (GWAS)32 Kald enkeltnukleotidpolymorfi (SNP) eller strukturelle varianter (SV) fra sekventeringsdataene 33,34. Filtrere genotypiske data for mindre allelfrekvens (MAF) 10% for at undgå lavfrekvent bias ved hjælp af Kvast35. Beregn de bedste lineære upartiske forudsigelser (BLUPs) for hver normaliseret funktion over de eksperimentelle gentagelser for at eliminere bias, der stammer fra miljøfaktorer (tilfældige effekter) ved hjælp af R-pakken Ime436. Brug BLUPs for hver funktion individuelt til at udføre GWAS ved hjælp af rMVP-pakken i R37.BEMÆRK: Hver metabolomics-funktion ses her som en individuel selvstændig fænotype. Under udførelse af GWAS korrigeres for befolkningsstruktur ved hjælp af hovedkomponentanalyse (PCA) og identitet efter stat (IBS) eller vanRaden for at minimere forvirrende effekter. Overvej desuden at bruge en blandet lineær model (MLM) eller en multi-locus blandet model (MLMM), da blandede modeller indeholder faste og tilfældige effekter. 11. QTL-detektion Kontroller de SNP’er, der viser betydelig sammenhæng, under hensyntagen til Manhattan-plottene, for beregninger af koblings uligevægt (LD) for at bestemme den underliggende genetiske region. Udfør LD-beregninger ved hjælp af R-pakken LD-varmekort eller Kvast 5. Kontroller de tilknyttede SNP’er for effektstørrelsen over egenskaben ved at undersøge egenskabsniveauerne for statistiske ændringer mellem haplotyper for at finde potentielle kausale SNP’er, fx SNP’er, der fører til en aminosyreændring i den proteinkodende sekvens, hvilket kan forklare den fænotypiske variation.BEMÆRK: Da SNP-egenskabsforeninger ikke nødvendigvis giver årsagssammenhæng, er det afgørende at bestemme det genomiske område. Sammensat identitet efter funktionsannotering kan hjælpe enormt med at finde de rigtige kandidatgener i en bestemt genomisk region. Vi foreslår at kombinere alle påviste QTL forbundet med visse forbindelser i et pleiotropisk kort for at understrege de genetiske regioner38, som vist i figur 4. Til validering af kandidatgener kan der udføres flere tilgange (se diskussionen).

Representative Results

Vellykkede metabolomics GWAS-eksperimenter bør begynde med et korrekt eksperimentelt design efterfulgt af prøveindsamling, ekstraktion, dataindsamling og behandling, som illustreret i figur 1. I denne protokol blev MTBE-metoden15 anvendt til at ekstrahere og analysere hundredvis af metabolitter, der tilhører flere sammensatte klasser. Kromatografi afhænger meget af egenskaberne af den anvendte søjle såvel som elueringsbufferblandinger. Figur 2 viser kromatogrammer af QC-prøver, hvilket indikerer elueringsmønsteret for nogle større lipidklasser i dette analytiske system. De anvendte gradienter for hver platform er angivet i tabel 1. Der blev lagt stor vægt på håndtering af systemiske fejl i store eksperimenter. Udførelse af storskala metabolomics er iboende forbundet med systemiske fejl. Til demonstration analyserede vi lipidomiske data på tværs af flere almindelige bønnearter. Supplerende tabel 1 indeholder de ekstraherede rå lipidomiske data opnået efter kromatogrambehandling ved hjælp af den software, der er angivet i materialetabellen. Efter denne protokol gjorde det muligt for os at omgå store problemer i håndteringen af omics-data, især under håndtering af store prøvesæt. Normaliseringsproceduren giver en nøjagtig korrektion af batchvise analytiske fejl, som det fremgår af figur 3. Selvom en forøgelse af antallet af QC-prøver ville øge normaliseringseffekten, er dette ikke altid muligt på grund af omkostnings- og tidsbegrænsninger. For metabolomics GWAS med høj kapacitet med ikke-målrettede metaboliske egenskaber er det vigtigt at illustrere et højere antal trækmarkørforening korrekt. Et pleiotropisk kort38, der kombinerer flere GWAS-resultater, kan bruges til at fremhæve de genomiske regioner, som flere træk er knyttet til (figur 4). Figur 1: Flowchart af den metabolomics-baserede GWAS i planter. Flere trin fra det eksperimentelle design op til detektion af QTL vises i venstre panel. I højre panel vises flere figurer for at understøtte flere trin, der er nævnt i venstre panel. Fra højre øverst vises (1) en foreslået sekvens af prøver for LC-MS, (2) præ- og postnormaliserede scorediagrammer af PCA, herunder en repræsentativ funktionsfordeling før og efterbehandling, med rød, der angiver QC-prøveintensiteter, og (3) et Manhattan-plot med betydelige foreninger, som LD- og haplotypefordelinger blev genereret til. Forkortelser: GWAS = genom-dækkende associeringsundersøgelser; QTL = kvantitativ egenskab loci; PCA = analyse af hovedkomponenter QC = kvalitetskontrol; LD = kobling uligevægt; MS = massespektrometri; LC-MS = væskekromatografi-massespektrometri; GC-MS = gaskromatografi-massespektrometri; LOESS = lokalt estimeret spredningsudjævning; MLM/MLMM = blandet lineær model/multi-locus blandet model. Klik her for at se en større version af denne figur. Figur 2: Kromatogrambehandling. To QC-kromatogrammer (base peak; lipiddata) fra forskellige batcher demonstrerer den batchvise variation for visse lipidklasser i de samlede QC-prøver. Fire store lipidklasser er angivet med deres respektive elueringsvinduer i det interne LC-MS-system. Kromatogrammerne blev eksporteret fra MzMine21. Forkortelser: QC = kvalitetskontrol; LC-MS = væskekromatografi-massespektrometri. Klik her for at se en større version af denne figur. Figur 3: Korrektion af systematisk fejl. Hovedkomponentanalyse af erhvervede lipidomiske data, præ- (venstre, rådata) og efterkorrektion for systemiske fejl (højre, batch loess). De nederste paneler illustrerer funktionsfordelingen (Cluster_00005) over prøverne (n = 650) og batcherne (n = 10) før ( venstre) og post (højre) -korrektion for analytisk variation. Forkortelser: PCA = analyse af hovedkomponenter; QC = kvalitetskontrol; LOESS = lokalt estimeret spredningsudjævning. Klik her for at se en større version af denne figur. Figur 4: Pleiotropisk kort, der illustrerer de kombinerede GWAS-resultater. Det pleiotropiske kort fremhæver regioner i hele genomet, der er forbundet med flere træk. Tallene på de ydre ringe angiver de tilsvarende kromosomer. Hver cirkel repræsenterer et individuelt træk med dets signifikant tilknyttede SNP’er. Farverne repræsenterer forskellige sammensatte klasser (grå = forbindelsesklasse 1; grøn = forbindelsesklasse 2; lilla = sammensat klasse 3; gul = forbindelsesklasse 4). I tilfælde af inter-sammensatte klasseforeninger med samme genomiske region fremhæves gener. Den indre grå cirkel viser summen af alle signifikante SNP’er forbundet med en bestemt genomisk position. Foreningerne vist i denne figur er kunstigt genereret kun til illustration. Forkortelser: GWAS = genom-dækkende associeringsundersøgelser; SNP’er = enkeltnukleotidpolymorfier. Klik her for at se en større version af denne figur. UHPLC-MS-indstillinger for lipider Tidspunkt [min] Eluent A til B [%]* Information 0 – 1.00 45% A Eluent A: 1% 1M NH4-acetat, 0,1% eddikesyre i vand (UHPLC-kvalitet) 1.00 – 4.00 lg 45% – 25% A Eluent B: 1% 1M NH4-acetat, 0,1% eddikesyre i acetonitril/2-propanol 7:3 (UHPLC-kvalitet) 4.00 – 12.00 lg 25% – 11% A Strømningshastighed: 400 μL/min 12.00 – 15.00 lg 11% – 0% A Injektionsvolumen: 2 μL 15.00 – 19.50 cw 0% A 19.50-19.51 0% – 45% A 19.51-24.00 eq 45% UHPLC-MS/MS-indstillinger for polære og halvpolære metabolitter Tidspunkt [min] Eluent A og B [%]* Information 0 – 1.00 99% A Eluent A: 0,1% myresyre i vand (UHPLC-kvalitet) 1.00 – 11.00 Lg 99% -60% A Eluent B: 0,1% myresyre i acetonitril (UHPLC-kvalitet) 11.00 – 13.00 lg 60% – 30% A Strømningshastighed: 400 μL/min 13.00 – 15.00 lg 30% – 1% A Injektionsvolumen: 3 μL 15.00 – 16.00 cw 1% A 16.00 – 17.00 lg 1% – 99% A 17.00 – 20.00 eq 99% A GC-MS-indstillinger for derivatiserede metabolitter Tidspunkt [min] Temperatur [°C] Information 0 – 2.00 85 Bæregas: Helium 2.00 – 18.66 Lg 80 – 330 Strømningshastighed: 2 ml/min 18.66 – 24.66 Se hele annoncen 330.000 2010 I går Temperaturgradient: 15 °C/min 24.66 hurtig afkøling Injektionsvolumen: 1 μL Tabel 1: Gradientindstillinger for hver af analyseplatformene7. Forkortelser: lg = lineær gradient; cw = søjlevask; eq = ligevægt; UHPLC-MS = ultra-højtydende væskekromatografi-massespektrometri; UHPLC-MS/MS = ultra-højtydende væskekromatografi-tandem massespektrometri; GC-MS = gaskromatografi-massespektrometri. * = procentværdi svarer til eluent A; resterende procentværdi svarer til eluent B. Supplerende tabel 1: Rå lipidomics data. Angiver spidsintensiteterne for hver af de påviste klynger over hver prøve. Klik her for at downloade denne tabel.

Discussion

Både GC-MS og LC-MS er meget anvendte værktøjer til profilering af komplekse blandinger af forskellige metabolitklasser. Håndtering af store datasæt med disse værktøjer er i sagens natur forbundet med en ikke-biologisk variation, f.eks. analytisk variation, som forstyrrer og skævvrider fortolkningen af resultaterne. Denne protokol præsenterer en robust ekstraktionspipeline med høj kapacitet til omfattende metabolisk profilering for at eliminere variation af ikke-biologisk oprindelse og udføre store “omics” -undersøgelser. De mængder og koncentrationer, der blev anvendt i denne protokol, blev justeret for bælgplantearter i forskellige væv. Disse parametre kan dog ændres lidt og bruges også til store metaboliske prøver fra andre plantearter.

De tidligere¹⁵ beskrevne MTBE-baserede ekstraktioner kan bruges til at analysere derivatiserede metabolitter, halvpolære metabolitter og lipider. Dette kan udvides til protein- og plantehormonekstraktioner³⁹, som ikke var omfattet af denne protokol. Andre ekstraktionsprotokoller er afhængige af dichlormethan:ethanolblandinger^40,41. Af disse ekstraktionsprotokoller giver MTBE: methanolekstraktionsprotokollen et gunstigt og mindre farligt alternativ til de eksisterende chloroformbaserede ekstraktionsprotokoller⁴² og resulterer ikke i en proteinpellet som en interfase mellem polære og lipidfaser. Desuden er MTBE-metoder allerede blevet anvendt i flere undersøgelser for forskellige biologiske prøver 43,44,45.

Denne protokol diskuterer flere afgørende trin, der kan føre til potentiel variation under håndtering af et stort antal prøver, f.eks. under høst^12,13, ekstraktion¹⁴ samt randomisering⁴⁶. Desuden er der yderligere spørgsmål, der ikke er blevet diskuteret i denne protokol, der skal overvejes for at sikre metabolomiske data af høj kvalitet, f.eks. matrixeffekt og ionundertrykkelse¹⁴.

Effekten af QC-baserede normaliseringsmetoder afhænger i sagens natur af antallet af QC-prøver i hver batch. Som tidligere nævnt er QC’ernes variation relativt marginal sammenlignet med variationen mellem batcher i disse analysesystemer, som illustreret i figur 3, selv om antallet ville øge effekten. Samlet set er der andre QC-baserede normaliseringsmetoder, såsom systemisk fejlfjernelse ved hjælp af tilfældig skov (SERRF), som har vist sig at overgå de fleste af de andre normaliseringsmetoder såsom batch-wise-ratio, normalisering ved hjælp af et optimalt udvalg af flere interne standarder (NOMIS) og probabilistisk kvotientnormalisering (PQN)⁴⁷ . SERRF er imidlertid afhængig af flere QC-prøver i hver batch, f.eks. hver tiende prøve, hvilket ikke er muligt under håndtering af et stort antal prøver. Den største fordel ved QC-baseret normalisering i forhold til andre datadrevne eller interne standardbaserede metoder er, at den bevarer den væsentlige biologiske variation, samtidig med at den imødekommer uønsket teknisk variation²⁸. Læsere kan henvise til denne anmeldelse om håndtering af variation²⁸.

Et hovedproblem i GWAS er antallet af falske positiver, der hovedsagelig stammer fra forbindelsen mellem kausale og ikke-kausale steder ^48,49. For det andet korrigerer de konservative statistiske korrektionsmetoder, f.eks. Bonferroni og FDR, for antallet af uafhængige tests, som ikke er lig med antallet af analyserede SNP’er i GWAS på grund af sammenhængen mellem nærmeste SNP’er^50,51 Derfor er det faktiske antal uafhængige tests ofte lavere. En anden måde at reducere den konservative statistiske tærskel på ville være at reducere antallet af testede SNP’er, der anvendes til GWAS baseret på koblingshenfald over definerede genomiske regioner⁵². Den GWAS-integrerede metabolomics-platform med høj kapacitet, der er beskrevet i denne protokol, har en bred vifte af applikationer. Det vil især lette forbedringer i afgrødeforædling ved at ændre metabolit/lipidsammensætningen for industrielt og ernæringsmæssigt ønskede niveauer. Samlet set har metabolomics givet en dybdegående indsigt i den genetiske arkitektur af en overflod af metabolitter og metabolisk diversificering, der opstod under afgrøde domesticering i løbet af de sidste årtier, hvilket indikerer det store potentiale i metabolomics-associeret avl⁵³. De molekylærbiologiske tilgange til downstream QTL-validering omfatter generering af CRISPR/Cas9-mutantlinjer⁵⁴, T-DNA-indsættelseslinjer⁵⁵, stabile og/eller forbigående overekspressionslinjer⁵⁶, VIGS, ex vivo metabolomics nærmer sig⁵⁷ ved siden af den konventionelle tilgang til generering af kryds F2-populationer samt krydsvalidering i forskellige populationer.

Ved at udføre den nødvendige korrektion for de analytiske variationer som beskrevet ovenfor kan der udføres flere integrerede tilgange ud over GWAS, såsom metabolit-metabolit, metabolit-lipid-korrelationsanalyse, korrelationsanalyse til fænomendata for at kaste lys over mere komplekse træk og / eller co-ekspressionsanalyse for yderligere at opklare grundlaget for biologiske systemer⁵⁸.

Divulgations

The authors have nothing to disclose.

Acknowledgements

M.B. understøttes af IMPRS-PMPG ‘Primary Metabolism and Plant Growth’. A.R.F. og S.A. anerkender den finansielle støtte fra EU’s Horizon 2020 Forsknings- og Innovationsprogram, projekt PlantaSYST (SGA-CSA nr. 739582 under FPA nr. 664620) og projekt INCREASE (GA 862862).

Materials

Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC)	Avanti Polar Lipids	850360P	Internal standard for lipids
Chloroform	Supleco	67-66-3	FAME solvent
Isovitexin	Sigma Aldrich	38953-85-4	Internal standard for metabolites
Lignoceric Acid Methylester	Sigma Aldrich	2442-49-1	FAME
Methanol (MeOH)	Biosolve Chemicals	13684102	ULC-MS grade
Methoxyamin -hydrochlorid	Sigma Aldrich	593-56-6	Metabolite deriviatization
Methyl laurate	Sigma Aldrich	111-82-0	FAME
Methyl myristate	Sigma Aldrich	124-10-7	FAME
Methyl palmitate	Sigma Aldrich	112-39-0	FAME
Methyl stearate	Sigma Aldrich	112-61-8	FAME
Methyl tert-butyl ether (MTBE)	Biosolve Chemicals	13890602	HPLC grade
Methyl-caprat	Sigma Aldrich	110-42-9	FAME
Methylcaprylat	Sigma Aldrich	111-11-5	FAME
Methyldocosanoat	Sigma Aldrich	929-77-1	FAME
Methyleicosanoat	Sigma Aldrich	1120-28-1	FAME
Methyl-hexacosanoat	Sigma Aldrich	5802-82-4	FAME
Methyl-octacosanoat	Sigma Aldrich	55682-92-3	FAME
Methyl-pelargonate	Sigma Aldrich	1731-84-6	FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA)	Macherey-Nagel	24589-78-4	Metabolite deriviatization
Pyridine	Supleco	110-86-1	Metabolite deriviatization
Ribitol	Supleco	22566-17-2	Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester	TCI Chemicals	629-83-4	FAME
Water	Biosolve Chemicals	23214102	ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes	Eppendorf	3120086
2 mL Safe-lock microcentrifuge tubes	Eppendorf	3120094
Balance	Sartorius Corporation	14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm	Aglient	123-3832	Analysis of derivatized metabolites
GC-MS system	Leco Pegasus HT TOF-MS (LECO Corporation)		Analysis of derivatized metabolites
Grinding Balls, Stainless Steel	OPS DIAGNOSTICS	GBSS 196-2500-10
MS system	Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific)		Analysis of lipids
MS system	Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific)		Analysis of metabolites
Refrigerated microcentrifuge	Eppendorf, model 5427R	22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles)	Waters	186002878	Analysis of lipids
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles)	Waters	186003539	Analysis of metabolites
Shaker	Eppendorf Thermomixer 5436	2050-100-05
Sonicator	USC 300 TH	142-0084
Tissue grinding mixer mill	Retsch, Mixer Mill MM 300	20.746.0001
UPLC system	Waters Acquity UPLC system (Waters)
Vacuum concentrator	Scan Speed Maxi Vac Alpha Evaporators	7.008.500.002
Vortex mixer	Vortex-Genie 2, Model G560	SI-0236
Software
MetAlign			Chromatogram processing
MzMine			Chromatogram processing
R package "data.table"
R package "fujiplot"			pleiotrpoic map
R package "genetics"
R package "Ime4"			BLUPs calculation
R package "LDheatmap"			LD plots
R package "MASS"			transformation
R package "rMVP"			GWAS
R version 4.0.4
RefinerMS			Chromatogram processing
RefinerMS Genedata	Expressionist		Chromatogram processing
Tassel 5			Genotype filtering
Xcalibur	Thermo Fisher Scientific	OPTON-30965	Chromatogram processing

References

Doerr, A. Global metabolomics. Nature Methods. 14 (1), 32 (2017).
Fessenden, M. Metabolomics: Small molecules, single cells. Nature. 540 (7631), 153-155 (2016).
Oliver, S. G., Winson, M. K., Kell, D. B., Baganz, F. Systematic functional analysis of the yeast genome. Trends in Biotechnology. 16 (9), 373-378 (1998).
Fiehn, O. Metabolomics-the link between genotypes and phenotypes. Plant Molecular Biology. 48 (1), 155-171 (2002).
Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
Sysi-Aho, M., Katajamaa, M., Yetukuri, L., Orešič, M. Normalization method for metabolomics data using optimal selection of multiple internal standards. BMC Bioinformatics. 8 (1), 93 (2007).
Chen, M., Rao, R. S. P., Zhang, Y., Zhong, C. X., Thelen, J. J. A modified data normalization method for GC-MS-based metabolomics to minimize batch variation. SpringerPlus. 3 (1), 439 (2014).
Dunn, W. B., et al. Metabolic profiling of serum using Ultra Performance Liquid Chromatography and the LTQ-Orbitrap mass spectrometry system. Journal of Chromatography B. 871 (2), 288-298 (2008).
Fiehn, O., et al. Metabolite profiling for plant functional genomics. Nature Biotechnology. 18 (11), 1157-1161 (2000).
vander Kloet, F. M., Bobeldijk, I., Verheij, E. R., Jellema, R. H. Analytical error reduction using single point calibration for accurate and precise metabolomic phenotyping. Journal of Proteome Research. 8 (11), 5132-5141 (2009).
Folch, J., Lees, M., Stanley, G. H. S. A simple method for the isolation and purification of total lipides from animal tissues. Journal of Biological Chemistry. 226 (1), 497-509 (1957).
Fukushima, A., et al. Impact of clock-associated Arabidopsis pseudo-response regulators in metabolic coordination. Proceedings of the National Academy of Sciences of the United States of America. 106 (17), 7251-7256 (2009).
Kerwin, R. E., et al. Network quantitative trait loci mapping of circadian clock outputs identifies metabolic pathway-to-clock linkages in Arabidopsis. The Plant Cell. 23 (2), 471-485 (2011).
Tohge, T., et al. From models to crop species: Caveats and solutions for translational metabolomics. Frontiers in Plant Sciences. 2, 61 (2011).
Salem, M., Bernach, M., Bajdzienko, K., Giavalisco, P. A simple fractionated extraction method for the comprehensive analysis of metabolites, lipids, and proteins from a single sample. Journal of Visualized Experiments:JoVE. (124), e55802 (2017).
Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5 (6), 1210-1227 (2010).
Lisec, J., Schauer, N., Kopka, J., Willmitzer, L., Fernie, A. R. Gas chromatography mass spectrometry-based metabolite profiling in plants. Nature Protocols. 1 (1), 387-396 (2006).
Osorio, S., Do, P. T., Fernie, A. R., Hardy, N. W., Hall, R. D. . Plant Metabolomics: Methods and Protocols. , 101-109 (2012).
De Vos, R. C. H., et al. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nature Protocols. 2 (4), 778-791 (2007).
Perez de Souza, ., Alseekh, L., Naake, S., Fernie, T., A, Mass spectrometry-based untargeted plant metabolomics. Current Protocols in Plant Biology. 4 (4), 20100 (2019).
Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
Watson, J. T., Sparkman, D. O. Electron Ionization. Introduction to mass spectrometry: Instrumentation, applications and strategies for data interpretation. , 315 (2007).
Fernie, A. R., et al. Recommendations for reporting metabolite data. The Plant Cell. 23 (7), 2477 (2011).
Treutler, H., et al. Discovering regulated metabolite families in untargeted metabolomics studies. Analytical Chemistry. 88 (16), 8082-8090 (2016).
Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
Naake, T., Fernie, A. R. MetNet: Metabolite network prediction from high-resolution mass spectrometry data in R aiding metabolite annotation. Analytical Chemistry. 91 (3), 1768-1772 (2019).
Chambers, J. M. . Statistical models in S. , (1991).
Misra, B. B. Data normalization strategies in metabolomics: Current challenges, approaches, and tools. European Journal of Mass Spectrometry. 26 (3), 165-174 (2020).
Livera, A. M. D., et al. Statistical methods for handling unwanted variation in metabolomics data. Analytical Chemistry. 87 (7), 3606-3615 (2015).
Sakia, R. M. . The Box-Cox transformation technique: a review. 41 (2), 169-178 (1992).
vanden Berg, R. A., Hoefsloot, H. C. J., Westerhuis, J. A., Smilde, A. K., vander Werf, M. J. Centering, scaling, and transformations: improving the biological information content of metabolomics data. BMC Genomics. 7, 142 (2006).
Marees, A. T., et al. A tutorial on conducting genome-wide association studies: Quality control and statistical analysis. International Journal of Methods in Psychiatric Research. 27 (2), 1608 (2018).
Torkamaneh, D., Laroche, J., Bastien, M., Abed, A., Belzile, F. Fast-GBS: a new pipeline for the efficient and highly accurate calling of SNPs from genotyping-by-sequencing data. BMC Bioinformatics. 18 (1), 5 (2017).
Zhao, S., Agafonov, O., Azab, A., Stokowy, T., Hovig, E. Accuracy and efficiency of germline variant calling pipelines for human genome data. Scientific Reports. 10 (1), 20222 (2020).
Bradbury, P. J., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software. 67 (1), (2015).
Yin, L., et al. rMVP: A memory-efficient, visualization-enhanced, and parallel-accelerated tool for genome-wide association study. Genomics, Proteomics & Bioinformatics. , (2021).
Kanai, M., et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nature Genetics. 50 (3), 390-400 (2018).
Salem, M. A., et al. An improved extraction method enables the comprehensive analysis of lipids, proteins, metabolites and phytohormones from a single sample of leaf tissue under water-deficit stress. Plant Journal: for Cell and Molecular Biology. 103 (4), 1614-1632 (2020).
Balcke, G. U., et al. Multi-omics of tomato glandular trichomes reveals distinct features of central carbon metabolism supporting high productivity of specialized metabolites. The Plant Cell. 29 (5), 960-983 (2017).
Leonova, T., et al. Does protein glycation impact on the drought-related changes in metabolism and nutritional properties of mature pea (Pisum sativum L.) seeds. International Journal of Molecular Sciences. 21 (2), 567 (2020).
Alfonsi, K., et al. chemistry tools to influence a medicinal chemistry and research chemistry based organisation. Green Chemistry. 10 (1), 31-36 (2008).
Bozek, K., et al. Organization and evolution of brain lipidome revealed by large-scale analysis of human, chimpanzee, macaque, and mouse tissues. Neuron. 85 (4), 695-702 (2015).
Delgado, R., Muñoz, Y., Peña-Cortés, H., Giavalisco, P., Bacigalupo, J. Diacylglycerol activates the light-dependent channel TRP in the photosensitive microvilli of Drosophila melanogaster photoreceptors. The Journal of Neuroscience. 34 (19), 6679 (2014).
Sharma, D. K., et al. UPLC-MS analysis of Chlamydomonas reinhardtii and Scenedesmus obliquus lipid extracts and their possible metabolic roles. Journal of Applied Phycology. 27 (3), 1149-1159 (2015).
Dunn, W. B., Wilson, I. D., Nicholls, A. W., Broadhurst, D. The importance of experimental design and QC samples in large-scale and MS-driven untargeted metabolomic studies of humans. Bioanalysis. 4 (18), 2249-2264 (2012).
Fan, S., et al. Systematic error removal using random forest for normalizing large-scale untargeted lipidomics data. Analytical Chemistry. 91 (5), 3590-3596 (2019).
Larsson, S. J., Lipka, A. E., Buckler, E. S. Lessons from Dwarf8 on the strengths and weaknesses of structured association mapping. PLOS Genetics. 9 (2), 1003246 (2013).
Platt, A., Vilhjálmsson, B. J., Nordborg, M. Conditions under which genome-wide association studies will be positively misleading. Génétique. 186 (3), 1045-1052 (2010).
Nyholt, D. R. A simple correction for multiple testing for single-nucleotide polymorphisms in linkage disequilibrium with each other. American Journal of Human Genetics. 74 (4), 765-769 (2004).
Teo, Y. Y. Common statistical issues in genome-wide association studies: a review on power, data quality control, genotype calling and population structure. Current Opinion in Lipidology. 19 (2), 133-143 (2008).
Privé, F., Aschard, H., Ziyatdinov, A., Blum, M. G. B. Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr. Bioinformatics. 34 (16), 2781-2787 (2018).
Alseekh, S., et al. Domestication of crop metabolomes: desired and unintended consequences. Trends in Plant Science. 26 (6), 650-661 (2021).
Yano, K., et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture. Proceedings of the National Academy of Sciences of the United States of America. 116 (42), 21262 (2019).
Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
Ye, J., et al. An InDel in the promoter of Al-ACTIVATED MALATE TRANSPORTER9 selected during tomato domestication determines fruit malate contents and aluminum tolerance. The Plant Cell. 29 (9), 2249-2268 (2017).
Zhang, W., et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties. Nature Communications. 11 (1), 3719 (2020).
Tohge, T., Fernie, A. R. Annotation of plant gene function via combined genomics, metabolomics and informatics. Journal of Visualized Experiments: JoVE. (64), e3487 (2012).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citer Cet Article

Bulut, M., Fernie, A. R., Alseekh, S. Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization. J. Vis. Exp. (173), e62732, doi:10.3791/62732 (2021).

Large-scale Multi-omics Genome-wide Association Studies (Mo-GWAS): Retningslinjer for prøveforberedelse og normalisering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgations

Acknowledgements

Materials

References

Tags

Play Video

Citer Cet Article

View Video

Large-scale Multi-omics Genome-wide Association Studies (Mo-GWAS): Retningslinjer for prøveforberedelse og normalisering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgations

Acknowledgements

Materials

References

Tags

Play Video

Citer Cet Article

View Video

✖

To prove you're not a robot, please enter the text in the image below