1. Prøvepreparering Plantemateriale høstes og fryses umiddelbart. Frosne plantematerialer blir pulverisert av mikser mill (eller morter) og lagres i Falcon tube eller Eppendorf rør ved -80 ° C. 2. Utvinning for metabolitt Profiling Delmengde frosset plantemateriale i en 2 ml Eppendorf rør. Tilsett 5 mL av utvinning buffer per milligram av ferskvekt av frossen plantemateriale. Legg en metall (eller gilconia) ball og homogenisere av frossen pulver med Mixer Mill for 2 min ved 25 ls -1. Sentrifuger 10 min ved 12 000 rpm. Overfør supernatanten til NANOSEP sentrifugalfilter. Sentrifuger 2 min ved 4000 rpm. Overfør supernatanten til nytt Eppendorf rør, og oppbevar ved -20 ° C inntil bruk. 3. Metabolitt Profilering av LC-MS Sett opp HPLC og sjekke temperaturen på kolonnen ovnen og prøve skuff. Sett opp MS tilstand og sjekke tilstanden til vakuum og varme kapillært. Utfør m / z kalibrering av MS detektor. Overføring av 50 mL av ekstrakter til hetteglass for LC-MS. Injiser 5 mL av ekstrakter til LC-MS. 4. Data Analysis Konfigurer Xcalibur eller Metalign 4 og velg dataanalyse for å bli behandlet. Utarbeide en tabell over oppdagede topper er interessert i samsvar med sammensatte klasse i tabell jeg. Identifiser topper med co-eluering av standard forbindelser. Annotate oppdaget topper med MS 2 analyse, litteraturstudium, metabolitt database søk (figur 2, 12,13). 5. Prediksjon av metabolismevei Konstruer en mulig vei med påvist forbindelser. Prediksjon av veien ved hjelp av peak merknadene bør baseres på den kjemiske strukturen oppdaget sammensattes ved å forutsi knytte enzymatiske funksjoner på metabolismevei 13. Strukturering biosyntetiske trinn skal utføres med presis topp merknad. Men fastsettelse av detaljerte kjemiske struktur, for eksempel sukker moiety, er ikke uunnværlig i dette trinnet, fordi prediksjon av sukker moiety og adduserte posisjon er svært vanskelig å identifisere ved MS analyse. Bestemmelse av sukker typen som hexoside og pentoside vil bli identifisert ved enzymatisk analysen av sukker donor i siste trinn av prosjektet. Stort sett bygging av prediksjon av veien bør utføres som lite molekyl er mellomprodukt i større molekyl unntatt i noen tilfeller som dehydrering reaksjon. Liste over atom-molekylvekt, for eksempel 16 m / z for forskjellen mellom-H og-OH moiety (oksidasjon), 14 m / z (karbonatom) for forskjell mellom-OH og-OMe (metylering) og 162 m / z ( MW-H 2 O) for hexose (glykosylering), er nyttig for prediksjon. Bestemmelse avmodifikasjon type med korrelasjon analyse av vev spesifisiteter hjelper prediksjon av metabolismevei. Database av generell metabolismevei som KEGG database ( http://www.genome.jp/kegg/ ) og PlantCyc ( http://plantcyc.org/~~V ), er svært effektiv for prediksjon av metabolismevei av interesse. 6. Utarbeidelse av Gene Liste med Arabidopsis Orthologous Gene ID Last ned genet ID liste fra genomisk database. Legg Arabidopsis genet ID orthologous genet, i tilfelle målet anlegget er ikke Arabidopsis. Utarbeide en liste av gener i din sti-of-interesse. Annotering av Arabidopsis spredningsveier data og gen familie data er tilgjengelige i Tair nettsted ( http://www.arabidopsis.org/~~V ). Hvis du utarbeidet en liste over Arabidopsis orthologous gener, kan du senere combine dem. 7. Co-uttrykte Gene Analysis Test bruke forberedt genet ID-listen for å søke best mulig database for vei din ved å sjekke korrelasjonen med kjente genet parene i din vei-of-interesse (tabell II). Hvis co-uttrykket database eller genekspresjon database ikke er tilgjengelig i anlegget av interesse, bør Arabidopsis co-uttrykk database brukes med en liste over Arabidopsis orthologous gener. I tilfelle av bygg, kan ris, poppel, hvete, Medicago og soyabønner, co-uttrykk analyse av plantearter brukes (tabell II). Konstruer rammene for din målgruppe co-uttrykk nettverk basert på tilkoblingene av de kjente gener i din sti-of-interesse. Legg korrelerte kandidat gener (r <0,4 ~ 0,90, innenfor omtrentlig verdi på koeffisienten verdi mellom tilkoblinger av de kjente gener i din sti-of-interesse) og sjekke deres genet merknaden i din predicted familiene til tilkoblinger av dette nettverket for å finne beste kandidat gener (figur 3). Terskel av koeffisientverdien bør koordineres i henhold til nettverk struktur og tetthet av korrelerte gener. Lag liste av gener som du er i stand til å innskrenke som spesialiserte til din målgruppe veien. Sjekk genuttrykk av orgelet spesifisiteter og stressresponser av din kandidat gener. 8. Integrasjon av all informasjon å forutsi nye Pathways Legg godt karakterisert gener som har blitt brukt for spørring av co-uttrykk analyse til spådd metabolismevei. Sjekk uncharacterized deler i denne veien, for eksempel uncharacterized enzymatiske trinn, transport proteiner og transkripsjonsfaktorer. Forutsi mest egnet genet merknader for disse manglende uncharacterized trinnene. Kombiner resultatene av metabolitten profilering og kandidat gener av i silico gene uttrykk basert på spådd veien. Ordne kandidat gener på spådd veien i henhold til gen-funksjon, for eksempel, acetyltransferase for acetylert metabolitt, glycosyltransferase for glycoside, P450 for oksiderte sammensatte. Fylogenetisk tre analyse av aminosyre sekvenser er nyttig for noen bred genet familie som P450 og glycosyltransferase. Sjekk konsistensen av vev spesifisiteter eller stressresponser mellom metabolitt akkumulering og genuttrykk nivå av kandidat gener. Kontroller forbindelsene til andre stoffskifte for å gi underlaget og stress responsive gener. 9. Eksperimenter for Gene identifisering ved hjelp av Bio-ressurser Kontroller tilgjengeligheten av bioressurser for tilrettelegging av eksperiment for kandidat genet identifikasjon. Utføre et eksperiment for identifisering av gen-funksjon ved hjelp av bio-ressurser, for eksempel KO mutant bibliotek og full-lengde cDNA bibliotek. THan eksperimenterer for funksjonell identifisering av gener med utarbeidelse av overuttrykk planter og knockout mutanter, enzymatisk analyse og promoter bindende analysen skal utføres for den beste kandidaten gener i prediksjon din. Rekombinant protein assay for karakterisering av protein eiendommer og utarbeidelse av overuttrykk planter bedre skal utføres etter bekreftelse av metabolitt profil ved hjelp av KO mutant siden det tar betydelig lengre tid å forberede rekombinant protein og gen kloning for transformasjon. 10. Representative Resultater Prosedyren for integrert analyse som beskrevet i denne protokollen har mange muligheter, avhengig av spesifiserte eksperimentelle formål og valg av biologiske og analytiske kombinasjoner. Valg av prosedyrer og eksperimentell design bør utføres riktig på bakgrunn av målet vei, forbindelser og plantearter. Integrasjonen Strategien er beskrevet i denne protokollen er foc brukt på annotering av anlegget gen-funksjon og oppdagelsen av nye genet funksjoner med en effektiv bruk av flere bio-og data-ressurs. Forventet resultat er lovet å gi med det eneste tilfellet av avgjørende prediksjon. Dette faktum viser at hvis mange nok bevis ikke kan gis av kombinasjonen profiler, bør eksperimentere ikke startes. Av denne grunn, i noen tilfeller kan flere gangsetting eksempel målrettet gene expression profilering av RT-PCR, støtte din prediksjon av gen-funksjon. Nøyaktighet og riktigheten av prediksjon korrelerer høyere, avhengig av kvalitativ forskjell og antall variasjon av kombinasjonen. I tillegg kan gode kandidater og gyldige resultater bare kommer fra nøyaktig prediksjon av stier. Peak merknad bør gjennomføres ved kombinasjon av flere tilnærminger, for eksempel litteraturstudium, referanse plante ekstrakt, MS n analyse, orgel spesifisitet og mutant analyse 13. 1 "src =" / files/ftp_upload/3487/3487fig1.jpg "/> Figur 1. Oversikt over den eksperimentelle flyten av genet annotasjon via kombinert tilnærming. I noen tilfeller prosjektene starter med oppdagelsen av en roman topp som er oppdaget i spesielle forhold eller vev, og ønsket om å forstå sin rolle i metabolismen. I andre tilfeller formålet med prosjektet er genet identifikasjon eller oppdagelse av viktige regulatoriske faktorer som transkripsjonsfaktorer. Design av eksperiment bør høvlet med en datasettet som viser klare forskjeller på metabolitter i din målgruppe veien, ved hjelp av et bredt spekter av vevsprøver fra ulike organer, og for ulikt dyrket planter eller planter som er utsatt for stress forhold, og utsette materialet for å metabolitten profilering. Mutant og transgene planter samt QTL husing avlsmateriale også representere egnet genetisk materiale for disse studiene. Prediksjon av romanen vei bør utføres nøye med nøyaktigtopp merknader og kombinasjon tilnærming med annen type metabolotype som orgel verdipapirer og stressresponser i henhold til genuttrykk dataene på en sti-of-interesse. I det siste trinnet, bør metabolitt og karakterutskrift profilering utføres som til slutt vil, når den kombineres med i silico analyse av web-ressurser og in vitro karakterisering av genekspresjon via heterologe uttrykk, føre til bekreftelse av genet kandidat og belysning av dens funksjon og posisjon innenfor en metabolismevei. Forkortelser: QTL, kvantitative Trait Loci. Figur 2. Arbeid flyt av kombinatoriske tilnærming for topp kommentering. En prosedyre for topp identifisering og annotering av standard sammensatte, sammenligning av vill type og slå ut mutanter, multi-dimensjonale massespektrometri av målet topp henviser til masse spektra av ren compounds fra databasene 12. Forkortelser: DB, database, Ko, knock-out; 1-D, endimensjonale, 2-D, to-dimensjonale, NMR, nukleær magnetisk resonans, IR, infra-rød, MS n, masse-masse spectrometries. Figur 3. Eksempel co-regulering nettverk analyse av Antocyanin veien. Coexpression Analysene ble utført ved hjelp av PRIME ( http://prime.psc.riken.jp/?action=coexpression_index ) basert på datasettet av ATTEDII versjon 3 8,2 med Pajek program ( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ ). Positive korrelasjoner (r <0,5) brukes til å lage nettverkstilkoblinger. Red node: tolv mengde anthocyaniner enzymatiske gener (At5g13930 og luftmasker, TT4 og Chalcone syntase, At3g55120, CHI, TT5, Chalcone isomerise, At3g51240, F3H, TT6, flavanone 3-hydroksylase, At5g07990, F3'H, TT7, flavonoid 3'-hydroksylase, At5g17050, Fd3GT, UGT78D2, 3 flavonoid – O-glucosyltransferase; At5g17220, AtGSTF12, TT19 ; At5g42800, DFR, TT3, dihydroflavonol reduktase, At4g22880, ANS / LDOX, TT18, anthocyanidin synthese, At4g14090, A5GT, Antocyanin 5 – O-glucosyltransferase; At5g54060, A3G2 "XT, utlagde Antocyanin 3 – O-glucoside 2" – O – xylosyltransferase; At3g29590, A5GMaT, 5 Antocyanin – O-glucoside 6'' '- O-malonyltransferase; At1g03940, A3GCouT, 3 Antocyanin – O-glucoside 6 "- O – p-coumaroyltransferase) og to transkripsjonsfaktorer for Antocyanin produksjon (At1g56650, PAP1; At1g66390, PAP2) ble brukt for å søke kandidat gener kandidat gener ble funnet av en "krysset av sett" søk med en terskelverdi med en koeffisient på r <./ Em >> 0,50 spørres av krysset mellom settene av alle gener spørres (Fjorten mengde anthocyaniner biosyntetiske gener). En co-uttrykk nettverk, inkludert korrelerte kandidat gener (68 gener) og spørres gener (14 gener), var re-konstruert av en "samtrafikk sett" søk med r> 0,50 ved hjelp av PRIME databasen. Utdatafiler som ble formatert med en '. Net "-filen fra Statsministerens databasen og nettverk ble tegnet med Pajek programvare. Blå node indikerer kandidat gener som korrelert med mengde anthocyaniner gener. arter Major sekundær metabolitt Arabidopsis thaliana Glucosinolate, flavonol, Antocyanin, sinapoyl derivat Populus trichocarpa Flavonol, Antocyanin, salicylate derivat Vitis vinifera Flavonol, Antocyanin, tannin, stilbene Solanum lycopersicum Flavonol, Antocyanin, glycoalkaloid, chrologenate relatert, Nicotiana tabacum Flavonol, Antocyanin, nicotianamide, chrologenate relatert, acylsugar Oryza sativa Glycoflavone, Antocyanin, sterol derivater Zea kan Glycoflavone, Antocyanin, benzoxazinone, sterol derivater Medicago truncatula Isoflavone, Antocyanin, saponin, Lotus japonica Isoflavone, flavonol, Antocyanin, saponin, Tabell I. Store sekundære metabolitter i modellen plantearter. Co-uttrykk database Adresse Plant kryss species COP http://webs2.kazusa.or.jp/kagiana/cop0911/~~V Planet http://aranet.mpimp-golm.mpg.de/ Plantearter ATEED-II http://atted.jp/ BAR http://142.150.214.117/welcome.htm COP http://webs2.kazusa.or.jp/kagiana/cop GeneCAT http://genecat.mpg.de/ Arabidopsis ACT http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser AthCoR@CSB.DB http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html CressExpress http://cressexpress.org/~~V PRIME http://prime.psc.riken.jp/?action=coexpression_index Oryza sativa RiceArrayNet http://arraynet.mju.ac.kr/arraynet/~~V Rice Array Database http://www.ricearray.org/coexpression/coexpression.shtml Tabell II. Tilgjengelig genuttrykk database for i silico co-uttrykk analyse.