Her presenterer vi en ny tilnærming for å identifisere plante virus med dobbel-strand DNA genomer. Vi bruker standard metoder å trekke ut DNA og RNA fra infiserte blader og gjennomføre neste generasjons sekvensering. Bioinformatic verktøy montere sekvenser i contigs, identifisere contigs som representerer virus genomer og tilordne genomer taksonomisk grupper.
Denne metagenome brukes til å identifisere plante virus med sirkulær DNA genomer og sine transkripsjoner. Ofte anlegget DNA virus som forekommer i lav titers i deres vert eller ikke kan være mekanisk inokulert til en annen host er vanskelig å overføre for å oppnå en større titer av smittestoffer. Infiserte bladene er bakken i en mild buffer med optimal pH og ioniske komposisjon anbefalt for rensing av de fleste bacilliform Para retroviruses. Urea er brukt til å bryte opp inkludering organer som overlappes virions og oppløse cellulære komponenter. Differensial sentrifugering gir ytterligere skille virions fra anlegget forurensninger. Deretter fjerner proteinasen K behandling av capsids. Deretter er viral DNA konsentrert og brukes for neste generasjons sekvensering (NGS). NGS dataene brukes til å sette sammen contigs som sendes til NCBI-BLASTn til å identifisere et delsett av virus sekvenser i genererte datasettet. I en parallell rørledning er RNA isolert fra infiserte blader med en standard kolonne-baserte RNA utvinning metode. Ribosom nedbryting utføres deretter for å berike for en undergruppe av mRNA og virus transkripsjoner. Samlet sekvenser fra RNA sekvensering (RNA-seq) ble sendt til NCBI-BLASTn til å identifisere et delsett av virus sekvenser i dataset. I vår studie identifisert vi to relaterte full lengde badnavirus genomer i to datasett. Denne metoden foretrekkes til en annen felles tilnærming som trekker samlede befolkningen i små RNA sekvenser for å gjeninnføre plante virus genomisk sekvenser. Denne sistnevnte metagenomic rørledning gjenoppretter virus knyttet sekvenser som settes retro-transkribere elementer inn i anlegget genomet. Dette er koplet til biokjemiske eller molekylær analyser ytterligere skjelne aktivt smittestoffer. Fremgangsmåten dokumentert i denne studien gjenoppretter sekvenser representant replikere virus som sannsynligvis indikerer aktiv virusinfeksjon.
Nye anlegget sykdommer kjøre forskere til å utvikle nye verktøy for å identifisere de riktige kausale agent (er). Første rapporter om nye eller gjentakende sykdommer er basert på vanlig forekommende symptomer som mosaikk og misdannelser av blad, vene clearing, sekretet, wilting, lesjoner, nekrose, eller andre symptomer. Standarden for rapporten om et nytt virus som kausale agent for en sykdom er å skille den fra andre skadelige patogener, overføres det i passende vert, og reprodusere sykdommen av vaksinere i friske planter av den opprinnelige vert arten. Begrensningen i denne tilnærmingen er at mange arter av plante virus avhenger av en insect eller andre vektorer for overføring til en passende vert eller tilbake til den opprinnelige vert arten. I dette tilfellet Søk etter passende vektoren kan bli forlenget, kan det være problemer å etablere laboratorium kolonier av vektoren og ytterligere innsats er nødvendig for å utarbeide en protokoll for eksperimentell overføring. Hvis betingelsene for vellykket laboratoriestudier overføring ikke kan oppnås, deretter faller arbeidet kort av standarden for rapporten om en ny virus sykdom. For virus som forekommer i deres naturlige vertskapet på svært lav titers, må forskere identifisere alternativ verter for overføringen for å opprettholde tilstrekkelig smittsomme aksjer for gjennomføring av forskning. For virus arter som infiserer bare noen planter kan dette også være et hinder for voksende lager kulturer1.
De siste årene ansette forskere oftere høy gjennomstrømming NGS og metagenomic tilnærminger for å avdekke virus sekvenser som finnes i miljøet som kan eksistere relatert til en kjent sykdom, men kan tilordnes taksonomisk arter og slekter 2 , 3 , 4. slik tilnærminger til oppdagelsen og kategorisering av genetisk materiale på et særskilt miljø å beskrive virus mangfold i naturen eller deres tilstedeværelse i en sikker økosystem, men ikke nødvendigvis bekrefte til et rammeverk for å definere kausale agenter for en tydelig sykdom.
Badnavirus slekten tilhører familien Caulimoviridae til pararetroviruses. Disse virusene er bacilliform i form med sirkulær dobbel strand DNA genomer ca 7 til 9 KB. Alle pararetroviruses replikere gjennom en RNA mellomliggende. Pararetroviruses som episomes og gjenskape uavhengig av anlegget chromosomal DNA5,6. Feltstudier av virus befolkningsgrupper viser at populasjonene viruset er genetisk komplekse. I tillegg informasjon oppnådd gjennom en rekke anlegget genomer av høy gjennomstrømning sekvensering har avdekket mange eksempler på badnavirus genomet fragmenter inn av illegitim integrering hendelser planten genomer. Disse endogene badnavirus sekvensene er ikke nødvendigvis knyttet til infeksjon,7,,8,,9,,10,,11. Deretter Bruk av NGS å identifisere nye badnaviruses som den kausale agenten for sykdom er komplisert ved det subpopulasjon mangfoldet av episomal genomer samt forekomsten av endogene sekvenser12,13.
Mens det er ikke en optimal rørledning for oppdagelsen av romanen pararetrovirus genomer, er det to felles tilnærminger til å identifisere disse virusene som kausale agenter for sykdom. En metode er å berike for små RNA sekvenser fra infiserte blader og deretter montere disse sekvensene å gjeninnføre de virus genome(s)14,15,16,17. En annen tilnærming er bølgende sirkel forsterkning (RCA) å forsterke sirkulær DNA virus genomer18. Suksessen til RCA avhenger av bladet og virus titer i valgte vev. RCA produktene er utsatt for begrensning fordøyelsen og klonet i plasmider for direkte sekvensering19,20,21.
Canna gule mottle virus (CaYMV) er en badnavirus og er beskrevet som den paranoid årsaken til gul mottle sykdom i canna, selv om bare en 565 bp fragment av genomet er tidligere isolert fra infiserte klaser Canna22. En moderne studie identifisert CaYMV i Alpinia purpurata (blomstrende ingefær; CaYMV-Ap)23. Målet med denne studien var å gjenopprette fullstendig badnavirus genomet sekvenser fra infiserte canna liljene. Vi beskriver en protokoll for å rense virus fra anlegget forurensninger, og deretter isolere virus-DNA fra dette preparatet, og forberede et DNA-bibliotek for bruk i NGS. Dette eliminerer behovet for mellomliggende molekylær forsterkning trinnene. Vi også isolere mRNA fra infiserte planter for RNA-seq. NGS, som inkluderer RNA-seq ble gjennomført med hver nukleinsyre forberedelse. Samlet contigs ble funnet å forholde seg til Badnavirus gruppe (biologi) i begge datasett ved hjelp av National Center for bioteknologi og informasjon (NCBI) grunnleggende lokale justering søkeverktøyet for nucleic syrer (BLASTn). Vi identifisert genomer to badnavirus arter24.
De siste årene har en rekke metoder arbeidet å studere plante virus biologisk mangfold i naturskjønne omgivelser inkluderer berikende for virus-lignende partikler (VLP) eller virus bestemt RNA eller DNA2,3,44, 45,46 . Disse metodene er etterfulgt av NGS og bioinformatic. Målet med denne studien var å finne den kausale agenten for en vanlig sykdom i en dyrket plante. Sykdommen ble rapportert å være et resultat av et ukjent virus som har ikke-innhyllet bacilliform partikler, og som bare en 565 bp fragment er klonet47. Denne informasjonen var tilstrekkelig for tidligere forskere hypotetisk tilordne viruset til slekten Badnavirus i familien Caulimoviridae. Mens tidligere rapporter hypotesen at canna mottle sykdom i canna liljene var resultatet av en enkelt badnavirus, ved hjelp av metagenomics tilnærming i denne studien vi funnet ut at sykdommen skyldes to foreløpig badnavirus arter24. Dermed styrke med en metagenome tilnærming til å oppdage den kausale agenten for en sykdom er at vi nå kan identifisere situasjoner der det kan være mer enn én anledning.
Vår tilnærming kombinere DNA og RNA sekvensering data er grundig og demonstrerer også at resultatene med to tilnærminger gitt konsekvent resultater og bekreftet tilstedeværelse av to i slekt viruser. Vi ansatt en endret fremgangsmåte for isolering av caulimoviruses laget en prøve som anriket for virus forbundet nucleic syrer og som ble beskyttet i virus kapsid. En tjenesten laboratory ble leid inn til å utføre DNA sekvensering. De novo sekvensering grunnleggende konseptet er at DNA polymerase inkorporerer fluorescerende merket nukleotider i en DNA mal strand under sekvensiell sykluser av DNA-syntese. Contigs samlet etterfulgt av NGS ble sendt til en bioinformatic arbeidsflyt produsere noen contigs som ble identifisert som virus contigs. Ytterligere bekreftelse av to virus genomer10,24,48,49,50 ble oppnådd gjennom bioinformatic analyse av RNA-seq data fra ribo-utarmet RNA forberedelser. En interessant resultatet var å lære at bestander av sekvenser utvinnes av DNA og RNA sekvensering gitt lignende distribusjoner av ikke-viral og viral nukleinsyrer. DNA og RNA sekvensering var < 0,5% av sekvenser av virus opprinnelse. I befolkningen av viruset sekvenser 78-82% tilhørte familien Caulimoviridae. Ved å sammenligne den sammensatte virus contigs fra DNA og RNA sekvensering, bekreftet vi at to sammensatte genomer skjedde i begge datasett.
En bekymring for å bruke bare DNA sekvensering for å identifisere nye virus genomer er at badnavirus genomet er en åpen sirkulær DNA. Vi mente at sekvenser overlappende avbrudd i genomet kunne presentere hindringer for genomet samlingen fra contigs. Innledende undersøkelser av DNA sekvensering resultatene viste to lignende virus genomer. Vi hypotesen at disse genomer enten representert genetisk mangfold av en art som ikke har blitt studert eller representert to arter co infisere samme plante24. Derfor aktivert kollektive bioinformatic analyse av datasett ved NGS DNA og RNA sekvensering, bekreftelse av tilstedeværelsen av to full lengde genomer.
Det er en annen rapport som utviklet en alternativ metode for å trekke ut VLP og nukleinsyrer fra anlegget homogenates for metagenomic studier, basert på prosedyrer for å gjenopprette DNA fra blomkål mosaikk virus (CaMV, en caulimovirus)3. Denne tilnærmingen identifisert romanen RNA og DNA virus sekvenser i ikke-dyrket planter. Trinnene avledet fra caulimovirus isolasjon fremgangsmåte som er brukt i denne studien for å oppdage den kausale agenten for en sykdom i landbruket er i motsetning til trinnene avledet for uttrekking VLP fra naturlig infiserte planter24. Suksessen til begge endret metodene antyder at rammeverket prosedyren for caulimovirus isolasjon kan være et verdifullt utgangspunkt for metagenomic studier av plante virus generelt.
The authors have nothing to disclose.
Forskningen ble finansiert av Oklahoma Center for fremme av vitenskap og teknologi brukt Research Program fase II AR 132-053-2; og av Oklahoma Department of Agriculture spesialitet avlinger forskning Grant Program. Vi takker Dr. HongJin Hwang og OSU bioinformatikk Core anlegget som ble støttet av tilskudd fra NSF (EOS-0132534) og NIH (2P20RR016478-04, 1P20RR16478-02 og 5P20RR15564-03).
NaH2PO4 | Sigma-Aldrich St. Louis MO | S5976 | Grinding buffer for virus purification |
Na2HPO4 | Sigma-Aldrich | S0751 | Grinding buffer for virus purification |
Na2SO3 | Thermo-Fisher Waltham, MA | 28790 | Grinding buffer for virus purification |
urea | Thermo-Fisher | PB169-212 | Homogenate extraction |
Triton X-100 | Sigma-Aldrich | X-100 | Homogenate extraction |
Cheesecloth | VWR Radnor, PA | 21910-107 | Filter homogenate |
Tris | Thermo-Fisher | BP152-5 | Pellet resuspension& DNA resuspension buffers |
MgCl2 | Spectrum, Gardena, CA | M1035 | Pellet resuspension buffer |
EDTA | Spectrum | E1045 | Stops enzyme reactions |
Proteinase K | Thermo-Fisher | 25530 | DNA resuspension buffer |
phenol:chloroform:isoamylalcohol | Sigma-Aldrich | P2069 | Dissolve virion proteins |
DNAse I | Promega | M6101 | Degrade cellular DNA from extracts |
95% ethanol | Sigma-Aldrich | 6B-100 | Virus DNA precipitation |
Laboratory blender | VWR | 58984-030 | Grind leaf samples |
Floor model ultracentrifuge &Ti70 rotor | Beckman Coulter, Irving TX | A94471 | Separation of cellular extracts |
Floor model centrifuge and JA-14 rotor | Beckman Coulter | 369001 | Separation of cellular extracts |
Magnetic stir plate | VWR | 75876-022 | Mixing urea into samples overnight |
Rubber policeman | VWR | 470104-462 | Dissolve virus pellet |
2100 bioanalyzer Instrument | Agilent Genomics, Santa Clare, CA | G2939BA | Sensitive detection of DNA and RNA quality and quantity |
2100 Bioanalyzer RNA-Picochip | 5067-1513 | Microfluidics chip used to move, stain and measure RNA quality in a 2100 Bioanalyzer | |
2100 Bioanalyzer DNA-High Sensitive chip | 5067-4626 | Microfluidics chip used to move, stain and measure DNA quality in a 2100 Bioanalyzer | |
Nanodrop spectrophotometer | Thermo-Fisher | ND-2000 | Analysis of DNA/RNA quality at intermediate steps of procedures |
Plant total RNA isolation kit | Sigma-Aldrich | STRN50-1KT | Isolate RNA for RNA-seq |
RNase-free water | VWR | 10128-514 | Resuspension of DNA and RNA for NGS |
RNA concentrator spin column | Zymo Research, Irvine, CA | R1013 | Prepare RNA for RNA-seq |
rRNA removal kit | Illumina, San Diego, CA | MRZPL116 | Prepare RNA for RNA-seq |
DynaMag-2 Magnet | ThermoFisher | 12321D | Prepare RNA for RNA-seq |
RNA enrichment system | Roche | 7277300001 | Prepare RNA for RNA-seq |
Agarose | Thermo-Fisher | 16500100 | Gel analysis of DNA/RNA quality at intermediate steps of procedures |
Ethidium bromide | Thermo-Fisher | 15585011 | Agarose gel staining |
pGEM-T +JM109 competent cells | Promega, Madison, WI | A3610 | Clone genome fragments |
pFU Taq polymerase | Promega | M7741 | PCR amplify virus genome |
dNTPs | Promega | U1511 | PCR amplify virus genome |
PCR oligonucleotides | IDT, Coralvill, IA | Custom order | PCR amplify virus genome |
Miniprep DNA purification kit | Promega | A1330 | Plasmid DNA purification prior to sequencing |
PCR clean-up kit | Promega | A9281 | Prepare PCR products for cloning |
pDRAW32 software | ACAClone | Computer analysis of circular DNA and motifs | |
MEGA6.0 software | MEGA | Molecular evolutionary genetics analysis | |
Primer 3.0 | Simgene.com | ||
Quant-iT™ RiboGreen™ RNA Assay Kit | Thermo-Fisher | R11490 | Fluorometric determination of RNA quantity |
GS Junior™ pyrosequencing System | Roche | 5526337001 | Sequencing platform |
GS Junior Titanium EmPCR Kit (Lib-A) | Roche | 5996520001 | Reagents for emulsion PCR |
GS Jr EmPCR Bead Recovery Reagents | Roche | 5996490001 | Reagents for emulsion PCR |
GS Junior EmPCR Reagents (Lib-A) | Roche | 5996538001 | Reagents for emulsion PCR |
GS Jr EmPCR Oil & Breaking Kit | Roche | 5996511001 | Reagents for emulsion PCR |
GS Jr Titanium Sequenicing kit* | Roche | 5996554001 | Includes sequencing reagents, enzymes, buffers, and packing beads |
GS Jr. Titanium Picotiter Plate Kit | Roche | 5996619001 | Sequencing plate with associated reagents and gaskets |
IKA Turrax mixer | 3646000 | Special mixer used with Turrax Tubes | |
IKA Turrax Tube (specialized mixer) | 20003213 | Specialized mixing tubes with internal rotor for creating emulsions | |
GS Nebulizers Kit | Roche | 5160570001 | Nucleic acid size fractionator for use during library preparations |
GS Junior emPCR Bead Counter | Roche | 05 996 635 001 | Library bead counter |
GS Junior Bead Deposition Device | Roche | 05 996 473 001 | Holder for Picotiter plate during centrifugation |
Counterweight & Adaptor for the Bead Deposition Devices | Roche | 05 889 103 001 | Used to balance deposition device with picotiter plate centrifugation |
GS Junior Software | Roche | 05 996 643 001 | Software suite for controlling the instrument, collecting and analyzing data |
GS Junior Sequencer Control v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Run Processor v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS De Novo Assembler v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Reference Mapper v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Amplicon Variant Analyzer v. 3.0 | Roche | (Included in item 05 996 643 001 above) |