Her vil vi præsentere en ny tilgang for at identificere plant vira med dobbelt-strenget DNA genomer. Vi bruger standard metoder til at udtrække DNA og RNA fra inficerede blade og udføre næste generation sequencing. Bioinformatic værktøjer samle sekvenser til contigs, identificere contigs repræsenterer virus genomer og tildele taksonomiske grupper genomer.
Denne metagenome fremgangsmåde bruges til at identificere plant vira med cirkulært DNA genomer og deres udskrifter. Ofte plante DNA virus at forekomme i lav titers i deres vært eller kan ikke være mekanisk podes til en anden vært er vanskelige at formere for at opnå en større titer af smitsomme materiale. Inficerede blade er jorden i en mild buffer med optimale pH og ioniske sammensætning anbefales til rensning af de fleste bacilliform Para retrovira. Urea bruges til at bryde op optagelse organer, at fælde virioner og til at opløse cellulære komponenter. Differential centrifugering giver yderligere adskillelse af virioner fra planten forurenende stoffer. Derefter fjerner proteinase K behandling capsids. Derefter er det virale DNA koncentreret og anvendes til next generation sequencing (NGS). NGS data bruges til at samle contigs, der er indsendt til NCBI-BLASTn til at identificere et undersæt af virus sekvenser i den genererede datasæt. I en parallel pipeline er RNA isoleret fra inficerede blade ved hjælp af en standard kolonne-baserede RNA ekstraktion metode. Derefter udføres ribosomet udtynding til at berige for en delmængde af mRNA og virus udskrifter. Samlet sekvenser afledt af RNA sekventering (RNA-FF.) blev forelagt NCBI-BLASTn til at identificere et undersæt af virus sekvenser i dette dataset. I vores undersøgelse identificeret vi to relaterede fuld længde badnavirus genomer i de to datasæt. Denne metode er den foretrukne til en anden fælles tilgang, der udtrækker den samlede befolkning i små RNA sekvenser for at rekonstruere plante virus genomiske sekvenser. Denne sidstnævnte metagenomic pipeline genopretter virus relateret sekvenser der indsættes retro-transskribere elementer i anlægget genom. Dette er koblet til biokemiske eller Molekylær assays til yderligere skelne de aktivt smitstoffer. Metoden er dokumenteret i denne undersøgelse, genopretter sekvenser repræsentant for replikering af vira, der sandsynligvis angiver active virusinfektion.
Nye plantesygdomme drive forskere til at udvikle nye værktøjer til at identificere den korrekte kausale stof(fer). Første rapporter af nye eller tilbagevendende virussygdomme er baseret på almindeligt forekommende symptomer som mosaik og misdannelser af blade, vene clearing, dværgvækst, visnen, læsioner, nekrose eller andre symptomer. Standard for at rapportere en ny virus, som den kausale agent for en sygdom er at adskille det fra andre forurenende patogener, udbrede det i egnet vært og reproducere sygdommen ved at vaccinere i sunde planter af den oprindelige vært arter. Begrænsning i denne tilgang er, at mange slægter af plant vira afhænge af et insekt eller andre vektorer for transmission til en passende vært eller tilbage til den oprindelige vært arter. I dette tilfælde, Søg efter den relevante vektor kan forlænges, kan der være problemer med at etablere laboratorium kolonier af vektoren, og yderligere bestræbelser er nødvendige for at udarbejde en protokol for eksperimenterende transmission. Hvis betingelserne for vellykket laboratorium transmission undersøgelser ikke kan opnås, så ligger arbejdet under standarden for at rapportere en ny virus-sygdom. For vira, der opstår i deres naturlige værter på meget lav titers, skal forskerne identificere alternative værter for formering til at opretholde tilstrækkelig smitsomme lagre for at udføre forskning. For virus arter, der inficerer kun nogle få anlæg kan det også være en hindring for voksende bestand kulturer1.
I de seneste år, forskere mere ofte beskæftiger høj overførselshastighed NGS og metagenomic metoder til at afdække virus sekvenser, der er til stede i miljøet, som kan findes ikke-forretningsmæssigt forbundne til en kendt sygdom, men kan tildeles taksonomiske arter og slægter 2 , 3 , 4. sådan tilgange til opdagelsen og kategorisering af genetisk materiale i et særskilt miljø giver en måde at beskrive virus mangfoldighed i naturen eller deres tilstedeværelse i en bestemt økosystem, men ikke nødvendigvis bekræfte, at en ramme for at definere kausale agenter for en tilsyneladende sygdom.
Badnavirus slægten tilhører familien Caulimoviridae af pararetroviruses. Disse vira er bacilliform i figuren med cirkulær dobbeltstrenget DNA genomer af ca 7-9 kb. Alle pararetroviruses replikere gennem mellemprodukt RNA. Pararetroviruses findes som episomes og replikere uafhængigt af plante kromosomale DNA5,6. Feltstudier af virus populationer viser, at disse virus populationer er genetisk komplekse. Derudover oplysninger indhentet på tværs af en række plante genomer af høj overførselshastighed sekventering har afsløret talrige eksempler på badnavirus genom fragmenter indsat af uægte integration begivenheder i anlægget genomer. Disse endogene badnavirus sekvenser er ikke nødvendigvis forbundet med infektion7,8,9,10,11. Efterfølgende brug af NGS at identificere nye badnaviruses som den kausale agens af sygdom kompliceres af delpopulation mangfoldighed af episomal genomer samt forekomsten af endogene sekvenser12,13.
Mens der er ikke en optimal pipeline for opdagelsen af roman pararetrovirus genomer, er der to fælles tilgange til at identificere disse vira som kausale agenter for sygdom. Én metode er at berige for små RNA sekvenser fra inficerede blade og derefter samle disse sekvenser for at rekonstruere virus genome(s)14,15,16,17. En anden fremgangsmåde er den rullende cirkel forstærkning (RCA) til at forstærke cirkulære DNA virus genomer18. RCA succes afhænger af alder af bladet og virus titer i den valgte væv. RCA produkter er underkastet begrænsning fordøjelse og klonet i plasmids til direkte sekventering19,20,21.
Canna gule mottle virus (CaYMV) er en badnavirus og er beskrevet som den ætiologiske årsag til gul mottle sygdom i canna, selv om kun en 565 bp fragment af genomet har været tidligere isoleret fra inficerede cannas22. En moderne undersøgelse identificeret CaYMV i Alpinia purpurata (blomstrende ingefær; CaYMV-Ap)23. Målet med denne undersøgelse var at inddrive komplet badnavirus genom sekvenser fra inficerede canna liljer. Vi beskriver en protokol til rensning af virus fra planten forurenende stoffer, og derefter isolere viral DNA fra denne forberedelse, og forberede en DNA bibliotek til brug i NGS. Denne fremgangsmåde fjerner behovet for mellemliggende molekylære forstærkning trin. Vi også isolere mRNA fra inficerede planter for RNA-FF. NGS, som omfatter RNA-seq blev udført ved hjælp af hver nukleinsyre forberedelse. Samlet contigs blev anset for at vedrører Badnavirus systematisk enhed i begge datasæt ved hjælp af National Center for bioteknologi og Information (NCBI) grundlæggende lokale justering søgeværktøj til nukleinsyrer (BLASTn). Vi identificerede genomer af to badnavirus arter24.
I de seneste år har været ansat en række metoder til at studere plante virus biodiversitet i naturlige miljøer, som omfatter berigende for virus-lignende partikler (VLP) eller virus bestemt RNA eller DNA2,3,44, 45,46 . Disse metoder er efterfulgt af NGS og bioinformatic analyse. Målet med denne undersøgelse var at finde den kausale agens af en almindelig sygdom i en dyrket plante. Sygdommen blev rapporteret at være resultatet af en ukendt virus, som har ikke-kappeklædte bacilliform partikler, og som kun en 565 bp fragment er blevet klonet47. Disse oplysninger var tilstrækkelig for forudgående forskere hypotetisk tildele virus til slægten Badnavirus inden for familien Caulimoviridae. Mens forudgående rapporter en hypotese at canna mottle sygdom i canna liljer var resultatet af en enkelt badnavirus, brug af metagenomics tilgang skitseret i denne undersøgelse, vi har besluttet at sygdommen skyldtes to foreløbig badnavirus arter24. Styrken ved hjælp af en metagenome tilgang til at opdage den kausale agent for en sygdom er således, at vi nu kan identificere situationer hvor der kan være mere end én årsag.
Vores tilgang, der kombinerer DNA og RNA sequencing data er grundig og viser også, at resultaterne ved hjælp af to tilgange viste konsekvente resultater og bekræftet tilstedeværelsen af to beslægtet vira. Vi ansat en modificeret procedure for isolering af caulimoviruses og produceret en stikprøve, blev beriget for virus forbundet nukleinsyrer og der var beskyttet i virus kapsid. En service laboratorium var ansat til at udføre DNA-sekventering. Væsentlige konceptet for de novo sekventering er, at DNA polymerase indeholder fluorescerende mærket nukleotider i en DNA-skabelon strand under sekventiel cyklusser af DNA syntese. Contigs samlet efterfulgt af NGS blev indsendt til en bioinformatic arbejdsgang producerer et par contigs, der blev identificeret som virus contigs. Yderligere bekræftelse af to virus genomer10,24,48,49,50 er tilvejebragt ved bioinformatic analyse af RNA-seq data indhentet fra ribo-forarmet RNA præparater. Et interessant resultat var at lære, at befolkningerne i sekvenser inddrives af DNA og RNA sekventering fremlægges lignende fordelinger af ikke-virale og virale nukleinsyrer. Til DNA og RNA sekvensering var < 0.5% af sekvenser af virus oprindelse. Inden for befolkningen i virus sekvenser 78-82% tilhørte familien Caulimoviridae. Ved at sammenligne den forsamlede virus contigs fra DNA og RNA sekventering, bekræftede vi, at de to samlet genomer opstod i begge datasæt.
En bekymring for at bruge kun DNA-sekvensering til at identificere de nye virus genomer er badnavirus genom en åben cirkulære DNA. Vi anede, at sekvenser overlappende afbrydelser i genomet kan medføre hindringer for genom forsamling fra contigs. Indledende undersøgelse af DNA-sekventering resultater afslørede to lignende virus genomer. Vi den hypotese, at disse genomer enten repræsenteret genetiske mangfoldighed af arter, der ikke er blevet undersøgt, eller repræsenterede to arter Co inficere den samme plante24. Derfor, den kollektive bioinformatic analyse af datasæt fremstillet ved NGS DNA og RNA sekventering, aktiveret bekræftelse af tilstedeværelsen af to fuld længde genomer.
Der er en anden betænkning, som udviklede en alternativ metode til at udtrække VLP og nukleinsyrer fra planten homogeniseret for metagenomic undersøgelser, baseret på procedurer til at inddrive DNA fra blomkålsmosaikvirus (CaMV; en caulimovirus)3. Denne tilgang identificeret roman RNA og DNA virus sekvenser i ikke-dyrkede planter. De skridt, afledt af caulimovirus isolation procedure, der anvendes i denne undersøgelse for at opdage den kausale agent for en sygdom af dyrkede planter er i modsætning til trin stammer til at udtrække VLP fra naturligt inficerede planter24. Succes for både ændrede metoder antyder, at proceduren for caulimovirus isolation kan være et værdifuldt udgangspunkt for metagenomic undersøgelser af plant vira i almindelighed.
The authors have nothing to disclose.
Forskning blev finansieret af Oklahoma Center for avancement of Science og Technology anvendes Research Program fase II AR 132-053-2; og af Oklahoma Institut for landbrug speciale afgrøder forskning Grant Program. Vi takker Dr. HongJin Hwang og OSU Bioinformatik Core facilitet, som blev støttet af tilskud fra NSF (EOS-0132534) og NIH (2P20RR016478-04, 1P20RR16478-02 og 5P20RR15564-03).
NaH2PO4 | Sigma-Aldrich St. Louis MO | S5976 | Grinding buffer for virus purification |
Na2HPO4 | Sigma-Aldrich | S0751 | Grinding buffer for virus purification |
Na2SO3 | Thermo-Fisher Waltham, MA | 28790 | Grinding buffer for virus purification |
urea | Thermo-Fisher | PB169-212 | Homogenate extraction |
Triton X-100 | Sigma-Aldrich | X-100 | Homogenate extraction |
Cheesecloth | VWR Radnor, PA | 21910-107 | Filter homogenate |
Tris | Thermo-Fisher | BP152-5 | Pellet resuspension& DNA resuspension buffers |
MgCl2 | Spectrum, Gardena, CA | M1035 | Pellet resuspension buffer |
EDTA | Spectrum | E1045 | Stops enzyme reactions |
Proteinase K | Thermo-Fisher | 25530 | DNA resuspension buffer |
phenol:chloroform:isoamylalcohol | Sigma-Aldrich | P2069 | Dissolve virion proteins |
DNAse I | Promega | M6101 | Degrade cellular DNA from extracts |
95% ethanol | Sigma-Aldrich | 6B-100 | Virus DNA precipitation |
Laboratory blender | VWR | 58984-030 | Grind leaf samples |
Floor model ultracentrifuge &Ti70 rotor | Beckman Coulter, Irving TX | A94471 | Separation of cellular extracts |
Floor model centrifuge and JA-14 rotor | Beckman Coulter | 369001 | Separation of cellular extracts |
Magnetic stir plate | VWR | 75876-022 | Mixing urea into samples overnight |
Rubber policeman | VWR | 470104-462 | Dissolve virus pellet |
2100 bioanalyzer Instrument | Agilent Genomics, Santa Clare, CA | G2939BA | Sensitive detection of DNA and RNA quality and quantity |
2100 Bioanalyzer RNA-Picochip | 5067-1513 | Microfluidics chip used to move, stain and measure RNA quality in a 2100 Bioanalyzer | |
2100 Bioanalyzer DNA-High Sensitive chip | 5067-4626 | Microfluidics chip used to move, stain and measure DNA quality in a 2100 Bioanalyzer | |
Nanodrop spectrophotometer | Thermo-Fisher | ND-2000 | Analysis of DNA/RNA quality at intermediate steps of procedures |
Plant total RNA isolation kit | Sigma-Aldrich | STRN50-1KT | Isolate RNA for RNA-seq |
RNase-free water | VWR | 10128-514 | Resuspension of DNA and RNA for NGS |
RNA concentrator spin column | Zymo Research, Irvine, CA | R1013 | Prepare RNA for RNA-seq |
rRNA removal kit | Illumina, San Diego, CA | MRZPL116 | Prepare RNA for RNA-seq |
DynaMag-2 Magnet | ThermoFisher | 12321D | Prepare RNA for RNA-seq |
RNA enrichment system | Roche | 7277300001 | Prepare RNA for RNA-seq |
Agarose | Thermo-Fisher | 16500100 | Gel analysis of DNA/RNA quality at intermediate steps of procedures |
Ethidium bromide | Thermo-Fisher | 15585011 | Agarose gel staining |
pGEM-T +JM109 competent cells | Promega, Madison, WI | A3610 | Clone genome fragments |
pFU Taq polymerase | Promega | M7741 | PCR amplify virus genome |
dNTPs | Promega | U1511 | PCR amplify virus genome |
PCR oligonucleotides | IDT, Coralvill, IA | Custom order | PCR amplify virus genome |
Miniprep DNA purification kit | Promega | A1330 | Plasmid DNA purification prior to sequencing |
PCR clean-up kit | Promega | A9281 | Prepare PCR products for cloning |
pDRAW32 software | ACAClone | Computer analysis of circular DNA and motifs | |
MEGA6.0 software | MEGA | Molecular evolutionary genetics analysis | |
Primer 3.0 | Simgene.com | ||
Quant-iT™ RiboGreen™ RNA Assay Kit | Thermo-Fisher | R11490 | Fluorometric determination of RNA quantity |
GS Junior™ pyrosequencing System | Roche | 5526337001 | Sequencing platform |
GS Junior Titanium EmPCR Kit (Lib-A) | Roche | 5996520001 | Reagents for emulsion PCR |
GS Jr EmPCR Bead Recovery Reagents | Roche | 5996490001 | Reagents for emulsion PCR |
GS Junior EmPCR Reagents (Lib-A) | Roche | 5996538001 | Reagents for emulsion PCR |
GS Jr EmPCR Oil & Breaking Kit | Roche | 5996511001 | Reagents for emulsion PCR |
GS Jr Titanium Sequenicing kit* | Roche | 5996554001 | Includes sequencing reagents, enzymes, buffers, and packing beads |
GS Jr. Titanium Picotiter Plate Kit | Roche | 5996619001 | Sequencing plate with associated reagents and gaskets |
IKA Turrax mixer | 3646000 | Special mixer used with Turrax Tubes | |
IKA Turrax Tube (specialized mixer) | 20003213 | Specialized mixing tubes with internal rotor for creating emulsions | |
GS Nebulizers Kit | Roche | 5160570001 | Nucleic acid size fractionator for use during library preparations |
GS Junior emPCR Bead Counter | Roche | 05 996 635 001 | Library bead counter |
GS Junior Bead Deposition Device | Roche | 05 996 473 001 | Holder for Picotiter plate during centrifugation |
Counterweight & Adaptor for the Bead Deposition Devices | Roche | 05 889 103 001 | Used to balance deposition device with picotiter plate centrifugation |
GS Junior Software | Roche | 05 996 643 001 | Software suite for controlling the instrument, collecting and analyzing data |
GS Junior Sequencer Control v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Run Processor v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS De Novo Assembler v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Reference Mapper v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Amplicon Variant Analyzer v. 3.0 | Roche | (Included in item 05 996 643 001 above) |