Her presenterer vi en dyp sekvensering tilnærming som gir en objektiv bestemmelse av begynnende 3-termini samt mutational profiler av enkelt-strandet DNA molekyler. Hovedprogrammet er karakterisering av begynnende retroviral komplementære DNAs (cDNAs), intermediates generert under prosessen med retroviral omvendt transkripsjon.
Overvåking av nukleinsyre mellomprodukter under virus replikering gir innsikt i effekter og virkningsmekanismer av antivirale forbindelser og verten celle proteiner i viral DNA-syntese. Her adresse vi mangel på en cellebasert, høy-dekning og høy oppløsning analysen som kan definere retroviral omvendt transkripsjon mellomprodukter fysiologiske kontekst av smitte. Metoden beskrevet fanger de 3-termini begynnende komplementære DNA (cDNA) molekyler i HIV-1-infiserte celler single nukleotid oppløsning. Protokollen innebærer høsting av hele celle DNA, målrettet anriking av viral DNA via hybrid fange, adapter hemorroider, størrelse fraksjoneres av gel rensing, PCR forsterkning, dyp sekvensering og dataanalyse. Avgjørende er effektiv og upartiske ligation av adapter molekyler å åpne 3-DNA termini. Beskrevet påføringsmetode bestemmer overflod av omvendt transkripsjoner av hver bestemt lengde i et gitt utvalg. Det gir også informasjon om (intern) sekvens variasjon i omvendt utskrifter og dermed alle potensielle mutasjoner. Generelt er analysen egnet for spørsmål knyttet til DNA 3-utvidelse, forutsatt at malen sekvensen er kjent.
Det kreves mellomprodukter for å analysere og forstå viral replikasjon fullt, stadig mer raffinerte teknikker som fange replikering. Spesielt den nøyaktige definisjonen av viral nukleinsyre arter innen rammen av infiserte celler kan gi ny innsikt, siden mange viral replikasjon mekanismer har hittil vært undersøkt i isolert i vitro reaksjoner. Et godt eksempel er prosessen omvendt transkripsjon i retroviruses, som humant immunsviktvirus 1 (HIV-1). De ulike trinnene av HIV-1 omvendt transkripsjon, der viral enzymet revers transkriptase (RT) kopierer én-strandet RNA genomet til double-strandet DNA, har vært studert i primer forlengelsen analyser med renset proteiner og nukleinsyre syrer1,2,3,4,5. Mens grunnleggende prinsipper ble etablert slike analyser inkorporere ikke alle virus og cellulære komponenter og gjenspeiler kanskje ikke biologisk relevante stoichiometries involvert faktorer. Derfor designet vi en kraftfull teknikk for å bestemme spektra av omvendt transkripsjon mellomprodukter med presise cDNA 3-termini (dvs. å bestemme sin nøyaktige lengder) og nukleotid sekvenser i sammenheng med infeksjoner av levende celler6. Innsamling av data fra tid kurs eksperimenter kan brukes til å sammenligne profilen til transkripsjoner under ulike tilstander, som antivirale molekyler eller proteiner, som kan påvirke effektiviteten og processivity av DNA-syntese og akkumulering. Dette gir en mer detaljert forståelse av naturlige patogen levetid, som ofte er grunnlaget for målrettet narkotika design og vellykket terapeutisk intervensjon.
HIV-1 omvendt transkripsjon består av en rekke påfølgende hendelser initiert av avspenning av en tRNA primer genomisk RNA malen, som deretter utvidet av RT å produsere en kort enkelt-strandet cDNA transkripsjon kalt en sterk minus-strand stopp (-sss) (se Figur 1). Deretter – sss cDNA overføres fra 5′-lang terminalen gjenta (VTH) til den 3-LITERS av den genomisk der det anneals og serverer som primer for fortsatt RT mediert forlengelse av minus strand DNA (se anmeldelser på omvendt transkripsjon1 , 2 , 3 , 4). denne første strand overføringen er ett av trinnene hastighetsbegrensning omvendt transkripsjon; Derfor er – sss cDNA kjent for å akkumulere. Grunnleggende arbeidsflyt og biblioteket design å fange omvendt transkripsjon produktene i infiserte celler er skissert i figur 2a. Den spesifikke primere og analyse innstillinger som brukes i protokollen og oppført i tabell 1 målrette alle tidlig reversere transkripsjon cDNA mellomprodukter innen lengden av 23 til ~ 650 nt, som inkluderer 180-182 nt – sss DNA. Imidlertid kan riktig mindre tilpasninger til strategi ikke bare sent omvendt transkripsjon produkter, men også andre virus og systemer, der målet er å oppdage 3-OH inneholder DNA ender. Viktige begrensninger å inkludere lengdeintervall på sluttproduktet PCR i biblioteket; spesielt vil maler som avstanden mellom adapteren på den åpne 3-terminalen og oppstrøms primer området overskrider ~ 1000 nt trolig være mindre effektivt sekvensert, potensielt innføre villedende tekniske biases under bibliotek forberedelse ( se diskusjon om mere detaljene og tilpasning forslag).
Tidligere har rapporterte teknikker for systematisk fastsettelse av 3-termini av nukleinsyre tråder fokusert på RNA, ikke DNA, molekyler. Et eksempel er 3 rase (rask forsterkning av cDNA slutter)7, som baserer seg på polyadenylation av mRNA. I tillegg ble adapter hemorroider-baserte strategier ansette RNA ligases utviklet, som har inkludert RLM-løp (RNA ligase-mediert rase)8 eller BLONDER (hemorroider-baserte forsterkning av cDNA slutter)9. Det er viktig å understreke at hemorroider-baserte amplifications er følsomme for skjevheter introdusert av hemorroider reaksjonen selv. For eksempel kan hemorroider være mer eller mindre effektivt avhengig av en bestemt nucleotide i 3 posisjon, sekvens, totalt molekyl lengde eller lokale struktur. Slike ligase innstillinger føre til ufullstendig erobringen av molekyler og feilaktig fremstilling i avlesning, som vi og andre har observert9,10. For å minimere ligation bias under adapter tillegg trinnene i protokollen beskrevet her, vi testet en rekke ligation strategier og funnet ut bruk av T4 DNA ligase med en hairpin single-strandet DNA adapter (som beskrevet av Kwok et al. 11) være den eneste prosedyren med nær kvantitative ligation som ikke har resultert i betydelige forskjeller i ligation effektivitet når vurderes med en spesielt valgt kontroll oligonucleotides6. Valg av denne ligation strategien er derfor en viktig funksjon i suksessen til denne protokollen.
Hittil overvåking av HIV-1 RT progresjon i infiserte celler er primært oppnådd ved å måle omvendt transkripsjon produkter av ulike lengde med kvantitative PCR (qPCR) med primer-sonden sett som unikt måle kortere eller lengre (tidlig og sent, henholdsvis) cDNA produkter12,13,14. Denne qPCR er riktig å bestemme iboende effektivitet av omvendt transkripsjon cellulær systemer, er utgangen relativt lav oppløsning, med ingen oppstartsrekkefølgen er avledet. Vår nye tilnærming, basert på optimalisert adapter hemorroider, PCR-mediert biblioteket generasjon og dyp sekvensering adresser teknologigapet og en mulighet til å overvåke omvendt transkripsjon i HIV-1 smitte kvantitativt og single nukleotid oppløsning.
Vi har illustrert nytten av denne metoden i en studie som skilles mellom to foreslåtte modeller for kapasiteten av HIV-1 begrensning faktor APOBEC3G (apolipoprotein B mRNA redigering enzym katalytisk polypeptid-lignende 3G) å forstyrre med den produksjon av viral omvendt transkripsjoner6.
Tilgjengeligheten av rask, pålitelig og kostnadseffektiv dyp sekvensering har revolusjonert mange aspekter innen biovitenskap, slik at stor dybde i sekvensering-baserte analyser. En gjenværende utfordring ligger innovative design og etablering av representant sekvensering biblioteker. Her beskriver vi en protokoll for å fange nye viral cDNA molekyler, spesielt intermediates av HIV-1 omvendt transkripsjon prosessen.
Det viktigste trinnet i denne strategien er ligation av en adapter til åpne 3-jernbanestasjonen termini i en kvantitativ og objektiv måte. Effektiviteten av ligations mellom to ssDNA termini, både blant- og intramolekylære, har blitt undersøkt og optimalisert for ulike programmer11,26,27,28,29. Valget mellom å bruke en hårnål adapter med T4 DNA ligase under forholdene som er beskrevet i trinn 3.3 er empirisk optimeringen der vi vurdert forskjellige ligases, adaptere og reagensene ligation av syntetisk oligonucleotides representerer HIV-1 sekvenser (tabell 2) (data ikke vist). I disse i vitro test reaksjoner bekreftet vi at T4 DNA ligase mediert ligation av hårnål-adapter, som beskrevet av Kwok et al. 11, har en svært lav bias, og oppnår nær fullstendig ligation av acceptor molekyler når adapteren brukes i overkant. Hemorroider effektiviteten var upåvirket av tillegg av nukleotid sekvens gjengi adapteren kompatibel for multiplex primer systemet (se Figur 4). I sammenligning fant vi at en thermostable 5′ DNA/RNA ligase (“Ligase A”, se Tabellen for materiale for nøyaktig ligases forhold her), som er en konstruert RNA-ligase som ble utviklet i en del å forbedre ligation effektivitet med ssDNA som acceptor 27, var faktisk mer effektiv på ligating to ssDNA molekyler enn RNA ligase (Ligase B”), men hadde en betydelig skjevhet, med sterk forskjeller i ligation effektivitet mellom oligonucleotides med enkelt base lengde forskjeller [tabell 2 ; HTP con midt G (a) og (b)]. Videre vi fant bare en minimal skjevhet i reaksjoner med “Ligase C” kombinert med en adapter bærer en randomisert 5′-termini (en strategi brukes til offset kjent nukleotid skjevhet av “Ligase C”, se for eksempel Ding et al. 30). imidlertid “Ligase C”-mediert intermolekylære ligations var ufullstendig, rendering T4 DNA ligase systemet et bedre valg.
Flere kvalitetskontroll trinn over kurset av protokollen og inkludering av positive og negative kontroller tillater påvisning av potensielle problemer før analysen videreføring og gir retningslinjer for feilsøking. QPCR quantifications i trinn 2.2.2 og 2.3.12 Kontroller at mengden materiale som inndata er tilstrekkelig. Typisk cDNA kopi tall i 200 µL elueringsrør (fra trinn 2.1) varierer fra rundt 10.000 til 300.000 per µL. Hybrid fange trinnet kan resultere i tap av generelle HIV-1 cDNA antall men skal resultere i en sterk anriking av bestemte HIV-1 cDNA over mobilnettet DNA, som kan bestemmes ved hjelp av riktig primer for å kvantifisere genomisk DNA før og etter berikelse av qPCR eller ved å måle totale DNA konsentrasjon. Gjenopprettede HIV-1 cDNA når hybrid tatt skritt bør være minst 10% av input. Lav starter materiale kan ellers forklare en vellykket oligonucleotide positive kontroll (se trinn 3.3.2) men bare begrenset leser i prøvene. Lav lese tall samlet kan også forklares med overvurdering av biblioteket konsentrasjonen på grunn av tilstedeværelsen av irrelevante DNA uten MiSeq adaptere. Dette resulterer i lav klynge tetthet kan forbedres ved å bestemme konsentrasjonen av HIV-1 sekvenser i biblioteket av qPCR i tillegg til totalbeløpet DNA av fluorometric analyser. På grunn av svært følsomme natur metoden, bør forsiktighet tas å unngå selv lavnivå forurensning, både fra andre prøver (spesielt fra høy konsentrasjon kontroll oligonucleotide aksjer) samt fra laboratorieutstyr. Arbeider i en UV sterilisering PCR arbeidsstasjon er gunstig i denne forbindelse. Den automatiserte gel geleelektroforese av siste biblioteket (trinn 6.1.2) er et ytterligere kvalitetskontroll mål. Nukleinsyre størrelse området vanligvis observert er mellom 150 til 500 nt. primer som kan oppdages i valgfri kontrollen etter at PCR og før rensing (se merknad i trinn 5.2) skal nå være borte. Representant følge eksemplet intensitet kurven har en topp rundt 160-170 nt og en andre skarpere topp rundt 320-350 nt. Dette sannsynligvis gjenspeiler ofte sett høyere overflod både relativt kort (1 til 20 nt sett inn lengde) omvendt utskrifter og full lengde sterk-stop (180 til 182 nt sett inn lengde) (Figur 3b).
Mens presentert protokollen og valgte primere er spesifikke for tidlig HIV-1 omvendt transkripsjon konstruksjoner, er metoden generelt gjelder noen studier å bestemme åpne 3-termini DNA. De viktigste endringene som kreves i andre sammenhenger blir metoden for hybrid fangst og primer utformingen strategi. For eksempel hvis målet skal tilpasses slutten HIV-1 transkripsjoner, et større antall forskjellige fange biotinylated oligonucleotides annealing over lengden på cDNA ville være tilrådelig og vil trolig redusere tap i hybrid fange trinn. Som nevnt i innledningen, er det viktig å vurdere begrensninger når du utformer området som 3-termini skal oppdages for å unngå forskjellige kilder skjevhet. Først kan det være en skjevhet i PCR reaksjonene, hvis malene med adapteren er svært varierende lengde. Andre sekvensering plattformen brukes her (f.eks MiSeq) har en foretrukket sett inn lengdeintervall for optimal klynger, og betydelig kortere og lengre produkter kan ikke være sekvensielt med samme effektivitet. Delvis dette kan rettes beregningsmessig, som ble gjort ved å beregne en korrigeringsfaktoren for lineær lengde bias (se Figur 4nederste diagram). Men hvis området der 3-termini kartlegging er ønsket er lang (> 1000 nt), det er mer fornuftig å dele reaksjonene med ligated utskrifter og bruke flere oppstrøms primere for å vurdere 3-termini i deler.
Analyseprogrammet ble skrevet internt for spesifikke formål å analysere både den siste nukleotid av HIV-1 sekvensen ved fast adapter sekvensen og base variasjonen av alle baser for å identifisere eventuelle mutasjoner. De individuelle trinnene omfatter følgende: først adapter sekvensene er trimmet med fastx-0.0.13-toolkit; så, noen sekvenser dupliserte (som betyr identiske sekvenser inkludert strekkoden) er fjernet. Alle gjenværende unike leser justeres deretter til HIV-1 sekvensen med Bowtie (http://bowtie-bio.sourceforge.net/index.shtml) maksimal misforholdet satt på tre baser. Malen sekvensen består av de første 635 nt av HIV-1 cDNA (NL4.3 press), som inkluderer – sss sekvensen og det første strand overføre produktet til polypurine spor (U5-R-U3-PPT, se figur 1). Dermed er den medfølgende programvaren og maler bare egnet hvis metoden brukes til det samme programmet (gjenkjenning av tidlig omvendt transkripsjoner av HIV-1NL4.3). Justeringer må gjøres for andre målet sekvenser. Plasseringen av de 3-termini for hver leseoperasjon ble fastsatt av plasseringen i justeringen. Base samtaler for hver posisjon registreres og mutasjon priser beregnes fra totale dekningen av hver base, som varierer, leser er forskjellige lengder og lange innlegg kan ikke være helt dekket av 125-base-sekvenser i Read2.
For å konkludere, tror vi metoden beskrevet å være et verdifullt verktøy for mange typer studier. Åpenbare programmer omfatter undersøkelser av mekanismene bak omvendt transkripsjon hemming gjennom antiretrovirale medisiner eller cellular begrensning faktorer. Bare relativt mindre justeringer bør imidlertid være nødvendig å tilpasse systemet til 3-termini kartlegging i andre single-strandet DNA viral mellomprodukter, som er til stede, for eksempel i parvovirus replikering. Videre, prinsippet om metoden spesielt sin optimalisert ligation skritt, kan gi en sentral del av biblioteket forberedelse design for karakterisering av noen 3-DNA utvidelser, inkludert videreutvikling katalysert av mobilnettet double-strandet DNA polymerases.
The authors have nothing to disclose.
Forfatterne bekrefter støtte fra medlemmer av Malim laboratorium, Luis Apolonia, Jernej Ule og Rebecca Oakey. Forfatterne takker Matt Arno ved King’s College London Genomic Centre og Debbie Hughes ved University College London (UCL), Institutt for Nevrologi neste generasjons sekvensering anlegget, hjelp med MiSeq sekvensering kjører. Arbeidet ble støttet av den britiske Medical Research Council (G1000196 og MR/M001199/1 mm), Wellcome Trust (106223/Z/14/Z til mm), EU-kommisjonens syvende rammeprogram (FP7/2007-2013) gi avtalen ingen. PIIF-GA-2012-329679 (til DP), og Department of Health via en nasjonale institutter for helse forskning omfattende Biomedical Research Center prisen til guys og St. Thomas’ NHS Foundation Trust i samarbeid med King’s College London og kongens College Hospital NHS Foundation Trust.
293T cells | ATCC | CRL-3216 | |
Dulbecco's Modified Eagle's Medium | Gibco | 31966-021 | |
Penicillin/Streptomycin | Gibco | 15150-122 | |
Fetal Bovine Serum | Gibco | 10270-106 | |
HeraCell Vios 250i CO2 Incubator | Thermo Scientific | 51030966 | |
Laminar flow hood – CAS BioMAT2 | Wolflabs | CAS001-C2R-1800 | |
10mm TC-treated culture dish | Corning | 430167 | |
TrypLE™ Express (1x), Stable Trypsin Replacement Enzyme | Gibco | 12605-010 | |
OptiMEM® (Minimal Essential Medium) | Gibco | 31985-047 | |
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) | NIH Aids reagent program | 114 | |
Polyethylenimine (PEI) – MW:25000 | PolySciences Inc | 23966-2 | dissolved at 1mg/ml and adjusted to pH7 |
RQ1- Rnase free Dnase | Promega | M6101 | |
Filter 0.22 μm | Triple Red Limited | FPE404025 | |
15 mL polypropylene tubes | Corning | CLS430791 | |
Sucrose | Calbiochem | 573113 | |
Phosphate Buffered Saline (1x) | Gibco | 14190-094 | |
Ultracentrifuge tubes | Beckman Coulter | 344060 | |
Ultracentrifuge | Sorval | WX Ultra Series | Th-641 Rotor |
Alliance HIV-1 p24 antigen ELISA kit | Perkin Elmer | NEK050001KT | |
CEM-SS cells | NIH Aids reagent program | 776 | |
Roswell Park Memorial Institute Medium | Gibco | 31870-025 | |
CoStar® TC treated multiple well plates | Corning | CLS3513-50EA | |
Benchtop centrifuge: Heraus™ Multifuge™ X3 FR | Thermo Scientific | 75004536 | |
TX-1000 Swinging Bucket Rotor | Thermo Scientific | 75003017 | |
Microcentrifuge: 5424R | Eppendorf | 5404000060 | |
Total DNA extraction kit (DNeasy Blood and Tissue kit) | Qiagen | 69504 | |
Nuclease free H2O | Ambion | AM9937 | |
Cutsmart buffer | New England Biolabs (part of DpnI enzyme) | R0176S | |
DpnI restriction enzyme | New England Biolabs | R0176S | |
Oligonucleotides for qPCR | MWG Eurofins | N/A | HPSF purification |
TaqMan PCR Universal Mastermix | Thermo | 4304437 | |
LoBind Eppendorf® tubes | Eppendorf | 30108078 | |
Axygen™ aerosol filter pipette tips, 1000 μL | Fisher Scientific | TF-000-R-S | |
Axygen™ aerosol filter pipette tips, 200 μL | Fisher Scientific | TF-200-R-S | |
Axygen™ aerosol filter pipette tips, 20 μL | Fisher Scientific | TF-20-R-S | |
Axygen™ aerosol filter pipette tips, 10 μL | Fisher Scientific | TF-10-R-S | |
PCR clean hood | LabCaire | Model PCR-62 | |
DynaMag™2-magnet | Thermo | 12321D | |
Streptavidin MagneSphere® paramagnetic particles | Promega | Z5481 | |
Casein | Thermo Scientific | 37582 | |
End over end rotator, Revolver™ 360° | Labnet | H5600 | |
Tris-Base | Fisher Scientific | BP152-5 | |
Hydrochloric Acid | Sigma | H1758-100ML | |
EDTA disodium salt dihydrate | Electran (VWR) | 443885J | |
Sodium Chloride | Sigma | S3014 | |
Dri-Block® Analog Block Heater | Techne | UY-36620-13 | |
PCR tubes and domed caps | Thermo Scientific | AB0266 | |
PCR machine | Eppendorf | Mastercycler® series | |
T4 DNA ligase | New England Biolabs | M0202M | |
40% Polyethylene glycol solution (PEG) in H2O, MW: 8000 | Sigma | P1458-25ML | |
Betaine solution, 5M | Sigma | B0300-1VL | |
Gel loading buffer II (formamide buffer) | Thermo Scientific | AM8546G | |
Precast 6% TBE urea gels | Invitrogen | EC6865BOX | |
Mini cell electrophoresis system | Invitrogen, Novex | XCell SureLock™ | |
Tris/Borate/EDTA solution (10x) | Fisher Scientific | 10031223 | |
Needle 21 G x1 1/2 | VWR | 613-2022 | |
SYBR Gold nucleic acid stain (10000x) | Life Technologies | S11494 | |
Dark Reader DR46B transilluminator | Fisher Scientific | NC9800797 | |
Ammonium acetate | Merck | 101116 | |
SDS solution 20% (w/v) | Biorad | 161-0418 | |
Centrifuge tube filter | Appleton Woods | BC591 | |
Filter Glass Fibre Gf/D 10mm | Whatman (VWR) | 512-0427 | |
polyadenylic acid (polyA) RNA | Sigma | 10108626001 | |
Glycogen, molecular biology grade | Thermo Scientific | R0561 | |
Isopropanol (2-propanol) | Fisher Scientific | 15809665 | |
Ethanol, molecular biology grade | Fisher Scientific | 10041814 | |
Accuprime™ Supermix I (DNA polymerase premix) | Life Technologies | 12342-010 | |
NEBNext® Multiplex Oligo for Illumina (Index Primer Set 1 and 2) | New England Biolabs | E7335S; E7500S | |
Tapestation D1000 Screentape High sensitivity | Agilent Technologies | 5067- 5584 | |
Tapestation D1000 Reagents | Agilent Technologies | 5067- 5585 | |
2200 Tapestation – automated gel electrophoresis system | Agilent Technologies | G2965AA | |
Agencourt® AMPure® beads XP | Beckman Coulter | A63880 | |
Qubit™ dsDNA HS Assay Kit | Invitrogen | Q32851 | |
Qubit™ 2.0 Fluorometer | Invitrogen | Q32866 | |
Topo™ TA cloning Kit | Invitrogen | 450071 | |
Sequencing platform: MiSeq System | Illumina | ||
Experiment Manager (Sample sheet software) | Illumina | Note: Use TruSeq LT as a template | |
Miseq™ Reagent kit V3 (150 cycle) | Illumina | MS-102-3001 | |
Sequencing hub: Basespace | Illumina | https://basespace.illumina.com | |
Ligase A: Thermostable 5’ App DNA/RNA ligase | NEB | M0319S | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase B: T4 RNA ligase 1 | NEB | M0204 | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase C: CircLigase | Epicentre | CL4111K | Not used in this protocol, but tested in optimization process with results described in the discussion. |