We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.
Retrovira udviser signatur integration præferencer på både lokale og globale skalaer. Her præsenteres en detaljeret protokol for (1) frembringelsen af diverse biblioteker af retroviral integration websteder ved hjælp ligering-medieret PCR (LM-PCR) amplifikation og næste generation sekventering (NGS), (2) at kortlægge genomiske placering af hver virus- vært krydset ved hjælp BEDTools, og (3) at analysere dataene for statistisk relevans. Genomisk DNA ekstraheret fra inficerede celler er fragmenteret ved spaltning med restriktionsenzymer eller ved lydbehandling. Efter passende DNA ende-reparation, er dobbeltstrengede linkere ligeret på den DNA-ender, og semi-nested PCR udføres under anvendelse af primere komplementære til både den lange terminale gentagelse (LTR) ende af virusset og ligeret linker-DNA. PCR-primerne bærer sekvenser, der kræves til DNA-klyngedannelse under NGS, at bevirke kravet om separat adapter ligering. Kvalitetskontrol (QC) udføres for at vurdere DNA-fragment størrelsesfordeling og tilpasseare DNA inkorporering før NGS. Sequence output filer filtreres for LTR-holdige læser, og sekvenserne definerer LTR og linker er beskåret væk. Trimmede værtscellelinier sekvenser kortlægges til en reference-genom ved hjælp BLAT og filtreres til minimalt 97% identitet med et unikt sted i henvisningen genomet. Unikke integration steder er gransket for tilstødende nukleotid (nt) sekvens og distribution i forhold til forskellige genomiske funktioner. Ved anvendelse af denne protokol, kan integrationssted biblioteker af høj kompleksitet konstrueres fra genomisk DNA i tre dage. Hele protokol, som omfatter eksogen viral infektion af modtagelige vævskulturceller til integrationssted analyse kan derfor udføres i cirka en til to uger. Nylige anvendelser af denne teknologi vedrører langsgående analyse af integration steder fra HIV-smittede patienter.
Integration af viralt DNA (vDNA) i værtscellens genom er et væsentligt skridt i den retrovirale livscyklus. Integration opnås ved den virale enzym integrase (IN), som udfører to forskellige katalytiske processer, der fører til etablering af stabilt indsat provirus 1. I underenheder i indgreb med enderne af det lineære vDNA, der genereres gennem revers transkription, danner den højere ordens intasome med vDNA ender holdes sammen af en IN multimer 2-4. I spalter 3 'enderne af vDNA nedstrøms fra invariante 5'-CA-3' sekvenser i en proces kendt som 3'-behandling, hvilket efterlader forsænkede 3'-ender med reaktive hydroxylgrupper ved hver vDNA terminus 5-8. Den intasome efterfølgende importeres til kernen som en del af en stor samling af vært og virale proteiner kendt som preintegration kompleks (PIC) 9-11. Efter at støde cellulære mål-DNA (tDNA), IN bruger vDNA 3'-hydroxyl groups for at spalte tDNA øverste og nederste tråde i en forskudt måde og samtidig slutter sig til vDNA til tDNA 5 'phosphatgrupperne gennem processen med streng transfer 12,13.
Retrovirus udstille integration foretrukne indstillinger på webstedet på de lokale og globale skalaer. Lokalt, konsensus integrationssteder består af svagt konserverede palindrome tDNA sekvenser, der spænder fra ca. fem til ti bp opstrøms og nedstrøms fra vDNA insertionssteder 14,15. Globalt retrovirus målrette specifikke kromatin anmærkninger 16. Der er syv forskellige retroviral slægter – alpha gennem epsilon, Lenti, og spuma. De lentivira, som omfatter HIV-1, favorisere integration i ligene af aktivt transskriberede gener 17, mens gammaretroviruses fortrinsvis integrere i transkriptionelle start-sites (TSSs) og aktive enhancerregioner 18-20. I skarp modsætning hertil spumavirus stærkt forudindtaget mod heterochromatiske regioner, såsom gen-fattig lamina-associerede domæner 21. Lokale tDNA base-præferencer er for en stor del dikteret af specifikke netværk af nukleoprotein- kontakter mellem IN og tDNA 13,22,23. For lentivira og gammaretroviruses, integration i forhold til genomiske anmærkninger er en stor del styret af interaktioner mellem IN og beslægtede cellulære faktorer 24-27. Ændring detaljerne i IN-tDNA interaktion netværk 13,22,23,28 og forstyrrer eller re-engineering IN-vært faktor interaktioner 25-27,29-32 er bevist strategier til retarget integration på lokalt og globalt plan, hhv.
Effekten af DNA-sekventering procedurer, der anvendes til at katalogisere retroviral integration sites er steget enormt i de seneste årtier. Integration websteder blev genfundet i banebrydende arbejde ved hjælp af arbejdskrævende rensning og manuelle kloningsteknikker at give blot en håndfuld af unikke steder pr studiet 33,34.Kombinationen af LM-PCR-amplifikation af LTR-vært DNA vejkryds med evnen til at kortlægge individuelle integration websteder til menneskelige og mus udkast genomer forvandlet marken, med antallet af websteder genvundet fra eksogen vævskulturer celle infektioner stigende til flere hundrede til tusinder 17 , 18. Den nyere kombination af LM-PCR med NGS metodik har sendt bibliotek dybde skyrocketing. Konkret pyrosekventering gav på rækkefølgen af titusinder af unikke integration sites 30,35-38, mens biblioteker sekventeret ved brug af DNA-klyngedannelse kan give millioner af unikke sekvenser 19-21,39. Her beskriver vi en optimeret LM-PCR-protokol til forstærkning og sekventering retrovirale integration websteder ved hjælp af DNA-klyngedannelse NGS. Fremgangsmåden inkorporerer nødvendige adapter sekvenser i PCR-primerne og således direkte i det amplificerede DNA-molekyler, hvorved kravet til hinder for en ekstra adapter ligering trin før sequencing 40. Den bioinformatisk analyse rørledning fra parsing af rå sekventering data for LTR-værten DNA vejkryds til kortlægning af unikke integration sites for en iagttagelse genomiske funktioner, er også generelt beskrevet. I overensstemmelse med den forrang etableret fra tidligere metodiske protokoller på dette område 36,38,41-43, kan brugerdefinerede scripts blive udviklet til at hjælpe færdiggørelsen af konkrete skridt i bioinformatik pipeline. Anvendeligheden og følsomhed af protokollen er illustreret med repræsentative data ved at forstærke, sekventering og kortlægning HIV-1 integrationssteder fra vævskulturceller inficeret ved det omtrentlige infektionsmultiplicitet (MOI) på 1,0, samt en titrering serien af dette DNA fortyndet gennem uinficerede cellulært DNA i 5-fold trin til en maksimal fortynding på 1: 15.625, hvilket gav den omtrentlige tilsvarende MOI på 6,4 x 10 -5.
En protokol til analyse af retroviral integration sites, fra den oprindelige virus infektion trin gennem kortlægning af genomiske distributionsmønstre, beskrives. Denne protokol gælder for enhver retrovirus og enhver inficeres celletype. Endvidere assayet rørledningen er meget følsomme, med potentiale til at genvinde en tilfredsstillende antal unikke integrationssteder fra serielle fortyndinger af genomisk DNA svarende til det af en infektion initieret med en MOI på 6,4 x 10 -5. Denne følsomhed er prot…
The authors have nothing to disclose.
Vi er taknemmelige for vores kolleger Stephen Hughes og Henry Levin for rådgivning, der var afgørende for at etablere den NGS protokol for retroviral integration websted sekventering i Engelman lab. Dette arbejde blev støttet af amerikanske National Institutes of Health giver AI039394 og AI052014 (til ANE) og AI060354 (Harvard University Center for AIDS Research).
DMEM | Gibco | 11965-084 | Standard cell culture medium, compatible with HEK293T cells |
Fetal Bovine Serum | Thermo Scientific | SH 30088.03 | Different lots of serum may need to be pre-screened for optimal viral production |
Penicillin/Streptomycin | Corning | 30-002-Cl | Antibiotics to be added to DMEM |
Phosphate-buffered saline | Mediatech | 21-040-CV | Used to wash cells |
Trypsin EDTA | Corning | 25-053-CI | Used to detach adherent cells from tissue culture plates |
PolyJet | SignaGen Laboratories | SL100688 | DNA transfection reagent |
0.45 µm Filters | Thermo Scientific | 09-740-35B | Used to filter virus particle-containing cell culture media |
Turbo DNase | Ambion | AM2239 | Used to degrade carryover plasmid DNA from virus stocks |
HIV-1 p24 Antigen Capture Assay | ABL Inc. | 5447 | Used to quantify yield of virus production |
DNeasy Blood & Tissue Kit | Qiagen | 69506 | Used to purify genomic DNA from cells |
Sonicator | Covaris | S2 | With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec |
Nuclease-Free Water | GeneMate | G-3250-125 | Commercially-available water is recommended to reduce the possibility of sample cross-contamination |
QIAQuick PCR Purification Kit | Qiagen | 28106 | Used to purify DNA during library construction |
End-It DNA End-Repair Kit | Epicentre | ER81050 | Used to repair DNA ends of sonicated DNA samples |
Klenow Fragment (3'-5' exo–) | New England Biolabs (NEB) | M0212S | Used with dATP to A-tail repaired DNA fragments |
dATP | Thermo Scientific | R0141 | Deoxyadenosine triphosphate |
MseI | NEB | R0525L | Restriction endonuclease for genomic DNA cleavage |
BglII | NEB | R0144L | Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence |
T4 DNA Ligase | NEB | M0202L/6218 | Enzyme for covalent joining of compatible DNA ends |
DNA Oligonucleotides | Integrated DNA Technologies | custom | Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs |
Advantage 2 Polymerase Mix | Clontech | 639202 | Commercial mix containing DNA polymerase for PCR |
dNTPs (100 mM solutions) | Thermo Scientific | R0181 | Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP |
NanoDrop | Thermo Scientific | NanoDrop 2000 | Spectrophotometer for determination of DNA concentration |
Qubit Fluorimeter | Life Technologies | Qubit® 3.0 | Fluorometer used to confirm integration site library DNA concentration |
2200 TapeStation System | Agilent | G2964AA | Tape-based assay to confirm integration site library DNA size distribution |
MiSeq | Illumina | SY-410-1003 | Used for NGS |