We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.
Los retrovirus presentan preferencias de integración de la firma en tanto a escala local y global. A continuación, presentamos un protocolo detallado para (1) generación de diversas bibliotecas de sitios de integración retroviral utilizando la amplificación por PCR (LM-PCR) mediada por la ligadura y la secuenciación de próxima generación (NGS), (2) el mapeo de la localización genómica de cada virus- sede de unión usando BEDTools, y (3) el análisis de los datos de relevancia estadística. El ADN genómico extraído de células infectadas se fragmenta por digestión con enzimas de restricción o por sonicación. Después del final de reparación de ADN adecuado, enlazadores de doble cadena se ligan en los extremos del ADN, y PCR semi-anidada se llevaron a cabo utilizando cebadores complementarios a tanto el extremo repetición terminal larga (LTR) del virus y el ADN enlazador se ligó. Los cebadores de la PCR llevan secuencias requeridas para la agrupación de ADN durante la NGS, negando la necesidad de la ligadura de adaptador independiente. El control de calidad (QC) se llevó a cabo para evaluar la distribución de tamaño de los fragmentos de ADN y adaptarer incorporación de ADN antes de NGS. los archivos de salida de secuencia se filtran para LTR contiene lee, y las secuencias que definen el LTR y el enlazador se recortan de distancia. secuencias de la célula huésped recortadas se asignan a un genoma de referencia utilizando Blat y se filtran por la identidad mínimamente 97% a un punto único en el genoma de referencia. sitios de integración únicas son examinadas por el nucleótido adyacente (nt) secuencia y distribución relativa de diferentes características genómicas. El uso de este protocolo, las bibliotecas del sitio de integración de alta complejidad se pueden construir a partir de ADN genómico en tres días. por lo tanto, todo el protocolo que abarca la infección viral exógena de células de cultivo de tejidos susceptibles de análisis del sitio de integración puede llevarse a cabo en aproximadamente una a dos semanas. Las aplicaciones recientes de esta tecnología se refieren a análisis longitudinal de los sitios de integración de los pacientes infectados por el VIH.
La integración de ADN viral (ADNv) en el genoma de la célula huésped es un paso esencial en el ciclo de vida retroviral. La integración se lleva a cabo por la enzima integrasa viral (IN), que lleva a cabo dos procesos catalíticos diferentes que conducen a la creación de la provirus de forma estable insertado 1. EN subunidades enganchar los extremos de la ADNv lineal que se genera a través de la transcripción inversa, la formación de la intasome de orden superior con ADNv extremos se mantienen unidos por un multímero IN 2-4. EN escinde 'extremos de la vDNA aguas abajo de 5'-CA-3 invariantes' el 3 secuencias en un proceso conocido como 3'-procesamiento, dejando empotrados 3 'termina con grupos hidroxilo reactivos en cada vDNA terminal 5-8. El intasome se importa posteriormente en el núcleo como parte de una gran asamblea de huésped y las proteínas virales conocidas como el complejo de pre-integración (PIC) 9-11. Después de encontrarse con el ADN diana celular (tDNA), EN utiliza el vDNA 3'-hidroxilo groups para escindir la parte superior tDNA y hebras de fondo de forma escalonada y al mismo tiempo se une a la vDNA a grupos fosfato tDNA 5 'a través del proceso de transferencia de la cadena 12,13.
Retrovirus preferencias integración de exposiciones en las escalas locales y globales. A nivel local, los sitios de integración de consenso se componen de secuencias palindrómicas tDNA débilmente conservado que se extienden a partir de entre cinco y diez pares de bases aguas arriba y aguas abajo de los sitios de inserción vDNA 14,15. A nivel mundial, los retrovirus se dirigen a las anotaciones de la cromatina específicos 16. Hay siete diferentes géneros retrovirales – alfa a través épsilon, Lenti, y spuma. Los lentivirus, que incluyen el VIH-1, a favor de la integración dentro de los cuerpos de los genes transcritos activamente 17, mientras que los gammaretroviruses integran preferentemente en sitios de inicio de la transcripción (DST) y las regiones potenciadoras activos 18-20. En agudo contraste, spumavirus está fuertemente sesgada hacia heterochromATIC regiones, tales como dominios de lámina gen asociado a los pobres 21. Las preferencias locales de base tDNA son en gran parte dictado por las redes de contactos específicos de la nucleoproteína entre IN y tDNA 13,22,23. Para los lentivirus y gammaretroviruses, en relación con la integración genómica anotaciones se debe en gran parte regulado por las interacciones entre IN y factores celulares afines 24-27. La alteración de las características específicas de la red de interacción EN-tDNA 13,22,23,28 y perturbar o re-ingeniería en el huésped interacciones de los factores 25-27,29-32 han demostrado estrategias para reorientar la integración en los niveles locales y globales, respectivamente.
El poder de procedimientos de secuenciación de ADN utilizados para catalogar los sitios de integración retroviral se ha incrementado enormemente en los últimos decenios. Sitios de integración se recuperaron en el trabajo pionero de purificación laborioso y utilizando técnicas de clonación manuales para producir sólo un puñado de sitios únicos por 33,34 estudio.La combinación de la amplificación LM-PCR de los cruces de ADN LTR-huésped con la capacidad de asignar sitios de integración individuales a los genomas de los proyectos de humanos y de ratón transformadas el campo, con el número de sitios recuperados de infecciones de células de cultivo de tejidos exógeno creciente a varios cientos a miles 17 , 18. La combinación más reciente de LM-PCR con la metodología NGS ha enviado incremento exorbitante profundidad biblioteca. En concreto, la pirosecuenciación produjo en el orden de decenas de miles de sitios de integración únicas 30,35-38, mientras que las bibliotecas secuenciaron mediante el uso de la agrupación de ADN pueden producir millones de secuencias únicas 19-21,39. A continuación se describe un protocolo de LM-PCR optimizado para amplificar y secuenciar los sitios de integración retroviral utilizando NGS agrupación de ADN. El método incorpora requiere secuencias adaptadoras en los cebadores de PCR y por lo tanto directamente en las moléculas de ADN amplificados, impidiendo de ese modo el requisito de un paso adaptador de ligadura adicional antes de Sequencing 40. El oleoducto análisis bioinformático, desde el análisis de la secuencia de datos en bruto para LTR-anfitrionas cruces de ADN a la cartografía de los sitios de integración únicas de características genómicas pertinentes, también se describe en general. De acuerdo con la preferencia establecida a partir de los protocolos metodológicos previos en este campo 36,38,41-43, scripts personalizados pueden ser desarrollados para ayudar a la realización de medidas específicas en el gasoducto bioinformática. La utilidad y la sensibilidad del protocolo se ilustra con datos representativos mediante la amplificación, secuenciación y el mapeo de VIH-1 sitios de integración a partir de células de cultivo de tejidos infectados en la multiplicidad aproximada de infección (MOI) de 1.0, así como una serie de titulación de este ADN diluido a través del ADN celular no infectada en 5 veces pasos para una dilución máxima de 1: 15.625 para producir el aproximado MOI equivalente de 6,4 x 10 -5.
Un protocolo para el análisis de los sitios de integración retroviral, de la etapa inicial de infección por el virus a través de mapeo de los patrones de distribución genómicas, se describe. Este protocolo es aplicable a cualquier retrovirus y cualquier tipo de célula infectable. Además, la tubería de ensayo es muy sensible, con el potencial para recuperar un número satisfactorio de los sitios de integración únicas de diluciones seriadas de ADN genómico equivalente a la de una infección iniciado con una MO…
The authors have nothing to disclose.
Estamos muy agradecidos a nuestros colegas Stephen Hughes y Henry Levin para el consejo de que era fundamental para establecer el protocolo de NGS para la secuenciación del sitio de integración retroviral en el laboratorio Engelman. Este trabajo fue apoyado por los Institutos Nacionales de Salud de Estados Unidos otorga AI039394 y AI052014 (a ANE) y AI060354 (Centro de la Universidad de Harvard para la Investigación del SIDA).
DMEM | Gibco | 11965-084 | Standard cell culture medium, compatible with HEK293T cells |
Fetal Bovine Serum | Thermo Scientific | SH 30088.03 | Different lots of serum may need to be pre-screened for optimal viral production |
Penicillin/Streptomycin | Corning | 30-002-Cl | Antibiotics to be added to DMEM |
Phosphate-buffered saline | Mediatech | 21-040-CV | Used to wash cells |
Trypsin EDTA | Corning | 25-053-CI | Used to detach adherent cells from tissue culture plates |
PolyJet | SignaGen Laboratories | SL100688 | DNA transfection reagent |
0.45 µm Filters | Thermo Scientific | 09-740-35B | Used to filter virus particle-containing cell culture media |
Turbo DNase | Ambion | AM2239 | Used to degrade carryover plasmid DNA from virus stocks |
HIV-1 p24 Antigen Capture Assay | ABL Inc. | 5447 | Used to quantify yield of virus production |
DNeasy Blood & Tissue Kit | Qiagen | 69506 | Used to purify genomic DNA from cells |
Sonicator | Covaris | S2 | With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec |
Nuclease-Free Water | GeneMate | G-3250-125 | Commercially-available water is recommended to reduce the possibility of sample cross-contamination |
QIAQuick PCR Purification Kit | Qiagen | 28106 | Used to purify DNA during library construction |
End-It DNA End-Repair Kit | Epicentre | ER81050 | Used to repair DNA ends of sonicated DNA samples |
Klenow Fragment (3'-5' exo–) | New England Biolabs (NEB) | M0212S | Used with dATP to A-tail repaired DNA fragments |
dATP | Thermo Scientific | R0141 | Deoxyadenosine triphosphate |
MseI | NEB | R0525L | Restriction endonuclease for genomic DNA cleavage |
BglII | NEB | R0144L | Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence |
T4 DNA Ligase | NEB | M0202L/6218 | Enzyme for covalent joining of compatible DNA ends |
DNA Oligonucleotides | Integrated DNA Technologies | custom | Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs |
Advantage 2 Polymerase Mix | Clontech | 639202 | Commercial mix containing DNA polymerase for PCR |
dNTPs (100 mM solutions) | Thermo Scientific | R0181 | Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP |
NanoDrop | Thermo Scientific | NanoDrop 2000 | Spectrophotometer for determination of DNA concentration |
Qubit Fluorimeter | Life Technologies | Qubit® 3.0 | Fluorometer used to confirm integration site library DNA concentration |
2200 TapeStation System | Agilent | G2964AA | Tape-based assay to confirm integration site library DNA size distribution |
MiSeq | Illumina | SY-410-1003 | Used for NGS |