Summary

Amplificação, sequenciamento de próxima geração, e Genomic DNA Mapeamento das retrovirais Integração Sites

Published: March 22, 2016
doi:

Summary

We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.

Abstract

preferências de integração assinatura retrovírus exposição em ambos as escalas local e global. Aqui, apresentamos um protocolo detalhado para (1) geração de diversas bibliotecas de sites de integração retrovirais utilizando PCR amplificação mediada por ligação (LM-PCR) e sequenciamento de próxima geração (NGS), (2) o mapeamento da localização genômico de cada a vírus acolher junção usando BEDTools, e (3) para analisar os dados de relevância estatística. O ADN genómico extraído a partir de células infectadas está fragmentado por digestão com enzimas de restrição ou por sonicação. Depois de DNA final de reparação adequado, os ligantes de cadeia dupla são ligadas para as extremidades do DNA, e PCR com iniciadores semi-internos é conduzida usando iniciadores complementares para tanto a extremidade mais longa repetição terminal (LTR) do vírus e o ADN ligante ligado. Os iniciadores de PCR transportar sequências necessárias para o agrupamento de ADN durante NGS, eliminando a exigência de ligação adaptador separado. Controlo de Qualidade (QC) é conduzido para avaliar a distribuição de tamanho de fragmento de ADN e adaptarer incorporação de ADN antes de NGS. arquivos de saída de seqüência são filtrados para LTR contendo lê, e as sequências que definem o LTR e o ligante são cortadas de distância. sequências celulares hospedeiras aparadas são mapeados para um genoma de referência usando BLAT e são filtrados para 97% de identidade minimamente para um ponto único no genoma de referência. locais de integração únicas são examinados para nucleotídeo adjacente (nt) sequência e distribuição relativa a várias características genômicas. Usando este protocolo, as bibliotecas local de integração de alta complexidade pode ser construído a partir de ADN genómico em três dias. Todo o protocolo que engloba infecção virai exógeno de células de cultura de tecidos sensíveis à análise do local de integração pode, portanto, ser realizada em cerca de uma a duas semanas. Recentes aplicações desta tecnologia referem-se a análise longitudinal de locais de integração a partir de pacientes infectados com HIV.

Introduction

A integração de ADN virai (vDNA) no genoma da célula hospedeira é um passo essencial no ciclo de vida retroviral. A integração é conseguida pela integrase viral enzima (NOS), que realiza dois processos catalíticos distintos que levam à criação do provírus inserida estavelmente um. EM subunidades envolver as extremidades do vDNA linear que é gerada por meio de transcrição reversa, formando o intasome de ordem superior com vDNA extremidades unidas por um multímero 4/2 NO. EM cliva 'extremidades do vDNA jusante da invariantes 5'-CA-3' a 3 em sequências de um processo conhecido como 3'-processamento, deixando um recesso 3 'termina com grupos hidroxilo reactivos em cada terminal vDNA 5-8. O intasome subsequentemente é importado para o núcleo como parte de uma grande assembléia de acolhimento e proteínas virais conhecido como o complexo de pré-integração (PIC) 9-11. Depois de encontrar alvo celular DNA (DNAt), IN utiliza a vDNA 3'-hidroxil groups para clivar o topo DNAt e fios de fundo de forma escalonada e, simultaneamente, se junta ao vDNA para grupos fosfato DNAt 5 'através do processo de transferência de cadeia 12,13.

preferências do site integração exposição retrovírus nas escalas local e global. Localmente, locais de integração de consenso consistem em sequências DNAt palindr�icas fracamente conservados que vão desde cerca de 5-10 pb a montante ea jusante dos locais de inserção vDNA 14,15. Globalmente, os retrovírus alvo anotações de cromatina específicos 16. Há sete géneros retroviral diferente – alpha através de epsilon, lenti e SPUMA. Os lentivírus, que incluem HIV-1, favorecer a integração dentro dos corpos dos genes ativamente transcritas 17, enquanto os gammaretroviruses integrar preferencialmente em locais de transcrição de início (TSSS) e regiões potenciador ativos 18-20. Em nítido contraste, Spumavirus é fortemente inclinado para heterochromregiões ATIC, como domínios associados a lâmina de genes dos pobres 21. Preferências de base DNAt locais são em grande parte ditada pelas redes específicas de contatos nucleoproteína entre IN e DNAt 13,22,23. Para os lentivírus e gammaretroviruses, a integração em relação ao anotações genômicas é em grande parte regido por interações entre IN e fatores celulares cognatos 24-27. Alterando as especificidades da rede de interação IN-DNAt 13,22,23,28 e perturbando ou re-engenharia IN-hospedeiro interações fator 25-27,29-32 são estratégias comprovadas para redirecionar integração nos níveis locais e globais, respectivamente.

O poder dos procedimentos de seqüenciamento de DNA usados ​​para catalogar locais de integração retrovirais aumentou imensamente nas últimas décadas. Locais de integração foram recuperados no trabalho pioneiro utilizando purificação trabalhoso e técnicas de clonagem manuais para produzir apenas um punhado de sites únicos por 33,34 estudo.A combinação de amplificação por LM-PCR de junções de ADN LTR-hospedeiro com a capacidade para mapear locais de integração individuais de genomas projectos de rato humanos e transformadas no domínio, com o número de sítios recuperados a partir de infecções de células de cultura de tecidos exógeno aumentando a várias centenas a milhares 17 , 18. A combinação mais recente LM-PCR com a metodologia NGS enviou disparada profundidade biblioteca. Especificamente, proporcionou pyrosequencing da ordem de dezenas de milhares de locais de integração única 30,35-38, enquanto bibliotecas sequenciado através da utilização do agrupamento de ADN pode produzir milhões de sequências únicas 19-21,39. Aqui nós descrevemos um protocolo LM-PCR otimizado para amplificar e sequenciar locais de integração retrovirais utilizando NGS DNA de agrupamento. O método incorpora necessária sequências adaptadoras para os iniciadores de PCR e, portanto, directamente para as moléculas de ADN amplificados, impedindo assim a necessidade de um passo adicional do adaptador de ligação antes da sequenciamento 40. O gasoduto análise bioinformática, a partir da análise de dados de sequenciamento brutos para junções de ADN LTR-host para o mapeamento dos locais de integração únicas para pertinentes características genômicas, também é geralmente descrita. De acordo com a precedência estabelecida a partir de protocolos metodológicos anteriores neste campo 36,38,41-43, scripts personalizados podem ser desenvolvidos para auxiliar a conclusão de etapas específicas no pipeline de bioinformática. A utilidade e a sensibilidade do protocolo é ilustrado com dados representativos amplificando, sequenciação e mapeamento de HIV-1 os locais de integração a partir de células de cultura de tecidos infectadas na multiplicidade de infecção aproximada (MOI) de 1,0, bem como uma série de titulação de este DNA diluiu-se através do DNA celular infectada em 5 vezes etapas para uma diluição máxima de 1: 15.625 para se obter o equivalente MOI aproximada de 6,4 x 10 -5.

Protocol

1. Gerar stocks de vírus Nota: Um diagrama de fluxo do aspecto banco molhado deste protocolo está representado na Figura 1 Os detalhes da produção de estoque viral e infecção subsequente de células de cultura de tecido geralmente se aplicam a diferentes tipos de retrovírus.. Para algumas experiências, a célula alvo pode não expressam o receptor virai endógeno (s), e em tais casos, a construção de partículas retrovirais pseudotipados albergando heterólogo glicop…

Representative Results

A Tabela 4 lista os resultados de uma experiência representativa para ilustrar a sensibilidade de NGS para a recuperação de locais de integração a partir de uma cultura de células infectadas. DNA celular não infectados foi utilizado para diluir em série de ADN genómico a partir de uma infecção em que todas as células, em média, continha uma integração 40. As diluições foram preparadas em passos de cinco a uma diluição máxima de 1: 15.625. O…

Discussion

Um protocolo para a análise de sítios de integração retroviral, a partir do passo inicial de infecção pelo vírus através do mapeamento dos padrões de distribuição genómicas, é descrito. Este protocolo é aplicável a qualquer retrovírus e qualquer tipo de célula infectáveis. Além disso, a tubagem de ensaio é muito sensível, com o potencial de recuperar um número de locais de integração satisfatória únicas a partir de diluições em série de ADN genómico equivalente ao de uma infecção iniciada…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Somos gratos aos nossos colegas Stephen Hughes e Henry Levin para o conselho que foi fundamental para estabelecer o protocolo de NGS para retroviral sequenciamento local de integração no laboratório Engelman. Este trabalho foi financiado pelo National Institutes of Health concede AI039394 e AI052014 (a ANE) e AI060354 (Centro Harvard University for AIDS Research).

Materials

DMEM Gibco 11965-084 Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum Thermo Scientific SH 30088.03 Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin Corning 30-002-Cl Antibiotics to be added to DMEM
Phosphate-buffered saline Mediatech 21-040-CV Used to wash cells
Trypsin EDTA Corning 25-053-CI Used to detach adherent cells from tissue culture plates
PolyJet SignaGen Laboratories SL100688 DNA transfection reagent
0.45 µm Filters Thermo Scientific 09-740-35B Used to filter virus particle-containing cell culture media
Turbo DNase Ambion AM2239 Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay ABL Inc. 5447 Used to quantify yield of virus production
DNeasy Blood & Tissue Kit Qiagen 69506 Used to purify genomic DNA from cells
Sonicator Covaris S2 With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water GeneMate G-3250-125 Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit Qiagen 28106 Used to purify DNA during library construction
End-It DNA End-Repair Kit Epicentre ER81050 Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–) New England Biolabs (NEB) M0212S Used with dATP to A-tail repaired DNA fragments
dATP Thermo Scientific R0141 Deoxyadenosine triphosphate
MseI NEB R0525L Restriction endonuclease for genomic DNA cleavage
BglII NEB R0144L Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase NEB M0202L/6218 Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides Integrated DNA Technologies custom Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs 
Advantage 2 Polymerase Mix Clontech 639202 Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions) Thermo Scientific R0181 Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop Thermo Scientific NanoDrop 2000 Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter Life Technologies Qubit® 3.0 Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System Agilent G2964AA Tape-based assay to confirm integration site library DNA size distribution
MiSeq Illumina SY-410-1003 Used for NGS

References

  1. Craigie, R., Bushman, F. D. HIV DNA integration. Cold Spring Harb. Perspect. Med. 2, a006890 (2012).
  2. Li, M., Mizuuchi, M., Burke, T. R. J., Craigie, R. Retroviral DNA integration: reaction pathway and critical intermediates. EMBO J. 25, 1295-1304 (2006).
  3. Hare, S., Gupta, S. S., Valkov, E., Engelman, A., Cherepanov, P. Retroviral intasome assembly and inhibition of DNA strand transfer. Nature. 464, 232-236 (2010).
  4. Hare, S., Maertens, G. N., Cherepanov, P. 3′-processing and strand transfer catalysed by retroviral integrase in crystallo. EMBO J. 31, 3020-3028 (2012).
  5. Fujiwara, T., Mizuuchi, K. Retroviral DNA integration: structure of an integration intermediate. Cell. 54, 497-504 (1988).
  6. Roth, M. J., Schwartzberg, P. L., Goff, S. P. Structure of the termini of DNA intermediates in the integration of retroviral DNA: dependence on IN function and terminal DNA sequence. Cell. 58, 47-54 (1989).
  7. Brown, P. O., Bowerman, B., Varmus, H. E., Bishop, J. M. Retroviral integration: structure of the initial covalent product and its precursor, and a role for the viral IN protein. Proc. Natl. Acad. Sci. USA. 86, 2525-2529 (1989).
  8. Pauza, C. D. Two bases are deleted from the termini of HIV-1 linear DNA during integrative recombination. Virology. 179, 886-889 (1990).
  9. Bowerman, B., Brown, P. O., Bishop, J. M., Varmus, H. E. A nucleoprotein complex mediates the integration of retroviral DNA. Genes Dev. 3, 469-478 (1989).
  10. Bukrinsky, M. I., et al. Active nuclear import of human immunodeficiency virus type 1 preintegration complexes. Proc. Natl. Acad. Sci. USA. 89, 6580-6584 (1992).
  11. Miller, M. D., Farnet, C. M., Bushman, F. D. Human immunodeficiency virus type 1 preintegration complexes: studies of organization and composition. J. Virol. 71, 5382-5390 (1997).
  12. Engelman, A., Mizuuchi, K., Craigie, R. HIV-1 DNA integration: mechanism of viral DNA cleavage and DNA strand transfer. Cell. 67, 1211-1221 (1991).
  13. Maertens, G. N., Hare, S., Cherepanov, P. The mechanism of retroviral integration from X-ray structures of its key intermediates. Nature. 468, 326-329 (2010).
  14. Holman, A. G., Coffin, J. M. Symmetrical base preferences surrounding HIV-1, avian sarcoma/leukosis virus, and murine leukemia virus integration sites. Proc. Natl. Acad. Sci. USA. 102, 6103-6107 (2005).
  15. Wu, X., Li, Y., Crise, B., Burgess, S. M., Munroe, D. J. Weak palindromic consensus sequences are a common feature found at the integration target sites of many retroviruses. J. Virol. 79, 5211-5214 (2005).
  16. Kvaratskhelia, M., Sharma, A., Larue, R. C., Serrao, E., Engelman, A. Molecular mechanisms of retroviral integration site selection. Nucleic Acids Res. 42, 10209-10225 (2014).
  17. Schroder, A. R., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110, 521-529 (2002).
  18. Wu, X., Li, Y., Crise, B., Burgess, S. M. Transcription start regions in the human genome are favored targets for MLV integration. Science. 300, 1749-1751 (2003).
  19. LaFave, M. C., et al. MLV integration site selection is driven by strong enhancers and active promoters. Nucleic Acids Res. 42, 4257-4269 (2014).
  20. De Ravin, S. S., et al. Enhancers are major targets for murine leukemia virus vector integration. J. Virol. 88, 4504-4513 (2014).
  21. Maskell, D. P., et al. Structural basis for retroviral integration into nucleosomes. Nature. 523, 366-369 (2015).
  22. Serrao, E., et al. Integrase residues that determine nucleotide preferences at sites of HIV-1 integration: implications for the mechanism of target DNA binding. Nucleic Acids Res. 42, 5164-5176 (2014).
  23. Aiyer, S., et al. Structural and sequencing analysis of local target DNA recognition by MLV integrase. Nucleic Acids Res. 43, 5647-5663 (2015).
  24. Ciuffi, A., et al. A role for LEDGF/p75 in targeting HIV DNA integration. Nat. Med. 11, 1287-1289 (2005).
  25. Sharma, A., et al. BET proteins promote efficient murine leukemia virus integration at transcription start sites. Proc. Natl. Acad. Sci. USA. 110, 12036-12041 (2013).
  26. Gupta, S. S., et al. Bromo- and extraterminal domain chromatin regulators serve as cofactors for murine leukemia virus integration. J. Virol. 87, 12721-12736 (2013).
  27. De Rijck, J., et al. The BET family of proteins targets moloney murine leukemia virus integration near transcription start sites. Cell Rep. 5, 886-894 (2013).
  28. Demeulemeester, J., et al. HIV-1 integrase variants retarget viral integration and are associated with disease progression in a chronic infection cohort. Cell Host Microbe. 16, 651-662 (2014).
  29. Meehan, A. M., et al. LEDGF/p75 proteins with alternative chromatin tethers are functional HIV-1 cofactors. PLoS Pathog. 5, e1000522 (2009).
  30. Ferris, A. L., et al. Lens epithelium-derived growth factor fusion proteins redirect HIV-1 DNA integration. Proc. Natl. Acad. Sci. USA. 107, 3135-3140 (2010).
  31. Gijsbers, R., et al. LEDGF hybrids efficiently retarget lentiviral integration into heterochromatin. Mol. Ther. 18, 552-560 (2010).
  32. Aiyer, S., et al. Altering murine leukemia virus integration through disruption of the integrase and BET protein family interaction. Nucleic Acids Res. 42, 5917-5928 (2014).
  33. Jahner, D., Jaenisch, R. Integration of Moloney leukaemia virus into the germ line of mice: correlation between site of integration and virus activation. Nature. 287, 456-458 (1980).
  34. Stevens, S. W., Griffith, J. D. Human immunodeficiency virus type 1 may preferentially integrate into chromatin occupied by L1Hs repetitive elements. Proc. Natl. Acad. Sci. USA. 91, 5557-5561 (1994).
  35. Wang, G. P., Ciuffi, A., Leipzig, J., Berry, C. C., Bushman, F. D. HIV integration site selection: analysis by massively parallel pyrosequencing reveals association with epigenetic modifications. Genome Res. 17, 1186-1194 (2007).
  36. Wang, G. P., et al. DNA bar coding and pyrosequencing to analyze adverse events in therapeutic gene transfer. Nucleic Acids Res. 36, e49 (2008).
  37. Roth, S. L., Malani, N., Bushman, F. D. Gammaretroviral integration into nucleosomal target DNA in vivo. J. Virol. 85, 7393-7401 (2011).
  38. Ciuffi, A., Barr, S. D. Identification of HIV integration sites in infected host genomic DNA. Methods. 53, 39-46 (2011).
  39. Gillet, N. A., et al. The host genomic environment of the provirus determines the abundance of HTLV-1-infected T-cell clones. Blood. 117, 3113-3122 (2011).
  40. Matreyek, K. A., et al. Host and viral determinants for MxB restriction of HIV-1 infection. Retrovirology. 11, 90 (2014).
  41. Ciuffi, A., et al. Methods for integration site distribution analyses in animal cell genomes. Methods. 47, 261-268 (2009).
  42. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39, e72 (2011).
  43. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol. Biol. 1185, 321-344 (2014).
  44. Page, K. A., Landau, N. R., Littman, D. R. Construction and use of a human immunodeficiency virus vector for analysis of virus infectivity. J. Virol. 64, 5270-5276 (1990).
  45. Emi, N., Friedmann, T., Yee, J. K. Pseudotype formation of murine leukemia virus with the G protein of vesicular stomatitis virus. J. Virol. 65, 1202-1207 (1991).
  46. Wehrly, K., Chesebro, B. p24 antigen capture assay for quantification of human immunodeficiency virus using readily available inexpensive reagents. Methods. 12, 288-293 (1997).
  47. Goff, S., Traktman, P., Baltimore, D. Isolation and properties of Moloney murine leukemia virus mutants: use of a rapid assay for release of virion reverse transcriptase. J. Virol. 38, 239-248 (1981).
  48. Willey, R. L., et al. In vitro mutagenesis identifies a region within the envelope gene of the human immunodeficiency virus that is critical for infectivity. J. Virol. 62, 139-147 (1988).
  49. Butler, S. L., Hansen, M. S., Bushman, F. D. A quantitative assay for HIV DNA integration in vivo. Nat. Med. 7, 631-634 (2001).
  50. Brussel, A., Sonigo, P. Analysis of early human immunodeficiency virus type 1 DNA synthesis by use of a new sensitive assay for quantifying integrated provirus. J. Virol. 77, 10119-10124 (2003).
  51. Serrao, E., Ballandras-Colas, A., Cherepanov, P., Maertens, G. N., Engelman, A. N. Key determinants of target DNA recognition by retroviral intasomes. Retrovirology. 12, 39 (2015).
  52. Maldarelli, F., et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345, 179-183 (2014).
  53. Wagner, T. A., et al. HIV latency. Proliferation of cells with HIV integrated into cancer genes contributes to persistent infection. Science. 345, 570-573 (2014).
  54. Cohn, L. B., et al. HIV-1 integration landscape during latent and active infection. Cell. 160, 420-432 (2015).
  55. Li, X., Ben-Dov, I. Z., Mauro, M., Williams, Z. Lowering the quantification limit of the QubitTM RNA HS assay using RNA spike-in. BMC Mol. Biol. 16, 9 (2015).
  56. Padmanaban, A., Walker, D. M. . Analysis of high molecular weight genomic DNA using the Agilent 2200 TapeStation and genomic DNA ScreenTape. Publication number 5991-1797EN Agilent Technologies. , (2013).
  57. . . Kapa library quantification technical guide version v1.14. , (2014).
  58. Kent, W. J. BLAT–the BLAST-like alignment tool. Genome Res. 12, 656-664 (2002).
  59. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  60. Gaur, M., Leavitt, A. D. Mutations in the human immunodeficiency virus type 1 integrase D,D(35)E motif do not eliminate provirus formation. J. Virol. 72, 4678-4685 (1998).
  61. Varadarajan, J., McWilliams, M. J., Hughes, S. H. Treatment with suboptimal doses of raltegravir leads to aberrant HIV-1 integrations. Proc. Natl. Acad. Sci. USA. 110, 14747-14752 (2013).
  62. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12, 996-1006 (2002).
  63. Berry, C. C., et al. Estimating abundances of retroviral insertion sites from DNA fragment length data. Bioinformatics. 28, 755-762 (2012).
  64. Firouzi, S., et al. Development and validation of a new high-throughput method to investigate the clonality of HTLV-1-infected cells based on provirus integration sites. Genomic Med. 6, 46 (2014).
  65. Mitchell, R. S., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2, E234 (2004).
  66. Schneider, T. D., Stormo, G. D., Gold, L., Ehrenfeucht, A. Information content of binding sites on nucleotide sequences. J. Mol. Biol. 188, 415-431 (1986).
  67. Langmead, B. Chapter 11, Unit 11. 17, Aligning sort sequencing reads with Bowtie. Curr. Protoc. Bioinformatics. , (2010).
  68. LaFave, M. C., Varshney, G. K., Burgess, S. M. GeIST: a pipeline for mapping integrated DNA elements. Bioinformatics. 31, 3219-3221 (2015).
  69. Hocum, J. D., et al. VISA – Vector Integration Site Analysis server: a web-based server to rapidly identify retroviral integration sites from next-generation sequencing. BMC Bioinformatics. 16, 212 (2015).
  70. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15, 1431-1436 (2009).
  71. . . TruSeq Library Prep Pooling Guide. Guidelines for pooling TruSeq libraries for Illumina sequencing systems that require balanced index combinations. , (2015).
check_url/53840?article_type=t

Play Video

Cite This Article
Serrao, E., Cherepanov, P., Engelman, A. N. Amplification, Next-generation Sequencing, and Genomic DNA Mapping of Retroviral Integration Sites. J. Vis. Exp. (109), e53840, doi:10.3791/53840 (2016).

View Video