Summary

減法混色のゲノム解析による新規シーケンスの発見

Published: January 25, 2019
doi:

Summary

このプロトコルの目的は、ベンチの研究と計算の組み合わせを使用して、可能性がありますのみ部分的に知られている共同浄化のシーケンスから容易に分離できない新規シーケンスを検索することです。

Abstract

減法混色のゲノムは、遺伝子、蛋白質、またはゲノムの文脈に埋め込まれている一般的な地域のシーケンスを特定すること任意の研究で使用できます。減法ゲノミクスにより包括的な配列と既知の遺伝的要素 (参照、R) を引き算することによって (T) の興味のターゲット シーケンスを分離する研究者です。メソッドは、ミトコンドリア、葉緑体、ウイルスなど新規シーケンスを識別する使用ことができますまたは生殖細胞、染色体の制限し T は r. で始まるされる包括的なゲノムのデータ (R + T) メソッドから簡単に分離することはできません、特に便利参照シーケンス、シーケンスに対して基本的なローカル配置検索ツール (ブラスト) を使用して、ターゲット (T) を残して対応する知られていたシーケンス (R) を削除します。最高の仕事に減算、R は、隆が欠落している比較的完全なドラフトをする必要があります。減算を量的なポリメラーゼの連鎖反応 (qPCR) をテストした後、残りのシーケンスから R を完了メソッドを使用する必要はありません。順番に複数の参照シーケンスを削除して、T の検索を絞り込む、必要に応じて反復することができますサイクルに実験手順の計算手順のリンクここ減法混色のゲノミクスの利点は、物理的な精製が困難、不可能、または高価な場合でも完全に新しいターゲット シーケンスを識別できることです。メソッドの欠点は減算のための適切な参照を見つけると T 陽性を得る負の qPCR のテスト用のサンプルと。キンカチョウの生殖制限染色体から最初の遺伝子の同定における法の実装について述べる.その場合、3 つの参照 (R)、以上 3 つのサイクルを順番に削除が関与して計算フィルタ リング: 不完全なゲノムのアセンブリ、生データをゲノム、トランスクリプトーム データ。

Introduction

このメソッドの目的は、新規ターゲット (T) ゲノム配列、DNA または RNA のゲノムのコンテキスト、または参照 (R) (図 1) からを識別するためにです。メソッドは、対象を物理的に分けることができない、またはそれはこれを行うに高価になる場合に最適です。いくつかの有機体だけ完全に終えた減算、ゲノム手法の重要な技術革新は計算の組み合わせと参照が完璧ではない場合、ターゲット シーケンスを隔離して研究者を有効にするサイクルまたは下書きにベンチ メソッド非モデル生物のゲノム。サイクルの終わりに、qPCR テストがより減算が必要かどうかを判断する使用されます。検証候補 T シーケンス qPCR で知られている T 陽性検体で統計的に大きい検出が表示されます。

ホスト同族体1,2,34を持っていない新規の細菌の創薬ターゲットの発見と感染したホストから新規ウイルスの同定法の化身が実装されています。5,6。T の識別に加えて、メソッドは r: 我々 は最近キンカチョウ参照ゲノムから 936 行方不明の遺伝子と生殖だけ染色体 (T)7からの新しい遺伝子を識別するメソッドを使用を向上できます。減法混色のゲノムは、T は非常に知られていたシーケンスから発散する可能性が高いとき、または T の id はキンカチョウ生殖制限染色体7のように、広義に特に有用です。

あらかじめ T の肯定的な同定を必要としない、減法のゲノム解析の主な利点は、バイアスです。最近の調査でリードヘッドはアルツハイマー病と 4 つの脳領域でウイルス量との関係を検討しました。ウイルス同定のリードヘッドは 515 ウイルス8、彼らの研究を識別することができるウイルス エージェントを厳しく制限のデータベースを作成しました。減法のゲノムが既知の病原に類似性にかかわらず、病と関連付けられる可能な新規ウイルスを分離するために健康とアルツハイマー病のゲノムを比較する使用されている可能性があります。263 の知られている人間を対象としたウイルス、約 167 万の未知ウイルス種存在人間9に感染する可能性を有するそれらの 631,000 827,000 と推定されています。

新規ウイルスの分離が減法エリア ゲノミクスは特に効果的で、いくつかの研究がこのような厳格なメソッドは必要ありません。たとえば、新規ウイルスの識別が抽出し、逆にウイルス シーケンス5の逆のトランスクリプションおよび BLASTx 続いて公平な高スループット シーケンスまたはウイルス核酸の充実を使用している研究を書き写すウイルス シーケンス6. 正しくこれらの研究は、 de novoシーケンスとアセンブリを採用、減算はターゲット シーケンスはブラストを積極的に識別されたので使用されませんでした。場合は、ウイルスが完全に小説と関連していない (または遠縁) 他のウイルスに役に立つテクニックの減法ゲノミクスとされています。減法混色のゲノミクスの利点は、完全に新しいシーケンスを得られることです。生物のゲノムが既知の場合任意のウイルスのシーケンスを残してを減算することができます。たとえば、私たちの出版された調査で7私たちの元の意図ではなかったが減法ゲノミクスによるキンカチョウから新規ウイルス シーケンスを分離しました。

減法混色のゲノムも抗生物質耐性1,2,3,4の劇的な上昇によって動機付けられて、細菌ワクチンのターゲットを識別するために便利な証明しています。自己免疫の反作用の危険性を最小限に抑えるために研究者は人間のホストで同族体を持つ蛋白質を差し引くことによって潜在的なワクチンのターゲットを絞り込みます。コリネバクテリウム類結節症、見て 1 つの特定の研究は可能な薬剤ターゲットが副作用につながるホストの蛋白質に影響を与えないことを確認するいくつかの細菌ゲノムから脊椎動物のホストのゲノムの減算を実行1これらの研究の基本的な仕事の流れは、細菌のプロテオームをダウンロード、の重要な蛋白質を確認、削除冗長なタンパク質、必須タンパク質を分離する BLASTp、BLASTp ホスト プロテオームに対してを使用してホストの同族体のタンパク質を削除。1,2,3,4します。 この場合、減法ゲノミクスは、ワクチン開発はホスト1,2,3,4オフのターゲットの任意の効果を持っていないことを確認します。

生殖制限染色体 (GRC) (この場合は T) の germlines にある最初の蛋白質コーディングの遺伝子を識別するために減法のゲノムを使用しましたが、両方のない体細胞組織男女10。この研究の前に、GRC について知られていたゲノムだけの情報は反復領域11だったDe novoアセンブリは、RNA から大人のキンカチョウと卵巣の組織 (R + T) からシーケンスで実行されました。発行体 (筋肉) ゲノム シーケンス (R1)12を使用してシーケンスの計算除去を行った、その raw (サンガー) 読むデータ (R2)、体 (脳) トランスクリプトーム (R3)13。3 つの参照の連続使用は、追加のフィルター処理が必要なことを示す (図 2A)、各サイクルのステップ 5 でテスト qPCR によって駆動されました。検出された α スナップ遺伝子は、DNA と RNA とクローニングおよびシーケンスから qPCR を通じて確認しました。例では、このメソッドは柔軟性を示す: それが核酸 (DNA 対 RNA) を一致するのに依存しないと参照 (R) を構成するアセンブリまたは raw 読み取りとその減算を実行できます。

Protocol

1 de novo組み立て開始シーケンス。 注: 次世代シーケンス (NGS) データはすべて使用できます、アセンブリは、それらのデータから製造できる限り。オックスフォード ナノポア読み込み fasta ファイルへの組み込みやイルミナ、PacBio が適切な入力データに含まれています。具体性について、このセクションは、イルミナ基づくトランスクリプトーム アセンブリを説明し…

Representative Results

ブラストを実行した後、出力ファイルは、データベースに一致するクエリのシーケンスの一覧が。Python 減算後一致しないシーケンスの数を得、・ qPCR によってテストされます。この結果と次の手順を以下に示します。 負の結果。リファレンス ・ シーケンスに爆発後見ることができる 2 つの可能な否定的な結…

Discussion

減法ゲノミクスは強力なクッキー カッターのアプローチは、いくつかのキーの手順、および参照シーケンスとテスト サンプルの慎重な選択でカスタマイズすることではありません。クエリ アセンブリは、質の悪いは、フィルター処理の手順は、アセンブリのアイテムを分離する可能性がありますのみ。したがって、特定のプロジェクトを適切な検証プロトコルを使用してde novoアセン…

Declarações

The authors have nothing to disclose.

Acknowledgements

著者は、さまざまな段階でキンカチョウ ゲノミクス プロジェクト援助のミシェル ビーダーマン、アリッサ ペダーセン、コリン J. サルダーニャを認めます。我々 はまたコンピューティング クラスターのシステム管理と NIH グラント 1K22CA184297 (J.R.B.) に、NIH NS 042767 (C.J.S) のエフゲニー ・ Bisk を認めます。

Materials

Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

Referências

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer’s Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics’ GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).
check_url/pt/58877?article_type=t

Play Video

Citar este artigo
Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

View Video