Summary

インタラクトーム Seq: Domainome ライブラリーの構築、検証およびバクテリオファージの表示と次世代シーケンシングによる選択のプロトコル

Published: October 03, 2018
doi:

Summary

説明されているプロトコルは、建設、特性および DNA の任意のソースから作られた”domainome”ライブラリの (好みのターゲット) に対して選択を許可します。さまざまな技術を組み合わせた研究パイプラインにより、これ: バクテリオファージの表示、折りたたみ記者とシークエンサー データ解析のための web ツールを使用します。

Abstract

折りたたみ記者、不十分な蛋白質またはランダムの開いたリーディング ・ フレームを折りに融合、その折りたたみそして機能が侵害された抗生の抵抗などのわかりやすい表現型を持つ蛋白質であります。、ゲノム スケールの TEM 1 β-ラクタマーゼ (アンピシリン耐性酵素) を使用して、我々 選択することが正しく折られた蛋白質ドメインのコレクションすべて intronless ゲノムの DNA のコーディングの部分から戦略を開発しました。呼ばれる”domainome”は、このアプローチによって得られるタンパク質の断片はよく表現された水溶性、構造・機能の研究に適してになります。

クローニングとファージ ディスプレーに直接”domainome”を表示する、我々 ことを示した (例えば、他の蛋白質に抗体)、目的の結合プロパティを持つ特定のタンパク質ドメインを選択することが可能不可欠提供実験的遺伝子アノテーションまたは抗原同定.について

選択したポリクローナル人口の最も豊かなクローンの識別は、新しい次世代シーケンシング技術 (NGS) を使用して実現できます。これらの理由から、ライブラリ自体の多様性、豊かさと選択したフラグメントのそれぞれの正確なマッピングに関する完全な情報を提供する選択出力のディープ シーケンス解析を紹介する.ここで紹介するプロトコルは、ライブラリーの構築、評価、検証にキーの手順を示します。

Introduction

ここでは、建設と任意の遺伝子/ゲノム開始ソースから折り返しと可溶性タンパク質ドメインの図書館の選択のための高スループット方法をについて説明します。3 種類のテクノロジーを組み合わせて方法: バクテリオファージの表示、データ分析のため折りたたみ記者と次世代シーケンシング (NGS) 特定の web ツールの使用。識別と新しいタンパク質/タンパク質ドメインのアノテーションの定義と同様、知られている蛋白質の構造と機能特性の評価のため蛋白質ベースの研究の多くの異なった文脈でメソッドを使用できます。タンパク質間相互作用ネットワーク。

蛋白質ベースの研究に多くの未解決の問題があるまだ最適なタンパク質生産技術の開発、調査のいくつかのフィールドの重要な必要性。たとえば、原核生物と真核生物のゲノム1の何千もの可用性、にもかかわらずコード化されたタンパク質・ ペプチドの直接アノテーション付き相対プロテオームの対応するマップはまだ不足している生物の大多数のため。完全なプロテオームのカタログは、時間とリソースの面で多大な努力を必要とする挑戦的な目標として現れています。すべて、開いたリーディング ・ フレーム (ORFs)、ゲノムのと呼ばれる”ORFeome”の構築のクローニング実験的アノテーションのゴールド スタンダードのままです。通常遺伝子の機能は知られている活動の関連遺伝子に相同性に基づいて割り当てられているが、この手法は不十分な参照のデータベース2,3,4、多くの不適切な注釈の存在のために正確 5。また、識別されていると、注釈が付けられた蛋白質のためもさらなる研究が豊富な構造特性と機能を含む別のコンテキストでの発現パターンの観点からの評価を達成するために必要なだけでなく相互作用のネットワーク。

さらに、蛋白質は、それらのそれぞれ異なるドメインから構成研究とこれらのドメインの正確な定義により包括的な画像、シングルで両方をできる特定の機能を示し、異なるタンパク質機能に貢献すること、遺伝子と全ゲノムのレベルで。このすべての必要な情報は、広く、やりがいのあるフィールドを蛋白質ベースの研究になります。

このような観点で蛋白質の生産のための公平かつ高スループット方法から重要な貢献を与えられます。ただし、かなりの投資が必要の横にある、このようなアプローチの成功は、水溶性/安定な蛋白質の構造を生成する能力に依存します。これは主要な制限の要因に蛋白質の約 30% が正常に表現し、実験的役に立つ6,78に十分なレベルで生産、それが推定されているので。この制限を克服するためのアプローチは、個々 の遺伝子の重複フラグメント表現を一緒に提供する別のポリペプチドを生成するランダムに断片化された DNA の使用に基づきます。それらの大多数 (終止コドンをシーケンス内の存在) のための機能性または非天然 (元以外のフレームで ORF) 用にエンコードしながら、ランダムに生成された DNA のフラグメントのわずかな割合、機能 ORFsない生物学的意味を持つポリペプチド。

当社グループはこれらの問題に対処するゲノム スケールの9,1011,12に使用できるハイスループット蛋白質・表現と相互作用・解析・ プラットフォームを開発しました。このプラットフォームは、次のテクニックを統合: 1); 任意の有機体から DNA のコーディングの部分から正しく折られた蛋白質のドメインのコレクションを選択する方法2) ファージディスプレーの相互のパートナーを選択するため完全に調査の下で全体のインタラクトームを特徴付けるし、関心のクローンを識別する 3) NGS・ 4) ユーザー バイオインフォマティクスやプログラミングのスキルなし簡単で使いやすい方法で Seq インタラクトーム解析を実行するためのデータ解析のための web ツール。

このプラットフォームの利用調査の代替戦略上の重要な利点を提供しています。上記のすべてのメソッドは完全に公平な高スループット、および全ゲノムまで単一の遺伝子に至る研究のモジュール。パイプラインの最初のステップは、深く NGS によって特徴付けられる、調査の下でランダムに断片化された DNA からライブラリの作成です。このライブラリは、ペリプラズム空間 (すなわち、Sec リーダー) 蛋白質の分泌をシグナル配列と TEM1 β-ラクタマーゼ遺伝子間の興味の遺伝子/断片のクローン、組み換えベクターを使用して生成されます。融合タンパク質がアンピシリン抵抗性とクローンの断片がフレームの場合にのみ、アンピシリンの圧力の下で生き残るために能力を与えるこれらの要素とその結果の融合タンパク質が正しく折りたたまれた10,13 14。すべてのクローンと呼ばれる「フィルターのクローン」抗生物質の選択後に救出 ORFs、それら (80% 以上) の大多数、実際遺伝子9から派生しました。さらに、この戦略の力は、すべてのフィルター ORF クローンが正しく折り返されて/水溶性蛋白質/ドメイン15エンコーディングが所見であります。ライブラリと同じ地域/ドメインのマッピングの存在の多くのクローンがある異なる開始点と終了点は、この水溶性製品で発生する可能性が最小の断片の公平なシングル ・ ステップの識別できます。

技術のそれ以上の改善は、ライブラリを特徴付ける NGS の使用によって与えられます。このプラットフォームとデータ解析のための特定の web ツールの組み合わせを与えるさらに広範な分析を必要とせず研究下参照 DNA に関する重要な公平な情報正確な塩基配列と選択された ORFs の場所または実験的努力。

Domainome ライブラリは、選択のコンテキストに転送し、機能研究を実行する汎用計測器として使用できます。高スループット蛋白質表現と相互作用解析プラットフォーム統合、phagemid ベクトルにフィルターの ORF を転送し、バクテリオファージ ORF の作成によってバクテリオファージの表示技術の活用インタラクトーム Seq と呼ばれるライブラリ。一度再バクテリオファージ ディスプレイ コンテキスト、ドメインが M13 粒子の表面に表示されているタンパク質に複製この方法で、特定の酵素活性を持つドメインをエンコードまたはバインディング プロパティ、プロファイル インタラクトーム ネットワークことができます遺伝子断片の domainome ライブラリを直接選択できます。このアプローチは、Zacchiによって見出されました。16後でいくつか他のコンテキスト13,17,18

(質量1920酵母 2 ハイブリッド系など) 蛋白質蛋白質の相互作用を研究するために使用する他の技術と比較して、1 つの主要な利点はバクテリオファージの中に発生する結合パートナーの増幅選択範囲の複数回が表示されます。したがって低豊富な結合蛋白質のドメイン ライブラリの存在の識別を許可選択感度が向上します。ORF フィルター ライブラリで実行される選択の効率は非機能的なクローンの不在のため増し。最後に、技術は蛋白質および非蛋白質餌21,22,23,24,25に対して実行するを選択できます。

Domainome バクテリオファージのライブラリを使用してファージを選択は、餌として自己免疫疾患13がんや感染症など、病理学的条件の異なる患者の血清に由来する抗体を使用して実行できます。このアプローチを使用して、大規模を識別し、特に同時に患者の抗体によって認識される抗原/エピトープを特徴付けるように調査の下で疾患のいわゆる「抗体署名」を取得。他の方法と比較して、使用のバクテリオファージの表示により、線形および立体配座抗原エピトープの同定。特定の署名の識別には、病態理解、新しいワクチン デザイン、新しい治療標的の同定、新しいと特定診断と予後ツールの開発の重要な影響があります。また、感染症に関する研究をフォーカスすると、主要な利点ということです免疫原性タンパク質の検出病原体栽培から独立しました。

我々 のアプローチは、”domainome”を選択するゲノム スケールで折りたたみの記者が使える確認: DNA のコーディングの部分から正しく折られた、よく表現、可溶性タンパク質ドメインやすべての生物からの cDNA のコレクション。一度分離タンパク質断片が遺伝子アノテーションと同様構造の研究、抗体のエピトープ マッピング、抗原の同定などの本質的な実験的情報を提供する多くの目的のため役に立つ。NGS によって提供される高スループット データの完全性は、バクテリオファージの表示ライブラリなどの非常に複雑なサンプルの分析を可能し、伝統的な骨の折れるピッキングと救出された個々 の phage クローンのテストを回避する潜在性を保持します。

同時に極端な感度と NGS 解析の力し、フィルター処理したライブラリの機能のおかげで、それはそれぞれの相互作用を作成することがなく、最初の画面に直接責任がある蛋白質のドメインを識別することが可能それぞれの追加のライブラリは、タンパク質をバインドされています。NGS は、任意の遺伝子/ゲノム開始ソースの全体の domainome の包括的な定義を取得することができます、データ分析 web ツールにより、特異性の高い特性両方の定性・定量用のポイントのビューからの入手、インタラクトーム蛋白質のドメイン。

Protocol

1、ORF ライブラリ (図 1) の建設 挿入 DNA の準備 フラグメントの合成またはゲノム DNA からの準備 エキス/26標準的な方法を使用して DNA を浄化します。 Sonication によって DNA のフラグメント。電源出力 100% で 30 秒パルスを用いた一般的な提案開始として標準的な超音波発生装置を使用してかどう?…

Representative Results

フィルタ リングのアプローチは、図 1で図式です。Intronless DNA の各種類を使用できます。図 1Aでフィルタ リングのアプローチの最初の部分は表されます: agarose のゲルまたは、バイオアナライザーに読み込み、興味の DNA の良い断片化 150 750 bp の目的のサイズの長さ分布とフラグメントの塗抹標本として表示されます。得ら…

Discussion

高品質非常に多様な Orf フィルター ライブラリの作成以来、それはパイプラインのすべての後続の手順に影響を与える全体の手順の最初の重要なステップであります。

本手法の有利な特徴は (intronless) DNA (cDNA、ゲノム DNA、派生した PCR または合成 DNA) の任意の元は図書館の建設に適しています。考慮するべきである最初のパラメーターは、pFILTER ベクターにクローニング …

Disclosures

The authors have nothing to disclose.

Acknowledgements

この作品は、イタリア教育省と大学からの補助金によって支えられた (CP に 2010P3S8BR_002)。

Materials

Sonopuls  ultrasonic homogenizer Bandelin HD2070 or equivalent
GeneRuler 100 bp Plus DNA Ladder Thermo Scientific SM0321 or equivalent
GeneRuler 1 kb DNA Ladder Thermo Fisher Scientific SM0311 or equivalent
Molecular Biology Agarose BioRad 161-3102 or equivalent
Green Gel Plus Fisher Molecular Biology FS-GEL01 or equivalent
6x DNA Loading Dye Thermo Fisher Scientific R0611 or equivalent
QIAquick Gel Extraction Kit Qiagen 28704 or equivalent
Quick Blunting Kit New England Biolabs E1201S
NanoDrop 2000 UV-Vis Spectrophotometer Thermo Fisher Scientific ND-2000
High-Capacity cDNA Reverse Transcription Kit Thermo Fisher Scientific 4368813
Streptavidin Magnetic Beads New England Biolabs S1420S or equivalent
QIAquick PCR purification Kit Qiagen 28104 or equivalent
EcoRV New England Biolabs R0195L
Antarctic Phosphatase New England Biolabs M0289S
T4 DNA Ligase New England Biolabs M0202T
Sodium Acetate 3M pH5.2 general lab supplier
Ethanol for molecular biology Sigma-Aldrich E7023 or equivalent
DH5aF' bacteria cells Thermo Fisher Scientific
0,2 ml tubes general lab supplier
1,5 ml tubes general lab supplier
0,1 cm electroporation cuvettes Biosigma 4905020
Electroporator 2510 Eppendorf
2x YT medium Sigma-Aldrich Y1003
Ampicillin sodium salt Sigma-Aldrich A9518
Chloramphenicol Sigma-Aldrich C0378
DreamTaq DNA Polymerase Thermo Fisher Scientific EP0702
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447S
96-well thermal cycler (with heated lid) general lab supplier
150 mm plates general lab supplier
100 mm plates general lab supplier
Glycerol Sigma-Aldrich G5516
BssHII New England Biolabs R0199L
NheI New England Biolabs R0131L
QIAprep Spin Miniprep Kit Qiagen 27104 or equivalent
M13KO7 Helper Phage GE Healthcare Life Sciences 27-1524-01 
Kanamycin sulfate from Streptomyces kanamyceticus Sigma-Aldrich K1377
Polyethylene glycol (PEG) Sigma-Aldrich P5413
Sodium Cloride (NaCl) Sigma-Aldrich S3014
PBS general lab supplier
Dynabeads Protein G for Immunoprecipitation Thermo Fisher Scientific 10003D or equivalent
MagnaRack Magnetic Separation Rack Thermo Fisher Scientific CS15000 or equivalent
Tween 20 Sigma-Aldrich P1379
Nonfat dried milk powder EuroClone EMR180500
KAPA HiFi HotStart ReadyMix  Kapa Biosystems, Fisher Scientific 7958935001
AMPure XP beads  Agencourt, Beckman Coulter A63881
Nextera XT dual Index  Primers  Illumina FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004
MiSeq or Hiseq2500  Illumina
Spectrophotomer Nanodrop
Agilent Bioanalyzer or TapeStation Agilent
Forward PCR primer general lab supplier 5’ TACCTATTGCCTACGGCAGCCGCTGGATTGTTATTACTC 3’
Reverse PCR primer general lab supplier 5’ TGGTGATGGTGAGTACTATCCAGGCCCAGCAGTGGGTTTG 3’
Forward primer for NGS general lab supplier  5’ TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAGCAAGCGGCGCGCATGC 3’;
Reverse primer for NGS general lab supplier 5’ GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGGATTGGTTTGCCGCTAGC 3’;

References

  1. Loman, N. J., Pallen, M. J. Twenty years of bacterial genome sequencing. Nat Rev Microbiol. 13 (12), 787-794 (2015).
  2. Jones, C. E., Brown, A. L., Baumann, U. Estimating the annotation error rate of curated GO database sequence annotations. BMC Bioinformatics. 8 (1), 170 (2007).
  3. Andorf, C., Dobbs, D., Honavar, V. Exploring inconsistencies in genome-wide protein function annotations: a machine learning approach. BMC Bioinformatics. 8 (1), 284 (2007).
  4. Wong, W. -. C., Maurer-Stroh, S., Eisenhaber, F. More Than 1,001 Problems with Protein Domain Databases: Transmembrane Regions, Signal Peptides and the Issue of Sequence Homology. PLoS Comput Biol. 6 (7), e1000867 (2010).
  5. Bioinformatics, B., et al. Identification and correction of abnormal, incomplete and mispredicted proteins in public databases. BMC Bioinformatics. 9 (9), (2008).
  6. Phizicky, E., Bastiaens, P. I. H., Zhu, H., Snyder, M., Fields, S. Protein analysis on a proteomic scale. Nature. 422 (6928), 208-215 (2003).
  7. DiDonato, M., Deacon, A. M., Klock, H. E., McMullan, D., Lesley, S. A. A scaleable and integrated crystallization pipeline applied to mining the Thermotoga maritima proteome. J Struct Funct Genomics. 5 (1-2), 133-146 (2004).
  8. Nordlund, P., et al. Protein production and purification. Nat Methods. 5 (2), 135-146 (2008).
  9. Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
  10. Di Niro, R., et al. Rapid interactome profiling by massive sequencing. Nucleic Acids Res. 38 (9), e110 (2010).
  11. Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71 (Pt 11), 2227-2235 (2015).
  12. D’Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
  13. D’Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).
  14. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2009).
  15. Heger, A., Holm, L. Exhaustive enumeration of protein domain families. J Mol Biol. 328 (3), 749-767 (2003).
  16. Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
  17. Faix, P. H., Burg, M. A., Gonzales, M., Ravey, E. P., Baird, A., Larocca, D. Phage display of cDNA libraries: Enrichment of cDNA expression using open reading frame selection. Biotechniques. 36 (6), 1018-1029 (2004).
  18. Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
  19. Collins, M. O., Choudhary, J. S. Mapping multiprotein complexes by affinity purification and mass spectrometry. Curr Opin Biotechnol. 19 (4), 324-330 (2008).
  20. Suter, B., Kittanakom, S., Stagljar, I. Two-hybrid technologies in proteomics research. Curr Opin Biotechnol. 19 (4), 316-323 (2008).
  21. Nakai, Y., Nomura, Y., Sato, T., Shiratsuchi, A., Nakanishi, Y. Isolation of a Drosophila gene coding for a protein containing a novel phosphatidylserine-binding motif. J Biochem. 137 (5), 593-599 (2005).
  22. Deng, S. J., et al. Selection of antibody single-chain variable fragments with improved carbohydrate binding by phage display. J Biol Chem. 269 (13), 9533-9538 (1994).
  23. Danner, S., Belasco, J. G. T7 phage display: A novel genetic selection system for cloning RNA-binding proteins from cDNA libraries. Proc Natl Acad Sci. 98 (23), 12954-12959 (2001).
  24. Gargir, A., Ofek, I., Meron-Sudai, S., Tanamy, M. G., Kabouridis, P. S., Nissim, A. Single chain antibodies specific for fatty acids derived from a semi-synthetic phage display library. Biochim Biophys Acta – Gen Subj. 1569 (1-3), 167-173 (2002).
  25. Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
  26. Ausubel, F. M., et al. Current Protocols in Molecular Biology. Mol Biol. 1 (2), 146 (2003).
  27. Sblattero, D., Bradbury, A. Exploiting recombination in single bacteria to make large phage antibody libraries. Nat Biotechnol. 18, 75-80 (2000).
  28. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  29. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  30. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  31. Quinlan, A. R. BEDTools: The Swiss-Army tool for genome feature analysis. Curr Protoc Bioinforma. , (2014).
  32. Skinner, M. E., Uzilov, A. V., Stein, L. D., Mungall, C. J., Holmes, I. H. JBrowse: A next-generation genome browser. Genome Res. 19 (9), 1630-1638 (2009).
  33. Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71, 2227-2235 (2015).
  34. D’Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
  35. Di Niro, R., et al. Characterizing monoclonal antibody epitopes by filtered gene fragment phage display. Biochem J. 388 (Pt 3), 889-894 (2005).
  36. D’Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).
check_url/56981?article_type=t

Play Video

Cite This Article
Soluri, M. F., Puccio, S., Caredda, G., Grillo, G., Licciulli, V. F., Consiglio, A., Edomi, P., Santoro, C., Sblattero, D., Peano, C. Interactome-Seq: A Protocol for Domainome Library Construction, Validation and Selection by Phage Display and Next Generation Sequencing. J. Vis. Exp. (140), e56981, doi:10.3791/56981 (2018).

View Video