Summary

Interactome: Domainome 图书馆建设、噬菌体展示和下一代测序的验证与选择协议

Published: October 03, 2018
doi:

Summary

所描述的协议允许构造、特征和选择 (针对选择的目标) 的 “domainome” 图书馆由任何 DNA 来源。这是通过一个结合不同技术的研究管道实现的: 噬菌体展示, 折叠记者和下一代测序, 以及一个用于数据分析的 web 工具。

Abstract

折叠记者是具有易于识别的表型的蛋白质, 如抗生素耐药性, 其折叠和功能被破坏时, 融合到糟糕的折叠蛋白或随机开放阅读框架。我们已经制定了一个战略, 通过使用 TEM-1 β-酶 (酶授予氨苄西林抗性) 的基因组规模, 我们可以选择正确折叠的蛋白质领域的集合, 从 DNA 编码部分的任何 intronless 基因组。这种方法所获得的蛋白质片段, 所谓的 “domainome”, 将是良好的表达和可溶性, 使它们适合结构/功能研究。

通过在噬菌体显示系统中直接克隆和显示 “domainome”, 我们已经表明有可能选择具有所需绑定特性 (例如,其他蛋白质或抗体) 的特定蛋白质领域, 从而提供必要的基因注释或抗原鉴定的实验信息.

使用新的下一代测序技术可以实现对选定多克隆种群中最富集克隆的识别。基于这些原因, 我们引入了对库本身和选择输出的深度测序分析, 以提供关于每个选定片段的多样性、丰度和精确映射的完整信息。此处介绍的协议显示了库的构建、描述和验证的关键步骤。

Introduction

在这里, 我们描述了一个高通量的方法来构建和选择的折叠和可溶性蛋白质领域从任何基因/基因组的起始源。该方法结合了三种不同的技术: 噬菌体展示, 使用折叠记者和下一代测序 () 与特定的 web 工具进行数据分析。这些方法可用于许多不同的蛋白质基础研究背景下, 用于鉴定和诠释新的蛋白质/蛋白质领域, 表征已知蛋白质的结构和功能特性, 以及定义蛋白质相互作用网络。

在蛋白质的研究中仍然存在许多开放性的问题, 而优化蛋白质生产方法的发展是对几个研究领域的重要需求。例如, 尽管有数以千计的原核和真核基因组1, 但相对蛋白质组的对应地图与编码的蛋白质和肽的直接注释仍然是缺掉的大多数有机体。完整蛋白质组的目录正在成为一个具有挑战性的目标, 需要在时间和资源方面作出巨大的努力。实验注释的黄金标准仍然是克隆所有的开放阅读框架 (码) 的基因组, 建立所谓的 “ORFeome”。通常基因功能被分配基于同源性的相关基因的已知活动, 但这种方法是不准确的, 由于存在许多不正确的注释在参考数据库2,3,4, 5。此外, 即使是已识别和标注的蛋白质, 也需要进行额外的研究, 以在不同的语境中, 从丰度、表达模式等方面进行表征, 包括结构和功能特性, 以及交互网络。

此外, 由于蛋白质是由不同的领域组成的, 每一个都显示出特定的特征, 并且对蛋白质功能有不同的贡献, 研究和这些领域的确切定义可以让一个更全面的图片, 无论是在单一基因和全基因组水平。所有这些必要的信息使得基于蛋白质的研究成为一个广泛而具有挑战性的领域。

从这个角度看, 对蛋白质生产的无偏和高通量的方法可以作出重要贡献。然而, 这些方法的成功, 除了所需的大量投资之外, 还依赖于产生可溶性/稳定蛋白质结构的能力。这是一个主要的限制因素, 因为它已经估计, 只有约30% 的蛋白质可以成功地表达和生产在足够的水平, 是实验性有用的6,7,8。克服这种限制的方法是基于使用随机碎片 DNA 产生不同的多肽, 它们共同提供单个基因的重叠片段表示。在随机生成的 DNA 片段中, 只有很小的一部分是功能性的码而绝大多数是非功能性的 (由于其序列中有停止密码子的存在) 或编码为不自然 (在原始的框架中的 ORF)无生物学意义的多肽。

为了解决所有这些问题, 我们小组开发了一种高通量蛋白质表达和交互分析平台, 可用于基因组9101112。该平台集成了以下技术: 1) 一种从任何有机体的 DNA 编码部分中选择正确折叠的蛋白质域集合的方法;2) 噬菌体展示技术选择合作伙伴的互动;3) 在研究中完全刻画整个 interactome 的特征, 识别出感兴趣的无性系;和 4) 为用户提供数据分析的 web 工具, 无需任何生物信息学或编程技能即可轻松、方便用户地进行 Interactome 分析。

使用这个平台比其他的调查策略具有重要的优势;高于一切的方法是完全无偏见的, 高通量, 和模块化的研究范围从单一基因到整个基因组。管道的第一步是从随机碎片 DNA 的研究中创建一个库, 然后深入地描述其特征。这个库是使用一个工程的载体生成的, 其中的基因/片段被克隆在一个信号序列的蛋白质分泌到周质空间 (Sec 的领导者) 和 TEM1 β酶基因。融合蛋白将赋予氨苄西林抗性和在氨苄西林压力下生存的能力, 只有当克隆的片段是在框架内与这些元素和结果融合蛋白正确折叠10,13 ,14。所有克隆在抗生素选择后获救, 所谓的 “筛选克隆”, 是码, 其中大部分 (超过 80%) 来自实际基因9。此外, 这一战略的力量在于发现所有的 ORF 筛选克隆是编码正确折叠/可溶性蛋白/域15。由于许多克隆, 存在于同一区域/域中的库和映射中, 有不同的起点和终点, 这允许对可能导致可溶性产品的最小碎片进行无偏见的单步识别。

这项技术的进一步改进是通过使用的方法来描述图书馆。这个平台和一个特定的数据分析工具的结合, 给出了关于精确核苷酸序列的重要无偏信息, 以及在研究中选择的码的位置, 而不需要进一步广泛的分析或实验性的努力。

Domainome 库可以转换为选择上下文, 并用作执行功能性研究的通用工具。我们整合的高通量蛋白表达和交互分析平台, 我们称之为 Interactome, 利用噬菌体显示技术, 将经过筛选的 ORF 转化为 phagemid 载体, 并创建噬菌体-ORF图书馆。一旦重新克隆成噬菌体显示语境, 蛋白质领域就显示在 M13 粒子的表面上;这样, domainome 库就可以直接选择用于编码具有特定酶活动或绑定属性的域的基因片段, 从而允许 interactome 网络分析。这种方法最初是由 Zacchi来描述的。16和以后使用在另外几个上下文13,17,18

与其他用于研究蛋白质-蛋白质相互作用 (包括酵母两种杂交系统和质谱19,20) 的技术相比, 一个主要的优势是在噬菌体中发生的结合伙伴的放大。显示多轮选择。这样就增加了选择灵敏度, 从而可以识别出库中存在的低丰度结合蛋白域。由于缺少非功能性克隆, 因此使用 ORF 过滤库进行选择的效率进一步提高。最后, 该技术允许对蛋白质和非蛋白诱饵21,22,23,24,25进行选择。

使用 domainome 噬菌体库的噬菌体选择可以使用来自不同病理条件的患者血清中的抗体,自身免疫性疾病13, 癌症或传染病作为诱饵。这种方法被用来获得所谓的 “抗体签名” 的疾病正在研究允许大规模识别和表征的抗原/表位明确承认的患者的抗体, 在同一时间。与其他方法相比, 使用噬菌体显示可以识别线性和构象抗原表位。确定一个特定的签名可能会对了解发病机制、新的疫苗设计、确定新的治疗靶点以及开发新的和特定的诊断和预后工具有重要影响。此外, 当研究集中在传染病, 一个主要的优势是发现免疫蛋白是独立于病原体的培养。

我们的方法证实, 折叠的记者可以使用在基因组规模, 以选择 “domainome”: 一个正确折叠, 良好表达, 可溶性蛋白域的集合从 DNA 的编码部分和/或从任何有机体的 cDNA。一旦分离的蛋白质片段是有用的许多目的, 提供必要的实验信息的基因注释, 以及结构研究, 抗体表位映射, 抗原鉴定等。通过该方法提供的高通量数据的完整性, 可以对高度复杂的样本 (如噬菌体显示库) 进行分析, 并具有规避传统的对单个噬菌体获救克隆进行费力采摘和测试的潜力。

同时多亏了过滤库的特点, 以及对分析的极端灵敏度和威力, 在初始屏幕上可以直接识别每个交互的蛋白质域, 而无需创建每个绑定蛋白质的附加库。domainome 可以获得对任何基因/基因组起始源的整体的全面定义, 而数据分析 web 工具可以从定性和定量的角度来获取高度具体的特征。interactome 蛋白质的领域。

Protocol

1. ORF 图书馆的建设 (图 1) 插入 DNA 的制备 合成或基因组 DNA 片段的制备 用标准方法提取/纯化 DNA26。 片段 DNA 由超声波。如果使用标准 sonicator, 一般建议从三十年代的脉冲开始, 100% 的功率输出。注: 试验应采用不同的功率和超声波时间进行实验, 以确定最佳的 DNA 制备条件。每次测试后, 通过琼脂?…

Representative Results

过滤方法在图 1中图解。每种 intronless DNA 都可以使用。在图 1A中, 过滤方法的第一部分表示: 在对琼脂糖凝胶或 bioanalyzer 的加载后, 感兴趣的 DNA 的一个好的碎片出现作为片断的涂片以长度分布在期望大小 150-750 bp。给出了一种具有代表性的碎片 DNA 的虚拟凝胶图像。在琼脂糖凝胶上加载的碎片然后恢复, 最终修复和磷酸化, 然后?…

Discussion

创建高质量的高度多样的码过滤库是整个过程中的第一个关键步骤, 因为它将影响管线的所有后续步骤。

本方法的一个重要优点是, 任何来源 (intronless) dna (cDNA、基因组 dna、PCR 衍生或合成 dna) 都适合于图书馆的建设。应该考虑的第一个参数是, 克隆到 pFILTER 向量中的 DNA 片段的长度应该提供一个基因组或转录的整个集合的表示形式, 所谓的 “domainome”。我们已经证明, 蛋白质领域?…

Declarações

The authors have nothing to disclose.

Acknowledgements

这项工作得到意大利教育部和大学 (2010P3S8BR_002 到 CP) 的赠款的支持。

Materials

Sonopuls  ultrasonic homogenizer Bandelin HD2070 or equivalent
GeneRuler 100 bp Plus DNA Ladder Thermo Scientific SM0321 or equivalent
GeneRuler 1 kb DNA Ladder Thermo Fisher Scientific SM0311 or equivalent
Molecular Biology Agarose BioRad 161-3102 or equivalent
Green Gel Plus Fisher Molecular Biology FS-GEL01 or equivalent
6x DNA Loading Dye Thermo Fisher Scientific R0611 or equivalent
QIAquick Gel Extraction Kit Qiagen 28704 or equivalent
Quick Blunting Kit New England Biolabs E1201S
NanoDrop 2000 UV-Vis Spectrophotometer Thermo Fisher Scientific ND-2000
High-Capacity cDNA Reverse Transcription Kit Thermo Fisher Scientific 4368813
Streptavidin Magnetic Beads New England Biolabs S1420S or equivalent
QIAquick PCR purification Kit Qiagen 28104 or equivalent
EcoRV New England Biolabs R0195L
Antarctic Phosphatase New England Biolabs M0289S
T4 DNA Ligase New England Biolabs M0202T
Sodium Acetate 3M pH5.2 general lab supplier
Ethanol for molecular biology Sigma-Aldrich E7023 or equivalent
DH5aF' bacteria cells Thermo Fisher Scientific
0,2 ml tubes general lab supplier
1,5 ml tubes general lab supplier
0,1 cm electroporation cuvettes Biosigma 4905020
Electroporator 2510 Eppendorf
2x YT medium Sigma-Aldrich Y1003
Ampicillin sodium salt Sigma-Aldrich A9518
Chloramphenicol Sigma-Aldrich C0378
DreamTaq DNA Polymerase Thermo Fisher Scientific EP0702
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447S
96-well thermal cycler (with heated lid) general lab supplier
150 mm plates general lab supplier
100 mm plates general lab supplier
Glycerol Sigma-Aldrich G5516
BssHII New England Biolabs R0199L
NheI New England Biolabs R0131L
QIAprep Spin Miniprep Kit Qiagen 27104 or equivalent
M13KO7 Helper Phage GE Healthcare Life Sciences 27-1524-01 
Kanamycin sulfate from Streptomyces kanamyceticus Sigma-Aldrich K1377
Polyethylene glycol (PEG) Sigma-Aldrich P5413
Sodium Cloride (NaCl) Sigma-Aldrich S3014
PBS general lab supplier
Dynabeads Protein G for Immunoprecipitation Thermo Fisher Scientific 10003D or equivalent
MagnaRack Magnetic Separation Rack Thermo Fisher Scientific CS15000 or equivalent
Tween 20 Sigma-Aldrich P1379
Nonfat dried milk powder EuroClone EMR180500
KAPA HiFi HotStart ReadyMix  Kapa Biosystems, Fisher Scientific 7958935001
AMPure XP beads  Agencourt, Beckman Coulter A63881
Nextera XT dual Index  Primers  Illumina FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004
MiSeq or Hiseq2500  Illumina
Spectrophotomer Nanodrop
Agilent Bioanalyzer or TapeStation Agilent
Forward PCR primer general lab supplier 5’ TACCTATTGCCTACGGCAGCCGCTGGATTGTTATTACTC 3’
Reverse PCR primer general lab supplier 5’ TGGTGATGGTGAGTACTATCCAGGCCCAGCAGTGGGTTTG 3’
Forward primer for NGS general lab supplier  5’ TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAGCAAGCGGCGCGCATGC 3’;
Reverse primer for NGS general lab supplier 5’ GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGGATTGGTTTGCCGCTAGC 3’;

Referências

  1. Loman, N. J., Pallen, M. J. Twenty years of bacterial genome sequencing. Nat Rev Microbiol. 13 (12), 787-794 (2015).
  2. Jones, C. E., Brown, A. L., Baumann, U. Estimating the annotation error rate of curated GO database sequence annotations. BMC Bioinformatics. 8 (1), 170 (2007).
  3. Andorf, C., Dobbs, D., Honavar, V. Exploring inconsistencies in genome-wide protein function annotations: a machine learning approach. BMC Bioinformatics. 8 (1), 284 (2007).
  4. Wong, W. -. C., Maurer-Stroh, S., Eisenhaber, F. More Than 1,001 Problems with Protein Domain Databases: Transmembrane Regions, Signal Peptides and the Issue of Sequence Homology. PLoS Comput Biol. 6 (7), e1000867 (2010).
  5. Bioinformatics, B., et al. Identification and correction of abnormal, incomplete and mispredicted proteins in public databases. BMC Bioinformatics. 9 (9), (2008).
  6. Phizicky, E., Bastiaens, P. I. H., Zhu, H., Snyder, M., Fields, S. Protein analysis on a proteomic scale. Nature. 422 (6928), 208-215 (2003).
  7. DiDonato, M., Deacon, A. M., Klock, H. E., McMullan, D., Lesley, S. A. A scaleable and integrated crystallization pipeline applied to mining the Thermotoga maritima proteome. J Struct Funct Genomics. 5 (1-2), 133-146 (2004).
  8. Nordlund, P., et al. Protein production and purification. Nat Methods. 5 (2), 135-146 (2008).
  9. Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
  10. Di Niro, R., et al. Rapid interactome profiling by massive sequencing. Nucleic Acids Res. 38 (9), e110 (2010).
  11. Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71 (Pt 11), 2227-2235 (2015).
  12. D’Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
  13. D’Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).
  14. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2009).
  15. Heger, A., Holm, L. Exhaustive enumeration of protein domain families. J Mol Biol. 328 (3), 749-767 (2003).
  16. Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
  17. Faix, P. H., Burg, M. A., Gonzales, M., Ravey, E. P., Baird, A., Larocca, D. Phage display of cDNA libraries: Enrichment of cDNA expression using open reading frame selection. Biotechniques. 36 (6), 1018-1029 (2004).
  18. Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
  19. Collins, M. O., Choudhary, J. S. Mapping multiprotein complexes by affinity purification and mass spectrometry. Curr Opin Biotechnol. 19 (4), 324-330 (2008).
  20. Suter, B., Kittanakom, S., Stagljar, I. Two-hybrid technologies in proteomics research. Curr Opin Biotechnol. 19 (4), 316-323 (2008).
  21. Nakai, Y., Nomura, Y., Sato, T., Shiratsuchi, A., Nakanishi, Y. Isolation of a Drosophila gene coding for a protein containing a novel phosphatidylserine-binding motif. J Biochem. 137 (5), 593-599 (2005).
  22. Deng, S. J., et al. Selection of antibody single-chain variable fragments with improved carbohydrate binding by phage display. J Biol Chem. 269 (13), 9533-9538 (1994).
  23. Danner, S., Belasco, J. G. T7 phage display: A novel genetic selection system for cloning RNA-binding proteins from cDNA libraries. Proc Natl Acad Sci. 98 (23), 12954-12959 (2001).
  24. Gargir, A., Ofek, I., Meron-Sudai, S., Tanamy, M. G., Kabouridis, P. S., Nissim, A. Single chain antibodies specific for fatty acids derived from a semi-synthetic phage display library. Biochim Biophys Acta – Gen Subj. 1569 (1-3), 167-173 (2002).
  25. Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
  26. Ausubel, F. M., et al. Current Protocols in Molecular Biology. Mol Biol. 1 (2), 146 (2003).
  27. Sblattero, D., Bradbury, A. Exploiting recombination in single bacteria to make large phage antibody libraries. Nat Biotechnol. 18, 75-80 (2000).
  28. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  29. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  30. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  31. Quinlan, A. R. BEDTools: The Swiss-Army tool for genome feature analysis. Curr Protoc Bioinforma. , (2014).
  32. Skinner, M. E., Uzilov, A. V., Stein, L. D., Mungall, C. J., Holmes, I. H. JBrowse: A next-generation genome browser. Genome Res. 19 (9), 1630-1638 (2009).
  33. Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71, 2227-2235 (2015).
  34. D’Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
  35. Di Niro, R., et al. Characterizing monoclonal antibody epitopes by filtered gene fragment phage display. Biochem J. 388 (Pt 3), 889-894 (2005).
  36. D’Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).
check_url/pt/56981?article_type=t

Play Video

Citar este artigo
Soluri, M. F., Puccio, S., Caredda, G., Grillo, G., Licciulli, V. F., Consiglio, A., Edomi, P., Santoro, C., Sblattero, D., Peano, C. Interactome-Seq: A Protocol for Domainome Library Construction, Validation and Selection by Phage Display and Next Generation Sequencing. J. Vis. Exp. (140), e56981, doi:10.3791/56981 (2018).

View Video