Interactome-Seq: A Protocol for Domainome Library Construction, Validation and Selection by Phage Display and Next Generation Sequencing

Maria Felicia Soluri; Simone Puccio; Giada Caredda; Giorgio Grillo; Vito Flavio Licciulli; Arianna Consiglio; Paolo Edomi; Claudio Santoro; Daniele Sblattero; Clelia Peano

doi:10.3791/56981

JoVE Journal > Biology

Please note that all translations are automatically generated. Click here for the English version.

Biologia

Interactome-Seq: Протокол для строительства Domainome Библиотека, проверки и отбора Фаговые отображения и следующего поколения последовательности

Published: October 03, 2018

doi:

10.3791/56981

Maria Felicia Soluri, Simone Puccio, Giada Caredda, Giorgio Grillo, Vito Flavio Licciulli, Arianna Consiglio, Paolo Edomi, Claudio Santoro, Daniele Sblattero, Clelia Peano⁶

¹Department of Health Sciences,Università del Piemonte Orientale & IRCAD, Novara, Italy, ²Institute of Biomedical Technologies,National Research Council, Segrate, Milan, Italy, ³Institute of Biomedical Technologies,National Research Council, Bari, Italy, ⁴Department of Life Sciences,University of Trieste, Italy, ⁵Institute of Genetic and Biomedical Research,National Research Council, Rozzano, Milan, Italy, ⁶Humanitas Clinical and Research Center, Rozzano, Milan, Italy

Summary

Протоколы, описанные разрешить строительство, характеристика и выбор (против целевого выбора) из любого источника ДНК библиотеки «domainome». Это достигается путем исследования трубопровода, который сочетает в себе различные технологии: фага дисплей, складной репортером и следующего поколения последовательности с веб-инструмент для анализа данных.

Abstract

Складной журналисты являются белки с легко идентифицировать фенотипы, например антибиотикам, складные и функции которого нарушается, когда сливается с плохо складывания белки или случайных открытом чтения фреймов. Мы разработали стратегию, где, используя ТЭМ-1 β-лактамаз (фермент, присвоении ампициллин сопротивления) в геномной масштабе, мы можем выбрать коллекции правильно сложенный протеин доменов из кодирования части ДНК любой intronless генома. Фрагменты белка, полученные на этот подход, так называемые «domainome», будет хорошо выражена и растворимые, что делает их пригодными для структурно функциональных исследований.

Клонирование и отображение «domainome» непосредственно в систему отображения фага, мы показали, что это можно выбрать конкретные белка домены с желаемой привязки свойств (например, другие белки или антитела), обеспечивая тем самым важным экспериментальной информации для идентификации генов аннотации или антигена.

Выявление наиболее обогащенного клонов в выбранной поликлональных населения может быть достиган с использованием Роман секвенирование нового поколения технологий (НГС). По этим причинам мы представляем глубокую последовательности анализа самой библиотеки и выбора мероприятий предоставлять полную информацию о разнообразии, изобилия и точное сопоставление каждого выбранного фрагмента. Протоколы, представленные здесь показать основные шаги для строительства библиотеки, характеристик и проверки.

Introduction

Здесь мы описываем метод высокой пропускной способностью для строительства и выбор библиотек складывается и растворимого белка доменов из любого источника, генной/геномной начиная. Этот подход сочетает в себе три различные технологии: фага дисплей, использование складной репортером и следующего поколения последовательности (НГС) с конкретным веб-инструмент для анализа данных. Методы могут использоваться во многих различных контекстах белка на основе исследований, для идентификации и аннотации новых доменов белков/белков, характеристика структурных и функциональных свойств известных белков, а также определение белок взаимодействие сети.

Многие открытые вопросы по-прежнему присутствуют в исследованиях на основе белков и разработки методов для оптимального белок производства является важной потребность в нескольких областях расследования. Например несмотря на наличие тысяч геномов прокариот и эукариот¹, соответствующий карта относительной протеомов аннотацию прямого закодированного белков и пептидов отсутствует до сих пор подавляющее большинство организмов. Каталог полный протеомов становится сложной цели, требующие огромных усилий в плане времени и ресурсов. Золотой стандарт для экспериментальных заметки остается клонирования все открытые рамки считывания (ORFs) генома, строительство так называемой «ORFeome». Обычно функции гена назначается на основании гомологии связанных генов известных деятельности, но этот подход является недостаточно точной из-за наличия многих неправильные аннотации в справочных баз данных²^,³^,⁴^, ⁵. Кроме того, даже для белков, которые были выявлены и комментариями, дополнительные исследования необходимы для достижения характеристика с точки зрения обилия, выражений шаблонов в разных контекстах, включая структурные и функциональные свойства, а также взаимодействие сетей.

Кроме того поскольку белки состоят из разных доменов, каждый из них показаны специфические особенности и вклад в по-разному функций белков, изучение и точное определение этих доменов может позволить более полную картину, как на сингл гена и на уровне полного генома. Все необходимая информация делает исследования белков на широкой и сложной области.

В этой перспективе важный вклад могут предоставляться на беспристрастной и высок объём методы для производства белка. Однако успех таких подходов, рядом значительных инвестиций, необходимых, опирается на способность производить растворимый/стабильный белка конструкции. Это основные ограничения фактор, так как было подсчитано, что только около 30% белков может успешно выразил и производится на достаточных уровнях экспериментально полезным⁶^,^,⁷⁸. Подход для преодоления этого ограничения основан на использовании случайно фрагментированных ДНК, чтобы произвести различных полипептидов, которые вместе обеспечивают перекрывающихся фрагментов представление отдельных генов. Только небольшой процент случайных фрагментов ДНК являются функциональные ORFs, хотя подавляющее большинство из них являются нефункциональные (благодаря наличию стоп-кодонов внутри их последовательностей) или кодировать для неестественное (ORF в кадре оригинал) полипептиды с биологического смысла.

Для решения всех этих вопросов, наша группа разработала высок объём белка выражение и взаимодействие анализ платформу, которая может быть использована на геномной масштаб⁹^,¹⁰^,и¹¹^,¹². Эта платформа включает следующие методики: 1) метод для выбора коллекции правильно сложенный протеин доменов из кодирования части ДНК от любого организма; 2 технология отображения фага для выбора партнеров взаимодействия; 3) NGS полностью характеризовать весь interactome стадии изучения и выявления клонов интерес; и 4) веб-инструмент для анализа данных для пользователей без каких-либо биоинформатики или навыков программирования для выполнения анализа Interactome-Seq в простым и удобным способом.

Использование этой платформы обеспечивает важные преимущества по сравнению альтернативных стратегий расследования; Прежде всего этот метод полностью беспристрастной, высокой пропускной способности и модульные для исследования, начиная от одного гена до всего генома. Первый шаг конвейера является создание библиотеки от случайно фрагментированных ДНК исследуемых, который характеризуется затем глубоко NGS. Эта библиотека генерируется с использованием вектора инженерии где генов/фрагменты интерес клонируются между последовательность сигнала для секреции белков в Периплазматическое пространство (т.е., лидер Sec) и гена β-лактамаз ТЭМ1. Синтез белка будет наделять ампициллин сопротивления и способность выжить под давлением ампициллин, только в том случае, если клонированные фрагменты в кадр с этими элементами и результате синтез белка является правильно сложенные¹⁰^,¹³ ^,¹⁴. Все клоны спасли после антибиотика выбора, так называемые «фильтруют клонов», ORFs, подавляющее большинство из них (более 80%) и являются производными от реальных генов⁹. Кроме того сила этой стратегии заключается в выводах, что все клоны фильтрации ORF кодирования для правильно сложить/растворимые белки/домены¹⁵. Как много клонов, присутствует в библиотеке и картирования в том же регионе или домена, имеют разные начальные и конечные точки, это позволяет беспристрастной, единый этапа идентификации минимальная фрагментов, которые могут привести к растворимых продуктов.

Дальнейшее совершенствование технологии предоставляется с помощью NGS характеризуют библиотеки. Сочетание этой платформы и конкретных веб-инструмент для анализа данных дает важные объективную информацию на точное нуклеотидных последовательностей и расположение выбранных ORFs на ссылку ДНК исследуемых без необходимости дальнейших обширных анализов или экспериментальные работы.

Domainome библиотеки могут передаваться в контекст выделения и используется в качестве универсального инструмента для выполнения функциональных исследований. Высок объём белка выражение и взаимодействие анализ платформы что мы интегрированы и что мы называли Interactome-Seq использует преимущества технологий отображения Фаговые путем передачи фильтрованного ORF в phagemid вектор и создания ФАГ ORF Библиотека. После повторного клонирован в контекст отображения фага, белка, домены отображаются на поверхности частиц M13; Таким образом domainome библиотек можно непосредственно выбрать для фрагментов гена кодирования домены с конкретными ферментативную деятельность или привязки свойств, позволяя interactome сети профилирования. Этот подход был первоначально описан Zacchi соавт. ¹⁶ и позднее используется в нескольких других контексте¹³^,¹⁷^,¹⁸.

По сравнению с другими технологиями, используется для изучения взаимодействия протеин протеина (включая дрожжей два гибридной системы и масс-спектрометрии¹⁹^,²⁰), одно из главных преимуществ является усиление связывание партнера, что происходит во время ФАГ Отображение нескольких раундов выделения. Это увеличивает выбор чувствительности, таким образом позволяя выявление низкой обильные связывания белков доменов присутствует в библиотеке. Эффективность отбора выступал с ORF-фильтрации библиотеки далее увеличивается из-за отсутствия нефункциональные клонов. Наконец технология позволяет выбор выполняться против белков и не протеинового приманки²¹^,^,²²²³^,²⁴^,²⁵.

Фаговые выборки с использованием библиотеки domainome ФАГ может производиться с использованием антител, исходя из сыворотки больных с различных патологических состояний, например аутоиммунных заболеваний¹³, рака или инфекции заболеваний как приманку. Этот подход используется для получения так называемого «антитело подпись» болезни под исследования, позволяющие массово идентифицировать и охарактеризовать антигены/epitopes конкретно признаны больных антител в то же время. По сравнению с другими методами использование фага дисплей позволяет идентификации как линейной, так и конформационные антигенных эпитопам. Выявление конкретных подписи потенциально может иметь важное значение для понимания патогенеза, новый дизайн вакцины, выявление новых терапевтических целей и развития новых и конкретных инструментов, диагностические и прогностические. Кроме того когда исследование сосредоточено на инфекционные заболевания, основным преимуществом является, что открытие иммуногенных белков зависит от выращивания патогена.

Наш подход подтверждает, что складной журналистам может использоваться в геномной масштабе для выбора «domainome»: коллекция правильно сложенные, хорошо выраженной, растворимые белки доменов от кодирования части ДНК или cDNA от любого организма. Когда изолированные фрагменты белка полезны для многих целей, предоставляя основные экспериментальной информации для гена аннотации, а что касается структурных исследований, антитела epitope сопоставления, выявления антигена, и т.д. Полнота высок объём данных, предоставленных NGS позволяет анализ сложных образцов, таких как Фаговые отображения библиотек и имеет потенциал, чтобы обойти традиционной трудоемкой собирание и тестирование отдельных Фаговые спасли клонов.

В то же время благодаря функции отфильтрованных библиотеки и крайняя чувствительность и мощности NGS анализа можно определить ответственность каждого взаимодействия непосредственно на начальном экране, без необходимости создания домена протеина дополнительные библиотеки для каждого неизбежно белка. NGS позволяет получить всеобъемлющее определение всей domainome любого генно/геномной начиная источника и данных анализа веб-инструмент позволяет получение весьма специфические характеристики с качественной и количественной точки зрения interactome белки доменов.

Protocol

1. Строительство ORF библиотеки (рис. 1) Подготовка Вставка ДНК Подготовка фрагментов из синтетических или геномной ДНК Экстракт/очищают ДНК, используя стандартные методы26. Фрагмент ДНК в sonication. Если с помощью стандар?…

Representative Results

Метод фильтрации схематизируются на рисунке 1. Каждый вид intronless ДНК может использоваться. На рисунке 1A представлена первая часть фильтрации подхода: после загрузки на геле агарозы или bioanalyzer, хороший фрагментация ДНК интерес появляется…

Discussion

Создание высокого качества весьма разнообразны ORFs отфильтрованных библиотеки является первым важным шагом в рамках всей процедуры так, как оно повлияет на все последующие шаги трубопровода.

Важной особенностью выгодно нашего метода является, что любой источник (intronless) …

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Эта работа была поддержана грант от министерства образования Италии и университета (2010P3S8BR_002 КТ).

Materials

Sonopuls ultrasonic homogenizer	Bandelin	HD2070	or equivalent
GeneRuler 100 bp Plus DNA Ladder	Thermo Scientific	SM0321	or equivalent
GeneRuler 1 kb DNA Ladder	Thermo Fisher Scientific	SM0311	or equivalent
Molecular Biology Agarose	BioRad	161-3102	or equivalent
Green Gel Plus	Fisher Molecular Biology	FS-GEL01	or equivalent
6x DNA Loading Dye	Thermo Fisher Scientific	R0611	or equivalent
QIAquick Gel Extraction Kit	Qiagen	28704	or equivalent
Quick Blunting Kit	New England Biolabs	E1201S
NanoDrop 2000 UV-Vis Spectrophotometer	Thermo Fisher Scientific	ND-2000
High-Capacity cDNA Reverse Transcription Kit	Thermo Fisher Scientific	4368813
Streptavidin Magnetic Beads	New England Biolabs	S1420S	or equivalent
QIAquick PCR purification Kit	Qiagen	28104	or equivalent
EcoRV	New England Biolabs	R0195L
Antarctic Phosphatase	New England Biolabs	M0289S
T4 DNA Ligase	New England Biolabs	M0202T
Sodium Acetate 3M pH5.2	general lab supplier
Ethanol for molecular biology	Sigma-Aldrich	E7023	or equivalent
DH5aF' bacteria cells	Thermo Fisher Scientific
0,2 ml tubes	general lab supplier
1,5 ml tubes	general lab supplier
0,1 cm electroporation cuvettes	Biosigma	4905020
Electroporator 2510	Eppendorf
2x YT medium	Sigma-Aldrich	Y1003
Ampicillin sodium salt	Sigma-Aldrich	A9518
Chloramphenicol	Sigma-Aldrich	C0378
DreamTaq DNA Polymerase	Thermo Fisher Scientific	EP0702
Deoxynucleotide (dNTP) Solution Mix	New England Biolabs	N0447S
96-well thermal cycler (with heated lid)	general lab supplier
150 mm plates	general lab supplier
100 mm plates	general lab supplier
Glycerol	Sigma-Aldrich	G5516
BssHII	New England Biolabs	R0199L
NheI	New England Biolabs	R0131L
QIAprep Spin Miniprep Kit	Qiagen	27104	or equivalent
M13KO7 Helper Phage	GE Healthcare Life Sciences	27-1524-01
Kanamycin sulfate from Streptomyces kanamyceticus	Sigma-Aldrich	K1377
Polyethylene glycol (PEG)	Sigma-Aldrich	P5413
Sodium Cloride (NaCl)	Sigma-Aldrich	S3014
PBS	general lab supplier
Dynabeads Protein G for Immunoprecipitation	Thermo Fisher Scientific	10003D	or equivalent
MagnaRack Magnetic Separation Rack	Thermo Fisher Scientific	CS15000	or equivalent
Tween 20	Sigma-Aldrich	P1379
Nonfat dried milk powder	EuroClone	EMR180500
KAPA HiFi HotStart ReadyMix	Kapa Biosystems, Fisher Scientific	7958935001
AMPure XP beads	Agencourt, Beckman Coulter	A63881
Nextera XT dual Index Primers	Illumina	FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004
MiSeq or Hiseq2500	Illumina
Spectrophotomer	Nanodrop
Agilent Bioanalyzer or TapeStation	Agilent
Forward PCR primer	general lab supplier		5’ TACCTATTGCCTACGGCAGCCGCTGGATTGTTATTACTC 3’
Reverse PCR primer	general lab supplier		5’ TGGTGATGGTGAGTACTATCCAGGCCCAGCAGTGGGTTTG 3’
Forward primer for NGS	general lab supplier		5’ TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAGCAAGCGGCGCGCATGC 3’;
Reverse primer for NGS	general lab supplier		5’ GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGGATTGGTTTGCCGCTAGC 3’;

Riferimenti

Loman, N. J., Pallen, M. J. Twenty years of bacterial genome sequencing. Nat Rev Microbiol. 13 (12), 787-794 (2015).
Jones, C. E., Brown, A. L., Baumann, U. Estimating the annotation error rate of curated GO database sequence annotations. BMC Bioinformatics. 8 (1), 170 (2007).
Andorf, C., Dobbs, D., Honavar, V. Exploring inconsistencies in genome-wide protein function annotations: a machine learning approach. BMC Bioinformatics. 8 (1), 284 (2007).
Wong, W. -. C., Maurer-Stroh, S., Eisenhaber, F. More Than 1,001 Problems with Protein Domain Databases: Transmembrane Regions, Signal Peptides and the Issue of Sequence Homology. PLoS Comput Biol. 6 (7), e1000867 (2010).
Bioinformatics, B., et al. Identification and correction of abnormal, incomplete and mispredicted proteins in public databases. BMC Bioinformatics. 9 (9), (2008).
Phizicky, E., Bastiaens, P. I. H., Zhu, H., Snyder, M., Fields, S. Protein analysis on a proteomic scale. Nature. 422 (6928), 208-215 (2003).
DiDonato, M., Deacon, A. M., Klock, H. E., McMullan, D., Lesley, S. A. A scaleable and integrated crystallization pipeline applied to mining the Thermotoga maritima proteome. J Struct Funct Genomics. 5 (1-2), 133-146 (2004).
Nordlund, P., et al. Protein production and purification. Nat Methods. 5 (2), 135-146 (2008).
Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
Di Niro, R., et al. Rapid interactome profiling by massive sequencing. Nucleic Acids Res. 38 (9), e110 (2010).
Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71 (Pt 11), 2227-2235 (2015).
D’Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
D’Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).
Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2009).
Heger, A., Holm, L. Exhaustive enumeration of protein domain families. J Mol Biol. 328 (3), 749-767 (2003).
Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
Faix, P. H., Burg, M. A., Gonzales, M., Ravey, E. P., Baird, A., Larocca, D. Phage display of cDNA libraries: Enrichment of cDNA expression using open reading frame selection. Biotechniques. 36 (6), 1018-1029 (2004).
Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
Collins, M. O., Choudhary, J. S. Mapping multiprotein complexes by affinity purification and mass spectrometry. Curr Opin Biotechnol. 19 (4), 324-330 (2008).
Suter, B., Kittanakom, S., Stagljar, I. Two-hybrid technologies in proteomics research. Curr Opin Biotechnol. 19 (4), 316-323 (2008).
Nakai, Y., Nomura, Y., Sato, T., Shiratsuchi, A., Nakanishi, Y. Isolation of a Drosophila gene coding for a protein containing a novel phosphatidylserine-binding motif. J Biochem. 137 (5), 593-599 (2005).
Deng, S. J., et al. Selection of antibody single-chain variable fragments with improved carbohydrate binding by phage display. J Biol Chem. 269 (13), 9533-9538 (1994).
Danner, S., Belasco, J. G. T7 phage display: A novel genetic selection system for cloning RNA-binding proteins from cDNA libraries. Proc Natl Acad Sci. 98 (23), 12954-12959 (2001).
Gargir, A., Ofek, I., Meron-Sudai, S., Tanamy, M. G., Kabouridis, P. S., Nissim, A. Single chain antibodies specific for fatty acids derived from a semi-synthetic phage display library. Biochim Biophys Acta – Gen Subj. 1569 (1-3), 167-173 (2002).
Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
Ausubel, F. M., et al. Current Protocols in Molecular Biology. Mol Biol. 1 (2), 146 (2003).
Sblattero, D., Bradbury, A. Exploiting recombination in single bacteria to make large phage antibody libraries. Nat Biotechnol. 18, 75-80 (2000).
Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
Quinlan, A. R. BEDTools: The Swiss-Army tool for genome feature analysis. Curr Protoc Bioinforma. , (2014).
Skinner, M. E., Uzilov, A. V., Stein, L. D., Mungall, C. J., Holmes, I. H. JBrowse: A next-generation genome browser. Genome Res. 19 (9), 1630-1638 (2009).
Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71, 2227-2235 (2015).
D’Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
Di Niro, R., et al. Characterizing monoclonal antibody epitopes by filtered gene fragment phage display. Biochem J. 388 (Pt 3), 889-894 (2005).
D’Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citazione di questo articolo

Soluri, M. F., Puccio, S., Caredda, G., Grillo, G., Licciulli, V. F., Consiglio, A., Edomi, P., Santoro, C., Sblattero, D., Peano, C. Interactome-Seq: A Protocol for Domainome Library Construction, Validation and Selection by Phage Display and Next Generation Sequencing. J. Vis. Exp. (140), e56981, doi:10.3791/56981 (2018).

Interactome-Seq: Протокол для строительства Domainome Библиотека, проверки и отбора Фаговые отображения и следующего поколения последовательности

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgazioni

Acknowledgements

Materials

Riferimenti

Tags

Play Video

Citazione di questo articolo

View Video

Interactome-Seq: Протокол для строительства Domainome Библиотека, проверки и отбора Фаговые отображения и следующего поколения последовательности

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgazioni

Acknowledgements

Materials

Riferimenti

Tags

Play Video

Citazione di questo articolo

View Video

✖

To prove you're not a robot, please enter the text in the image below