Протоколы, описанные разрешить строительство, характеристика и выбор (против целевого выбора) из любого источника ДНК библиотеки «domainome». Это достигается путем исследования трубопровода, который сочетает в себе различные технологии: фага дисплей, складной репортером и следующего поколения последовательности с веб-инструмент для анализа данных.
Складной журналисты являются белки с легко идентифицировать фенотипы, например антибиотикам, складные и функции которого нарушается, когда сливается с плохо складывания белки или случайных открытом чтения фреймов. Мы разработали стратегию, где, используя ТЭМ-1 β-лактамаз (фермент, присвоении ампициллин сопротивления) в геномной масштабе, мы можем выбрать коллекции правильно сложенный протеин доменов из кодирования части ДНК любой intronless генома. Фрагменты белка, полученные на этот подход, так называемые «domainome», будет хорошо выражена и растворимые, что делает их пригодными для структурно функциональных исследований.
Клонирование и отображение «domainome» непосредственно в систему отображения фага, мы показали, что это можно выбрать конкретные белка домены с желаемой привязки свойств (например, другие белки или антитела), обеспечивая тем самым важным экспериментальной информации для идентификации генов аннотации или антигена.
Выявление наиболее обогащенного клонов в выбранной поликлональных населения может быть достиган с использованием Роман секвенирование нового поколения технологий (НГС). По этим причинам мы представляем глубокую последовательности анализа самой библиотеки и выбора мероприятий предоставлять полную информацию о разнообразии, изобилия и точное сопоставление каждого выбранного фрагмента. Протоколы, представленные здесь показать основные шаги для строительства библиотеки, характеристик и проверки.
Здесь мы описываем метод высокой пропускной способностью для строительства и выбор библиотек складывается и растворимого белка доменов из любого источника, генной/геномной начиная. Этот подход сочетает в себе три различные технологии: фага дисплей, использование складной репортером и следующего поколения последовательности (НГС) с конкретным веб-инструмент для анализа данных. Методы могут использоваться во многих различных контекстах белка на основе исследований, для идентификации и аннотации новых доменов белков/белков, характеристика структурных и функциональных свойств известных белков, а также определение белок взаимодействие сети.
Многие открытые вопросы по-прежнему присутствуют в исследованиях на основе белков и разработки методов для оптимального белок производства является важной потребность в нескольких областях расследования. Например несмотря на наличие тысяч геномов прокариот и эукариот1, соответствующий карта относительной протеомов аннотацию прямого закодированного белков и пептидов отсутствует до сих пор подавляющее большинство организмов. Каталог полный протеомов становится сложной цели, требующие огромных усилий в плане времени и ресурсов. Золотой стандарт для экспериментальных заметки остается клонирования все открытые рамки считывания (ORFs) генома, строительство так называемой «ORFeome». Обычно функции гена назначается на основании гомологии связанных генов известных деятельности, но этот подход является недостаточно точной из-за наличия многих неправильные аннотации в справочных баз данных2,3,4, 5. Кроме того, даже для белков, которые были выявлены и комментариями, дополнительные исследования необходимы для достижения характеристика с точки зрения обилия, выражений шаблонов в разных контекстах, включая структурные и функциональные свойства, а также взаимодействие сетей.
Кроме того поскольку белки состоят из разных доменов, каждый из них показаны специфические особенности и вклад в по-разному функций белков, изучение и точное определение этих доменов может позволить более полную картину, как на сингл гена и на уровне полного генома. Все необходимая информация делает исследования белков на широкой и сложной области.
В этой перспективе важный вклад могут предоставляться на беспристрастной и высок объём методы для производства белка. Однако успех таких подходов, рядом значительных инвестиций, необходимых, опирается на способность производить растворимый/стабильный белка конструкции. Это основные ограничения фактор, так как было подсчитано, что только около 30% белков может успешно выразил и производится на достаточных уровнях экспериментально полезным6,,78. Подход для преодоления этого ограничения основан на использовании случайно фрагментированных ДНК, чтобы произвести различных полипептидов, которые вместе обеспечивают перекрывающихся фрагментов представление отдельных генов. Только небольшой процент случайных фрагментов ДНК являются функциональные ORFs, хотя подавляющее большинство из них являются нефункциональные (благодаря наличию стоп-кодонов внутри их последовательностей) или кодировать для неестественное (ORF в кадре оригинал) полипептиды с биологического смысла.
Для решения всех этих вопросов, наша группа разработала высок объём белка выражение и взаимодействие анализ платформу, которая может быть использована на геномной масштаб9,10,и11,12. Эта платформа включает следующие методики: 1) метод для выбора коллекции правильно сложенный протеин доменов из кодирования части ДНК от любого организма; 2 технология отображения фага для выбора партнеров взаимодействия; 3) NGS полностью характеризовать весь interactome стадии изучения и выявления клонов интерес; и 4) веб-инструмент для анализа данных для пользователей без каких-либо биоинформатики или навыков программирования для выполнения анализа Interactome-Seq в простым и удобным способом.
Использование этой платформы обеспечивает важные преимущества по сравнению альтернативных стратегий расследования; Прежде всего этот метод полностью беспристрастной, высокой пропускной способности и модульные для исследования, начиная от одного гена до всего генома. Первый шаг конвейера является создание библиотеки от случайно фрагментированных ДНК исследуемых, который характеризуется затем глубоко NGS. Эта библиотека генерируется с использованием вектора инженерии где генов/фрагменты интерес клонируются между последовательность сигнала для секреции белков в Периплазматическое пространство (т.е., лидер Sec) и гена β-лактамаз ТЭМ1. Синтез белка будет наделять ампициллин сопротивления и способность выжить под давлением ампициллин, только в том случае, если клонированные фрагменты в кадр с этими элементами и результате синтез белка является правильно сложенные10,13 ,14. Все клоны спасли после антибиотика выбора, так называемые «фильтруют клонов», ORFs, подавляющее большинство из них (более 80%) и являются производными от реальных генов9. Кроме того сила этой стратегии заключается в выводах, что все клоны фильтрации ORF кодирования для правильно сложить/растворимые белки/домены15. Как много клонов, присутствует в библиотеке и картирования в том же регионе или домена, имеют разные начальные и конечные точки, это позволяет беспристрастной, единый этапа идентификации минимальная фрагментов, которые могут привести к растворимых продуктов.
Дальнейшее совершенствование технологии предоставляется с помощью NGS характеризуют библиотеки. Сочетание этой платформы и конкретных веб-инструмент для анализа данных дает важные объективную информацию на точное нуклеотидных последовательностей и расположение выбранных ORFs на ссылку ДНК исследуемых без необходимости дальнейших обширных анализов или экспериментальные работы.
Domainome библиотеки могут передаваться в контекст выделения и используется в качестве универсального инструмента для выполнения функциональных исследований. Высок объём белка выражение и взаимодействие анализ платформы что мы интегрированы и что мы называли Interactome-Seq использует преимущества технологий отображения Фаговые путем передачи фильтрованного ORF в phagemid вектор и создания ФАГ ORF Библиотека. После повторного клонирован в контекст отображения фага, белка, домены отображаются на поверхности частиц M13; Таким образом domainome библиотек можно непосредственно выбрать для фрагментов гена кодирования домены с конкретными ферментативную деятельность или привязки свойств, позволяя interactome сети профилирования. Этот подход был первоначально описан Zacchi соавт. 16 и позднее используется в нескольких других контексте13,17,18.
По сравнению с другими технологиями, используется для изучения взаимодействия протеин протеина (включая дрожжей два гибридной системы и масс-спектрометрии19,20), одно из главных преимуществ является усиление связывание партнера, что происходит во время ФАГ Отображение нескольких раундов выделения. Это увеличивает выбор чувствительности, таким образом позволяя выявление низкой обильные связывания белков доменов присутствует в библиотеке. Эффективность отбора выступал с ORF-фильтрации библиотеки далее увеличивается из-за отсутствия нефункциональные клонов. Наконец технология позволяет выбор выполняться против белков и не протеинового приманки21,,2223,24,25.
Фаговые выборки с использованием библиотеки domainome ФАГ может производиться с использованием антител, исходя из сыворотки больных с различных патологических состояний, например аутоиммунных заболеваний13, рака или инфекции заболеваний как приманку. Этот подход используется для получения так называемого «антитело подпись» болезни под исследования, позволяющие массово идентифицировать и охарактеризовать антигены/epitopes конкретно признаны больных антител в то же время. По сравнению с другими методами использование фага дисплей позволяет идентификации как линейной, так и конформационные антигенных эпитопам. Выявление конкретных подписи потенциально может иметь важное значение для понимания патогенеза, новый дизайн вакцины, выявление новых терапевтических целей и развития новых и конкретных инструментов, диагностические и прогностические. Кроме того когда исследование сосредоточено на инфекционные заболевания, основным преимуществом является, что открытие иммуногенных белков зависит от выращивания патогена.
Наш подход подтверждает, что складной журналистам может использоваться в геномной масштабе для выбора «domainome»: коллекция правильно сложенные, хорошо выраженной, растворимые белки доменов от кодирования части ДНК или cDNA от любого организма. Когда изолированные фрагменты белка полезны для многих целей, предоставляя основные экспериментальной информации для гена аннотации, а что касается структурных исследований, антитела epitope сопоставления, выявления антигена, и т.д. Полнота высок объём данных, предоставленных NGS позволяет анализ сложных образцов, таких как Фаговые отображения библиотек и имеет потенциал, чтобы обойти традиционной трудоемкой собирание и тестирование отдельных Фаговые спасли клонов.
В то же время благодаря функции отфильтрованных библиотеки и крайняя чувствительность и мощности NGS анализа можно определить ответственность каждого взаимодействия непосредственно на начальном экране, без необходимости создания домена протеина дополнительные библиотеки для каждого неизбежно белка. NGS позволяет получить всеобъемлющее определение всей domainome любого генно/геномной начиная источника и данных анализа веб-инструмент позволяет получение весьма специфические характеристики с качественной и количественной точки зрения interactome белки доменов.
Создание высокого качества весьма разнообразны ORFs отфильтрованных библиотеки является первым важным шагом в рамках всей процедуры так, как оно повлияет на все последующие шаги трубопровода.
Важной особенностью выгодно нашего метода является, что любой источник (intronless) …
The authors have nothing to disclose.
Эта работа была поддержана грант от министерства образования Италии и университета (2010P3S8BR_002 КТ).
Sonopuls ultrasonic homogenizer | Bandelin | HD2070 | or equivalent |
GeneRuler 100 bp Plus DNA Ladder | Thermo Scientific | SM0321 | or equivalent |
GeneRuler 1 kb DNA Ladder | Thermo Fisher Scientific | SM0311 | or equivalent |
Molecular Biology Agarose | BioRad | 161-3102 | or equivalent |
Green Gel Plus | Fisher Molecular Biology | FS-GEL01 | or equivalent |
6x DNA Loading Dye | Thermo Fisher Scientific | R0611 | or equivalent |
QIAquick Gel Extraction Kit | Qiagen | 28704 | or equivalent |
Quick Blunting Kit | New England Biolabs | E1201S | |
NanoDrop 2000 UV-Vis Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
High-Capacity cDNA Reverse Transcription Kit | Thermo Fisher Scientific | 4368813 | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | or equivalent |
QIAquick PCR purification Kit | Qiagen | 28104 | or equivalent |
EcoRV | New England Biolabs | R0195L | |
Antarctic Phosphatase | New England Biolabs | M0289S | |
T4 DNA Ligase | New England Biolabs | M0202T | |
Sodium Acetate 3M pH5.2 | general lab supplier | ||
Ethanol for molecular biology | Sigma-Aldrich | E7023 | or equivalent |
DH5aF' bacteria cells | Thermo Fisher Scientific | ||
0,2 ml tubes | general lab supplier | ||
1,5 ml tubes | general lab supplier | ||
0,1 cm electroporation cuvettes | Biosigma | 4905020 | |
Electroporator 2510 | Eppendorf | ||
2x YT medium | Sigma-Aldrich | Y1003 | |
Ampicillin sodium salt | Sigma-Aldrich | A9518 | |
Chloramphenicol | Sigma-Aldrich | C0378 | |
DreamTaq DNA Polymerase | Thermo Fisher Scientific | EP0702 | |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447S | |
96-well thermal cycler (with heated lid) | general lab supplier | ||
150 mm plates | general lab supplier | ||
100 mm plates | general lab supplier | ||
Glycerol | Sigma-Aldrich | G5516 | |
BssHII | New England Biolabs | R0199L | |
NheI | New England Biolabs | R0131L | |
QIAprep Spin Miniprep Kit | Qiagen | 27104 | or equivalent |
M13KO7 Helper Phage | GE Healthcare Life Sciences | 27-1524-01 | |
Kanamycin sulfate from Streptomyces kanamyceticus | Sigma-Aldrich | K1377 | |
Polyethylene glycol (PEG) | Sigma-Aldrich | P5413 | |
Sodium Cloride (NaCl) | Sigma-Aldrich | S3014 | |
PBS | general lab supplier | ||
Dynabeads Protein G for Immunoprecipitation | Thermo Fisher Scientific | 10003D | or equivalent |
MagnaRack Magnetic Separation Rack | Thermo Fisher Scientific | CS15000 | or equivalent |
Tween 20 | Sigma-Aldrich | P1379 | |
Nonfat dried milk powder | EuroClone | EMR180500 | |
KAPA HiFi HotStart ReadyMix | Kapa Biosystems, Fisher Scientific | 7958935001 | |
AMPure XP beads | Agencourt, Beckman Coulter | A63881 | |
Nextera XT dual Index Primers | Illumina | FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004 | |
MiSeq or Hiseq2500 | Illumina | ||
Spectrophotomer | Nanodrop | ||
Agilent Bioanalyzer or TapeStation | Agilent | ||
Forward PCR primer | general lab supplier | 5’ TACCTATTGCCTACGGCAGCCGCTGGATTGTTATTACTC 3’ | |
Reverse PCR primer | general lab supplier | 5’ TGGTGATGGTGAGTACTATCCAGGCCCAGCAGTGGGTTTG 3’ | |
Forward primer for NGS | general lab supplier | 5’ TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAGCAAGCGGCGCGCATGC 3’; | |
Reverse primer for NGS | general lab supplier | 5’ GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGGATTGGTTTGCCGCTAGC 3’; |