Мы представляем протокол для функциональной оценки комплексных библиотек мутагенеза насыщения Одноузельная белков с использованием высокой пропускной последовательности. Важно отметить, что этот подход использует ортогональные пары праймеров мультиплекс библиотека строительства и последовательности. Представитель результаты с использованием TEM-1 бета-лактамазу, выбранный при клинически значимой дозы ампициллина предоставляются.
Site-directed mutagenesis has long been used as a method to interrogate protein structure, function and evolution. Recent advances in massively-parallel sequencing technology have opened up the possibility of assessing the functional or fitness effects of large numbers of mutations simultaneously. Here, we present a protocol for experimentally determining the effects of all possible single amino acid mutations in a protein of interest utilizing high-throughput sequencing technology, using the 263 amino acid antibiotic resistance enzyme TEM-1 β-lactamase as an example. In this approach, a whole-protein saturation mutagenesis library is constructed by site-directed mutagenic PCR, randomizing each position individually to all possible amino acids. The library is then transformed into bacteria, and selected for the ability to confer resistance to β-lactam antibiotics. The fitness effect of each mutation is then determined by deep sequencing of the library before and after selection. Importantly, this protocol introduces methods which maximize sequencing read depth and permit the simultaneous selection of the entire mutation library, by mixing adjacent positions into groups of length accommodated by high-throughput sequencing read length and utilizing orthogonal primers to barcode each group. Representative results using this protocol are provided by assessing the fitness effects of all single amino acid mutations in TEM-1 at a clinically relevant dosage of ampicillin. The method should be easily extendable to other proteins for which a high-throughput selection assay is in place.
Мутагенеза уже давно используется в лаборатории для изучения свойств биологических систем и их эволюции, а также для создания мутантных белков или организмов с улучшенными или новыми функциями. В то время как ранние подходы опирались на методы , которые производят случайные мутации в организмах, появление технологии рекомбинантных ДНК позволило исследователям ввести выберите изменения ДНК в сайт-специфической манере, то есть., Сайт-направленный мутагенез 1,2. С учетом современных методов, как правило , с использованием мутагенных олигонуклеотидов в полимеразной цепной реакции (ПЦР), он относительно легкий , чтобы создавать и оценивать небольшое число мутаций (например., Точечные мутации) в данном гене 3,4. Это гораздо сложнее, однако, когда цель подходы, например, создание и оценка всех возможных одноузельных (или более высокого порядка) мутации.
В то время как многое узнали из ранних исследований, пытающихся оценить большое количество мutations в генах, методы , используемые часто трудоемкий, например , требующей оценки каждой мутации независимо друг от друга с помощью нонсенс – супрессоры штаммы 5-7, или были ограничены в количественном способности из – за низкой глубины секвенирование Sanger секвенирования 8. Методы , используемые в этих исследованиях , были в значительной степени вытеснен методами с использованием высокой пропускной способностью технологии секвенирования 9-12. Эти концептуально простые подходы влекут за собой создание библиотеки , содержащей большое количество мутаций, подвергая библиотеку на экран или выбора для функции, а затем глубокого секвенирования (то есть., По порядку> 10 6 секвенирования читает) библиотека , полученные до и после выбора. Таким образом, фенотипические или фитнес эффекты большого количества мутаций, представлен как изменение частоты популяции каждого мутанта, можно оценивать одновременно и более количественно.
Ранее мы ввели Simp(т. е, цельного белка мутагенеза насыщения библиотек) ле подход к оценке библиотек всех возможных мутаций отдельных аминокислот в белках, применимый к генам с длиной более , чем последовательности чтения длину 11,13: Во- первых, каждая позиция аминокислота представляет собой рандомизированное сайт-направленного мутагенных PCR. В ходе этого процесса ген разделен на группы, состоящие из прилежащих позиций с общей длиной размещены путем секвенирования платформы. Мутагенные ПЦР-продукты для каждой группы затем объединяются, и каждая группа независимо друг от друга подвергают селекции и высокой пропускной последовательности. Поддерживая соответствие между расположением мутаций в последовательности и длины последовательности чтения, этот подход имеет преимущество максимизации глубины секвенирования: в то время как можно было бы просто последовательность таких библиотек в коротких окнах без разделения на группы (например, с помощью стандартного дробовика. секвенирование подход), наиболее чтения, полученные бы дикого типа и, следовательно, мajority секвенирования пропускной способности неиспользуемого (например, для целого белка мутагенеза насыщения библиотеки белка кислоты 500 аминокислоты секвенировали в 100 аминокислот (300 пар оснований ) окон, при минимальном 80% читает будет последовательность дикого типа).
Здесь протокол представлен , который использует высокую пропускную способность секвенирования для функциональной оценки целого белка библиотек мутагенеза насыщения, с использованием вышеуказанного подхода (описанной на рисунке 1). Важно отметить, что мы вводим использование ортогональных праймеров в библиотеке процесса клонирования для штрих-кода каждой группы последовательности, которая позволяет им быть мультиплексированы в одну библиотеку, подвергаясь одновременно скрининга или отбора, а затем демультиплексируется для глубокого секвенирования. Так как группы последовательности не подвергаются отбору независимо друг от друга, это снижает нагрузку и гарантирует, что каждая мутация испытывает тот же уровень отбора. ТЕМ-1 β-лактамазы, фермента, который придает устойчивость на высоком уровне дляβ-лактамные антибиотики (например, ампициллин.) в бактерии используют в качестве модельной системы 14-16. Протокол описан для оценки в целом белка насыщения мутагенеза библиотеки TEM-1 в Е. палочка при отборе на приближенном уровне сыворотки для клинической дозы ампициллин (50 мкг / мл) 17,18.
Здесь протокол описан для проведения функциональной оценки целого белка библиотек мутагенеза насыщения, используя высокую пропускную способность технологии секвенирования. Важным аспектом способа является использование ортогональных праймеров во время процесса клонирования. Есл?…
The authors have nothing to disclose.
R.R. acknowledges support from the National Institutes of Health (RO1EY018720-05), the Robert A. Welch Foundation (I-1366), and the Green Center for Systems Biology.
Typtone | Research Products Intl. Corp. | T60060-1000.0 | |
Yeast extract | Research Products Intl. Corp. | Y20020-500.0 | |
Sodium chloride | Fisher Scientific | BP358-212 | |
Potassium chloride | Sigma-Aldrich | P9333-500G | |
Magnesium sulfate | Sigma-Aldrich | M7506-500G | |
Agar | Fisher Scientific | BP1423-500 | |
Tetracycline hydrochloride | Sigma-Aldrich | T7660-5G | |
petri plates | Corning | 351029 | |
MATLAB | Mathworks | http://www.mathworks.com/products/matlab/ | |
Oligonucleotide primers | Integrated DNA Technologies | https://www.idtdna.com/pages/products/dna-rna/custom-dna-oligos | 25 nmol scale, standard desalting |
pBR322_AvrII | available upon request | pBR322 plasmid modified to contain AvrII restriction site downstream of the TEM-1 gene | |
pBR322_OP1 – pBR322_OP5 | available upon request | five modified pBR322 plasmids each containing a pair of orthogonal priming sites | |
Q5 high-fidelity DNA polymerase | New England Biolabs | M0491L | includes 5X PCR buffer and PCR additive (GC enhancer) |
15 mL conical tube | Corning | 430025 | |
Multichannel pipettes (Eppendorf ResearchPlus) | Eppendorf | ||
PCR plate, 96 well | Fisher Scientific | 14230232 | |
96 well plate seal | Excel Scientific | F-96-100 | |
Veriti 96-well thermal cycler | Applied Biosystems | 4375786 | |
6X gel loading dye | New England Biolabs | B7024S | |
Agarose | Research Products Intl. Corp. | 20090-500.0 | |
Ethidium bromide | Bio-Rad | 161-0433 | |
UV transilluminator (FOTO/Analyst ImageTech) | Fotodyne Inc. | http://www.fotodyne.com/content/ImageTech_gel_documentation | |
EB buffer | Qiagen | 19086 | |
96-well black-walled, clear bottom assay plates | Corning | 3651 | |
Lambda phage DNA | New England Biolabs | N3011S | |
PicoGreen dsDNA reagent | Invitrogen | P7581 | dsDNA quantitation reagent, used in protocol step 2.2.4 |
Victor 3V microplate reader | PerkinElmer | ||
DNA purification kit | Zymo Research | D4003 | |
Microcentrifuge tubes | Corning | 3621 | |
Long-wavelength UV illuminator | Fisher Scientific | FBUVLS-80 | |
Agarose gel DNA extraction buffer | Zymo Research | D4001-1-100 | |
AatII | New England Biolabs | R0117S | |
AvrII | New England Biolabs | R0174L | |
T4 DNA ligase | New England Biolabs | M0202S | |
EVB100 electrocompetent E. coli | Avidity | EVB100 | |
Electroporator (E. coli Pulser) | Bio-Rad | 1652102 | |
Electroporation cuvettes | Bio-Rad | 165-2089 | |
Spectrophotometer (Ultrospec 3100 pro) | Amersham Biosciences | 80211237 | |
50 mL conical tubes | Corning | 430828 | |
Plasmid purification kit | Macherey-Nagel | 740588.25 | |
8 well PCR strip tubes | Axygen | 321-10-551 | |
Qubit dsDNA HS assay kit | Invitrogen | Q32854 | dsDNA quantitation reagent |
Qubit assay tubes | Invitrogen | Q32856 | |
Qubit fluorometer | Invitrogen | Q32866 | |
Ampicillin sodium salt | Akron Biotechnology | 50824296 | |
MiSeq reagent kit v2 (500 cycles) | Illumina | MS-102-2003 | |
MiSeq desktop sequencer | Illumina | http://www.illumina.com/systems/miseq.html | alternatively, one could sequence on Illumina HiSeq platform |
FLASh software | John Hopkins University – open source | http://ccb.jhu.edu/software/FLASH/ | software to merge paired-end reads from next-generation sequencing data |
AatII_F | GATAATAATGGTTTCTTAGACGTCAGGTGGC | ||
AvrII_R | CTTCACCTAGGTCCTTTTAAATTAAAAATGAAG | ||
AvrII_F | CTTCATTTTTAATTTAAAAGGACCTAGGTGAAG | ||
AatII_OP1_R | ACCTGACGTCCGTATTTCAACTGTCCGGTCTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP2_R | ACCTGACGTCCGCTCACGGAGTGTACTAATTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP3_R | ACCTGACGTCGTACGTCTGAACTTGGGACTTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP4_R | ACCTGACGTCCCGTTCTCGATACCAAGTGATAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP5_R | ACCTGACGTCGTCCGTCGGAGTAACAATCTTAAGAAACCATTATTATCATGACATTAAC | ||
OP1_F | GACCGGACAGTTGAAATACG | ||
OP1_R | CGACGTACAGGACAATTTCC | ||
OP2_F | ATTAGTACACTCCGTGAGCG | ||
OP2_R | AGTATTAGGCGTCAAGGTCC | ||
OP3_F | AGTCCCAAGTTCAGACGTAC | ||
OP3_R | GAAAAGTCCCAATGAGTGCC | ||
OP4_F | TCACTTGGTATCGAGAACGG | ||
OP4_R | TATCACGGAAGGACTCAACG | ||
OP5_F | AGATTGTTACTCCGACGGAC | ||
OP5_R | TATAACAGGCTGCTGAGACC | ||
Group1_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNGCATTTTGCCTACCGGTTTTTGC | ||
Group1_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTCTTGCCCGGCGTCAAC | ||
Group2_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNGAACGTTTTCCAATGATGAGCAC | ||
Group2_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNGTCCTCCGATCGTTGTCAGAAG | ||
Group3_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNAGTAAGAGAATTATGCAGTGCTGCC | ||
Group3_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTCGCCAGTTAATAGTTTGCGC | ||
Group4_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNCCAAACGACGAGCGTGACAC | ||
Group4_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNGCAATGATACCGCGAGACCC | ||
Group5_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNCGGCTGGCTGGTTTATTGC | ||
Group5_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTATATGAGTAAACTTGGTCTGACAG | ||
501_F | AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGAC | ||
502_F | AATGATACGGCGACCACCGAGATCTACACATAGAGGCACACTCTTTCCCTACACGAC | ||
503_F | AATGATACGGCGACCACCGAGATCTACACCCTATCCTACACTCTTTCCCTACACGAC | ||
504_F | AATGATACGGCGACCACCGAGATCTACACGGCTCTGAACACTCTTTCCCTACACGAC | ||
505_F | AATGATACGGCGACCACCGAGATCTACACAGGCGAAGACACTCTTTCCCTACACGAC | ||
701_R | CAAGCAGAAGACGGCATACGAGATCGAGTAATGTGACTGGAGTTCAGACGTG | ||
702_R | CAAGCAGAAGACGGCATACGAGATTCTCCGGAGTGACTGGAGTTCAGACGTG |