我々は、ハイスループットシーケンシングを利用したタンパク質の包括的な単一部位飽和突然変異誘発ライブラリの機能評価のためのプロトコルを提示します。重要なことに、このアプローチは、ライブラリー構築および配列決定を多重化するために直交するプライマー対を使用しています。アンピシリンの臨床的に関連する用量で選択されたTEM-1βラクタマーゼを使用して、代表的な結果を提供しています。
Site-directed mutagenesis has long been used as a method to interrogate protein structure, function and evolution. Recent advances in massively-parallel sequencing technology have opened up the possibility of assessing the functional or fitness effects of large numbers of mutations simultaneously. Here, we present a protocol for experimentally determining the effects of all possible single amino acid mutations in a protein of interest utilizing high-throughput sequencing technology, using the 263 amino acid antibiotic resistance enzyme TEM-1 β-lactamase as an example. In this approach, a whole-protein saturation mutagenesis library is constructed by site-directed mutagenic PCR, randomizing each position individually to all possible amino acids. The library is then transformed into bacteria, and selected for the ability to confer resistance to β-lactam antibiotics. The fitness effect of each mutation is then determined by deep sequencing of the library before and after selection. Importantly, this protocol introduces methods which maximize sequencing read depth and permit the simultaneous selection of the entire mutation library, by mixing adjacent positions into groups of length accommodated by high-throughput sequencing read length and utilizing orthogonal primers to barcode each group. Representative results using this protocol are provided by assessing the fitness effects of all single amino acid mutations in TEM-1 at a clinically relevant dosage of ampicillin. The method should be easily extendable to other proteins for which a high-throughput selection assay is in place.
突然変異誘発は、長い生物学的システムとそれらの進化の特性を研究するために実験室で使用されており、強化された又は新規の機能を有する変異タンパク質または生物を生成します。初期のアプローチは、生物においてランダム突然変異を生成する方法に頼っているが、組換えDNA技術の出現は、部位特異的にDNAに選択の変更、 すなわち 、部位特異的突然変異誘発1,2を導入する研究者を可能にしました。現在の技術は、典型的には、ポリメラーゼ連鎖反応(PCR)に変異原性オリゴヌクレオチドを用いて、所与の遺伝子3,4の突然変異の少数( 例えば 、点突然変異)を作成し、評価するのが比較的容易です。時目標アプローチは、すべての可能なシングルサイト(または上位)の変異、例えば、作成及び評価、ただしはるかに困難です。
多くはMの多数を評価しようとする初期の研究から学習してきたが遺伝子におけるutationsは、使用される技術は、独立して、ナンセンスサプレッサー株を5-7を使用して、各変異の評価を必要とする例えば、しばしば面倒だった、または起因サンガーシーケンシング8の低いシーケンシング深さへの定量的な能力に制限されていました。これらの研究で使用される技術は、主にハイスループットシークエンシング技術9-12を利用する方法に取って代わられています。これらの多数の突然変異を含むライブラリーを作成伴う概念的に単純なアプローチ、機能のための画面や選択にライブラリを施し、その後、ディープシークエンシング( すなわち 、> 10 6シーケンシング読み取りのオーダー)の前に得られたライブラリーと選択後。このようにして、多数の突然変異の表現型または適応度の効果は、各変異体の集団頻度の変化として表され、同時に、より定量的に評価することができます。
我々は以前あほを導入しましたタンパク質中のすべての可能な単一のアミノ酸変異のライブラリーを評価するためのル・アプローチ( すなわち 、全タンパク質飽和突然変異誘発ライブラリ。)、より長いシーケンシング読み取り長11,13よりも長さの遺伝子に適用:まず、各アミノ酸位置がランダム化されます部位指向性変異原性PCRによる。このプロセスの間に、遺伝子は、配列決定プラットフォームに収容全長と連続する位置からなるグループに分割されます。各グループの突然変異誘発PCR産物はその後組み合わされ、各グループは、独立して選択し、ハイスループット配列決定に供されます。シーケンスおよび配列の読み取り長の変異の位置との対応関係を維持することによって、このアプローチは、最大化、配列決定の深さの利点を有する:1は、単に基( 例えば 、標準的な散弾銃によってに分割することなく、短いウィンドウでこのようなライブラリーを配列決定することができながら、配列決定アプローチ)は、ほとんどの野生型および従ってMなり得る読み取りシークエンシングのスループットのajorityは( 例えば、100個のアミノ酸(300 bp)の窓に配列決定さ500アミノ酸のタンパク質の全タンパク質飽和突然変異誘発ライブラリーのために、読み込みの最低80%は野生型配列となります)無駄にしました。
ここでは、プロトコルは、( 図1に概説)上記のアプローチを用いて、全タンパク質の飽和突然変異誘発ライブラリーの機能的な評価のためのハイスループットシークエンシングを利用する提示されています。重要なことは、我々は、スクリーニングまたは選択に同時に受ける彼らは1ライブラリに多重化することを可能にする、各シーケンスグループを、バーコード、ライブラリクローニング処理に直交するプライマーの使用法を紹介し、その後深いシーケンシングのために逆多重化。系列グループは、独立選択に供されていないので、これは、作業負荷を軽減し、各変異は選択の同じレベルを経験することを保証します。 TEM-1βラクタマーゼ、高レベルの耐性を付与する酵素βラクタム抗生物質( 例えば 、アンピシリン)細菌では、モデル系14〜16として使用されます。プロトコルは、 大腸菌におけるTEM-1の全タンパク質の飽和突然変異誘発ライブラリーの評価のために記載されていますアンピシリンの臨床用量(50μg/ mlの)17,18のおおよその血清レベルでの選択の下で大腸菌 。
ここで、プロトコルは、ハイスループットシークエンシング技術を使用して、全タンパク質の飽和突然変異誘発ライブラリーの機能的評価を行うために記載されています。この方法の重要な局面は、クローニングプロセスの間に直交プライマーの使用です。簡潔には、各アミノ酸位置は、突然変異誘発PCRによってランダム化され、そして合わせた配列の長さ、ハイスループットシークエンシ?…
The authors have nothing to disclose.
R.R. acknowledges support from the National Institutes of Health (RO1EY018720-05), the Robert A. Welch Foundation (I-1366), and the Green Center for Systems Biology.
Typtone | Research Products Intl. Corp. | T60060-1000.0 | |
Yeast extract | Research Products Intl. Corp. | Y20020-500.0 | |
Sodium chloride | Fisher Scientific | BP358-212 | |
Potassium chloride | Sigma-Aldrich | P9333-500G | |
Magnesium sulfate | Sigma-Aldrich | M7506-500G | |
Agar | Fisher Scientific | BP1423-500 | |
Tetracycline hydrochloride | Sigma-Aldrich | T7660-5G | |
petri plates | Corning | 351029 | |
MATLAB | Mathworks | http://www.mathworks.com/products/matlab/ | |
Oligonucleotide primers | Integrated DNA Technologies | https://www.idtdna.com/pages/products/dna-rna/custom-dna-oligos | 25 nmol scale, standard desalting |
pBR322_AvrII | available upon request | pBR322 plasmid modified to contain AvrII restriction site downstream of the TEM-1 gene | |
pBR322_OP1 – pBR322_OP5 | available upon request | five modified pBR322 plasmids each containing a pair of orthogonal priming sites | |
Q5 high-fidelity DNA polymerase | New England Biolabs | M0491L | includes 5X PCR buffer and PCR additive (GC enhancer) |
15 mL conical tube | Corning | 430025 | |
Multichannel pipettes (Eppendorf ResearchPlus) | Eppendorf | ||
PCR plate, 96 well | Fisher Scientific | 14230232 | |
96 well plate seal | Excel Scientific | F-96-100 | |
Veriti 96-well thermal cycler | Applied Biosystems | 4375786 | |
6X gel loading dye | New England Biolabs | B7024S | |
Agarose | Research Products Intl. Corp. | 20090-500.0 | |
Ethidium bromide | Bio-Rad | 161-0433 | |
UV transilluminator (FOTO/Analyst ImageTech) | Fotodyne Inc. | http://www.fotodyne.com/content/ImageTech_gel_documentation | |
EB buffer | Qiagen | 19086 | |
96-well black-walled, clear bottom assay plates | Corning | 3651 | |
Lambda phage DNA | New England Biolabs | N3011S | |
PicoGreen dsDNA reagent | Invitrogen | P7581 | dsDNA quantitation reagent, used in protocol step 2.2.4 |
Victor 3V microplate reader | PerkinElmer | ||
DNA purification kit | Zymo Research | D4003 | |
Microcentrifuge tubes | Corning | 3621 | |
Long-wavelength UV illuminator | Fisher Scientific | FBUVLS-80 | |
Agarose gel DNA extraction buffer | Zymo Research | D4001-1-100 | |
AatII | New England Biolabs | R0117S | |
AvrII | New England Biolabs | R0174L | |
T4 DNA ligase | New England Biolabs | M0202S | |
EVB100 electrocompetent E. coli | Avidity | EVB100 | |
Electroporator (E. coli Pulser) | Bio-Rad | 1652102 | |
Electroporation cuvettes | Bio-Rad | 165-2089 | |
Spectrophotometer (Ultrospec 3100 pro) | Amersham Biosciences | 80211237 | |
50 mL conical tubes | Corning | 430828 | |
Plasmid purification kit | Macherey-Nagel | 740588.25 | |
8 well PCR strip tubes | Axygen | 321-10-551 | |
Qubit dsDNA HS assay kit | Invitrogen | Q32854 | dsDNA quantitation reagent |
Qubit assay tubes | Invitrogen | Q32856 | |
Qubit fluorometer | Invitrogen | Q32866 | |
Ampicillin sodium salt | Akron Biotechnology | 50824296 | |
MiSeq reagent kit v2 (500 cycles) | Illumina | MS-102-2003 | |
MiSeq desktop sequencer | Illumina | http://www.illumina.com/systems/miseq.html | alternatively, one could sequence on Illumina HiSeq platform |
FLASh software | John Hopkins University – open source | http://ccb.jhu.edu/software/FLASH/ | software to merge paired-end reads from next-generation sequencing data |
AatII_F | GATAATAATGGTTTCTTAGACGTCAGGTGGC | ||
AvrII_R | CTTCACCTAGGTCCTTTTAAATTAAAAATGAAG | ||
AvrII_F | CTTCATTTTTAATTTAAAAGGACCTAGGTGAAG | ||
AatII_OP1_R | ACCTGACGTCCGTATTTCAACTGTCCGGTCTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP2_R | ACCTGACGTCCGCTCACGGAGTGTACTAATTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP3_R | ACCTGACGTCGTACGTCTGAACTTGGGACTTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP4_R | ACCTGACGTCCCGTTCTCGATACCAAGTGATAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP5_R | ACCTGACGTCGTCCGTCGGAGTAACAATCTTAAGAAACCATTATTATCATGACATTAAC | ||
OP1_F | GACCGGACAGTTGAAATACG | ||
OP1_R | CGACGTACAGGACAATTTCC | ||
OP2_F | ATTAGTACACTCCGTGAGCG | ||
OP2_R | AGTATTAGGCGTCAAGGTCC | ||
OP3_F | AGTCCCAAGTTCAGACGTAC | ||
OP3_R | GAAAAGTCCCAATGAGTGCC | ||
OP4_F | TCACTTGGTATCGAGAACGG | ||
OP4_R | TATCACGGAAGGACTCAACG | ||
OP5_F | AGATTGTTACTCCGACGGAC | ||
OP5_R | TATAACAGGCTGCTGAGACC | ||
Group1_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNGCATTTTGCCTACCGGTTTTTGC | ||
Group1_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTCTTGCCCGGCGTCAAC | ||
Group2_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNGAACGTTTTCCAATGATGAGCAC | ||
Group2_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNGTCCTCCGATCGTTGTCAGAAG | ||
Group3_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNAGTAAGAGAATTATGCAGTGCTGCC | ||
Group3_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTCGCCAGTTAATAGTTTGCGC | ||
Group4_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNCCAAACGACGAGCGTGACAC | ||
Group4_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNGCAATGATACCGCGAGACCC | ||
Group5_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNCGGCTGGCTGGTTTATTGC | ||
Group5_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTATATGAGTAAACTTGGTCTGACAG | ||
501_F | AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGAC | ||
502_F | AATGATACGGCGACCACCGAGATCTACACATAGAGGCACACTCTTTCCCTACACGAC | ||
503_F | AATGATACGGCGACCACCGAGATCTACACCCTATCCTACACTCTTTCCCTACACGAC | ||
504_F | AATGATACGGCGACCACCGAGATCTACACGGCTCTGAACACTCTTTCCCTACACGAC | ||
505_F | AATGATACGGCGACCACCGAGATCTACACAGGCGAAGACACTCTTTCCCTACACGAC | ||
701_R | CAAGCAGAAGACGGCATACGAGATCGAGTAATGTGACTGGAGTTCAGACGTG | ||
702_R | CAAGCAGAAGACGGCATACGAGATTCTCCGGAGTGACTGGAGTTCAGACGTG |