Wir stellen ein Protokoll für die funktionelle Bewertung umfassender single-site Sättigungsmutagenese Bibliotheken von Proteinen Hochdurchsatz-Sequenzierung verwendet. Wichtig ist, nutzt dieser Ansatz orthogonalen Primerpaare Bibliothek Konstruktion und Sequenzierung zu multiplexen. Repräsentative Ergebnisse unter Verwendung von TEM-1 β-Lactamase in klinisch relevanter Dosierung von Ampicillin ausgewählt werden bereitgestellt.
Site-directed mutagenesis has long been used as a method to interrogate protein structure, function and evolution. Recent advances in massively-parallel sequencing technology have opened up the possibility of assessing the functional or fitness effects of large numbers of mutations simultaneously. Here, we present a protocol for experimentally determining the effects of all possible single amino acid mutations in a protein of interest utilizing high-throughput sequencing technology, using the 263 amino acid antibiotic resistance enzyme TEM-1 β-lactamase as an example. In this approach, a whole-protein saturation mutagenesis library is constructed by site-directed mutagenic PCR, randomizing each position individually to all possible amino acids. The library is then transformed into bacteria, and selected for the ability to confer resistance to β-lactam antibiotics. The fitness effect of each mutation is then determined by deep sequencing of the library before and after selection. Importantly, this protocol introduces methods which maximize sequencing read depth and permit the simultaneous selection of the entire mutation library, by mixing adjacent positions into groups of length accommodated by high-throughput sequencing read length and utilizing orthogonal primers to barcode each group. Representative results using this protocol are provided by assessing the fitness effects of all single amino acid mutations in TEM-1 at a clinically relevant dosage of ampicillin. The method should be easily extendable to other proteins for which a high-throughput selection assay is in place.
Mutagenese wurde lange im Labor verwendet worden, um die Eigenschaften von biologischen Systemen und ihre Entwicklung zu studieren, und mutierte Proteine oder Organismen mit verbesserten oder neuen Funktionen zu erzeugen. Während die ersten Ansätze auf Methoden verlassen , die in Organismen zufällige Mutationen erzeugen, Forscher das Aufkommen der rekombinanten DNA – Technologie ermöglicht die Einführung wählen Änderungen an DNA in einer ortsspezifisch, dh., Ortsgerichtete Mutagenese 1,2. Mit den derzeitigen Techniken, typischerweise unter Verwendung von mutagenen Oligonukleotide in einer Polymerase – Kettenreaktion (PCR) ist es relativ leicht zu erzeugen und zu bewerten , eine kleine Anzahl von Mutationen (z. B. Punktmutationen) in einem gegebenen Gen 3,4. Es ist viel schwieriger, aber wenn das Ziel Ansätze, zum Beispiel die Erstellung und Bewertung aller möglichen Single-Site (oder höherer Ordnung) Mutationen.
Während ein Großteil wurde von frühen Studien gelernt Versuch, eine große Zahl von m zu beurteilenutations in Genen, die verwendeten Techniken waren oft mühsam, zum Beispiel die Bewertung der einzelnen Mutation erfordern eine unabhängige Verwendung von Nonsense – Suppressor – Stämmen 5-7, oder sie wurden in ihrer quantitativen Fähigkeit aufgrund der geringen Sequenzierungstiefe von Sanger – Sequenzierung 8 begrenzt. Die Techniken , die in diesen Studien verwendet wurden weitgehend durch Verfahren ersetzt worden 9-12 High-Throughput – Sequenzierung Technologie. Diese konzeptionell einfache Ansätze zur Folge Erstellen einer Bibliothek , die eine große Anzahl von Mutationen umfasst, Unterwerfen der Bibliothek an einen Bildschirm oder eine Auswahl für die Funktion und dann tief Sequenzierung (dh. In der Größenordnung von> 10 6 Sequenzierung liest) die Bibliothek erhalten vor und nach der Auswahl. Auf diese Weise können die phänotypische oder Eignung Wirkungen einer großen Anzahl von Mutationen, wie die Änderung in Bevölkerungsfrequenz jedes mutanten dargestellt, bewertet werden, um gleichzeitig und quantitativ.
Wir führten zuvor eine einfa(. dh Ganz Protein Sättigungsmutagenese – Bibliotheken) le Ansatz für Bibliotheken aller möglichen einzelnen Aminosäure – Mutationen in Proteinen Beurteilung für Gene mit einer Länge länger als die Sequenzierung lesen Länge 11,13: Zuerst wird jede Position Aminosäure randomisierten durch ortsgerichtete mutagene PCR. Während dieses Prozesses wird das Gen in Gruppen aufgeteilt, bestehend aus zusammenhängenden Positionen mit einer Gesamtlänge von der Sequenzierungs Plattform untergebracht sind. Die mutagene PCR-Produkte für jede Gruppe werden dann kombiniert, und jede Gruppe unabhängig voneinander zur Auswahl und Hochdurchsatz-Sequenzierung unterzogen. Durch die Aufrechterhaltung hat eine Entsprechung zwischen der Position von Mutationen in der Sequenz und die Sequenzierung Leselänge dieser Ansatz den Vorteil der Maximierung Sequenzierungstiefe: während man einfach könnte sequenzieren solche Bibliotheken in kurzen Fenstern ohne Aufteilung in Gruppen (beispielsweise durch eine Standard – Schrotflinte. Sequenzierung Ansatz), die meisten liest wäre erhaltenen Wildtyp und damit die majority von Sequenzierungsdurchsatz verschwendet (beispielsweise für ein ganzes Protein Sättigungsmutagenese Bibliothek eines Proteins 500 Aminosäure in 100 Aminosäure sequenziert (300 bp) Fenster, bei mindestens 80% der liest , wird die Wildtyp – Sequenz ist).
Hier wird ein Protokoll vorgestellt , das Hochdurchsatz – Sequenzierung für die funktionelle Beurteilung des gesamten Protein – Sättigungsmutagenese – Bibliotheken verwendet, die obige Ansatz (skizziert in Abbildung 1). Wichtig ist, stellen wir die Verwendung von orthogonalen Primern in der Bibliothek Klonierungsverfahren jede Sequenzgruppe zu Barcode, der sie in einer Bibliothek gemultiplext werden können, gleichzeitig Screening oder Selektion unterzogen und dann für tiefe Sequenzierung demultiplexiert. Da die Sequenzgruppen nicht unabhängig Selektion unterzogen werden, verringert sich die Arbeitsbelastung und stellt sicher, dass jede Mutation, das gleiche Niveau der Auswahl erfährt. TEM-1-β-Lactamase, ein Enzym, das auf hohem Niveau Resistenz verleihtβ-Lactam – Antibiotika (z. B. Ampicillin) in Bakterien wird als Modellsystem 14-16 verwendet. Ein Protokoll wird für die Beurteilung der Gesamtprotein Sättigungsmutagenese Bibliothek von TEM-1 in E. beschrieben coli unter Selektion bei einer ungefähren Serumspiegel für eine klinische Dosis von Ampicillin (50 ug / ml) 17,18.
Hier ist ein Protokoll zum Durchführen der funktionellen Bewertung des gesamten protein Sättigungsmutagenese Bibliotheken beschriebenen Hochdurchsatz-Sequenzierung Technologie. Ein wichtiger Aspekt des Verfahrens ist die Verwendung von orthogonalen Primern während des Klonens. Kurz gesagt, wird jede Aminosäureposition durch mutagene PCR randomisiert, und zusammen in Gruppen von Positionen, deren kombinierte Sequenzlänge von Hochdurchsatz-Sequenzierung untergebracht ist gemischt. Diese Gruppen kloniert in Plasmid-Ve…
The authors have nothing to disclose.
R.R. acknowledges support from the National Institutes of Health (RO1EY018720-05), the Robert A. Welch Foundation (I-1366), and the Green Center for Systems Biology.
Typtone | Research Products Intl. Corp. | T60060-1000.0 | |
Yeast extract | Research Products Intl. Corp. | Y20020-500.0 | |
Sodium chloride | Fisher Scientific | BP358-212 | |
Potassium chloride | Sigma-Aldrich | P9333-500G | |
Magnesium sulfate | Sigma-Aldrich | M7506-500G | |
Agar | Fisher Scientific | BP1423-500 | |
Tetracycline hydrochloride | Sigma-Aldrich | T7660-5G | |
petri plates | Corning | 351029 | |
MATLAB | Mathworks | http://www.mathworks.com/products/matlab/ | |
Oligonucleotide primers | Integrated DNA Technologies | https://www.idtdna.com/pages/products/dna-rna/custom-dna-oligos | 25 nmol scale, standard desalting |
pBR322_AvrII | available upon request | pBR322 plasmid modified to contain AvrII restriction site downstream of the TEM-1 gene | |
pBR322_OP1 – pBR322_OP5 | available upon request | five modified pBR322 plasmids each containing a pair of orthogonal priming sites | |
Q5 high-fidelity DNA polymerase | New England Biolabs | M0491L | includes 5X PCR buffer and PCR additive (GC enhancer) |
15 mL conical tube | Corning | 430025 | |
Multichannel pipettes (Eppendorf ResearchPlus) | Eppendorf | ||
PCR plate, 96 well | Fisher Scientific | 14230232 | |
96 well plate seal | Excel Scientific | F-96-100 | |
Veriti 96-well thermal cycler | Applied Biosystems | 4375786 | |
6X gel loading dye | New England Biolabs | B7024S | |
Agarose | Research Products Intl. Corp. | 20090-500.0 | |
Ethidium bromide | Bio-Rad | 161-0433 | |
UV transilluminator (FOTO/Analyst ImageTech) | Fotodyne Inc. | http://www.fotodyne.com/content/ImageTech_gel_documentation | |
EB buffer | Qiagen | 19086 | |
96-well black-walled, clear bottom assay plates | Corning | 3651 | |
Lambda phage DNA | New England Biolabs | N3011S | |
PicoGreen dsDNA reagent | Invitrogen | P7581 | dsDNA quantitation reagent, used in protocol step 2.2.4 |
Victor 3V microplate reader | PerkinElmer | ||
DNA purification kit | Zymo Research | D4003 | |
Microcentrifuge tubes | Corning | 3621 | |
Long-wavelength UV illuminator | Fisher Scientific | FBUVLS-80 | |
Agarose gel DNA extraction buffer | Zymo Research | D4001-1-100 | |
AatII | New England Biolabs | R0117S | |
AvrII | New England Biolabs | R0174L | |
T4 DNA ligase | New England Biolabs | M0202S | |
EVB100 electrocompetent E. coli | Avidity | EVB100 | |
Electroporator (E. coli Pulser) | Bio-Rad | 1652102 | |
Electroporation cuvettes | Bio-Rad | 165-2089 | |
Spectrophotometer (Ultrospec 3100 pro) | Amersham Biosciences | 80211237 | |
50 mL conical tubes | Corning | 430828 | |
Plasmid purification kit | Macherey-Nagel | 740588.25 | |
8 well PCR strip tubes | Axygen | 321-10-551 | |
Qubit dsDNA HS assay kit | Invitrogen | Q32854 | dsDNA quantitation reagent |
Qubit assay tubes | Invitrogen | Q32856 | |
Qubit fluorometer | Invitrogen | Q32866 | |
Ampicillin sodium salt | Akron Biotechnology | 50824296 | |
MiSeq reagent kit v2 (500 cycles) | Illumina | MS-102-2003 | |
MiSeq desktop sequencer | Illumina | http://www.illumina.com/systems/miseq.html | alternatively, one could sequence on Illumina HiSeq platform |
FLASh software | John Hopkins University – open source | http://ccb.jhu.edu/software/FLASH/ | software to merge paired-end reads from next-generation sequencing data |
AatII_F | GATAATAATGGTTTCTTAGACGTCAGGTGGC | ||
AvrII_R | CTTCACCTAGGTCCTTTTAAATTAAAAATGAAG | ||
AvrII_F | CTTCATTTTTAATTTAAAAGGACCTAGGTGAAG | ||
AatII_OP1_R | ACCTGACGTCCGTATTTCAACTGTCCGGTCTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP2_R | ACCTGACGTCCGCTCACGGAGTGTACTAATTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP3_R | ACCTGACGTCGTACGTCTGAACTTGGGACTTAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP4_R | ACCTGACGTCCCGTTCTCGATACCAAGTGATAAGAAACCATTATTATCATGACATTAAC | ||
AatII_OP5_R | ACCTGACGTCGTCCGTCGGAGTAACAATCTTAAGAAACCATTATTATCATGACATTAAC | ||
OP1_F | GACCGGACAGTTGAAATACG | ||
OP1_R | CGACGTACAGGACAATTTCC | ||
OP2_F | ATTAGTACACTCCGTGAGCG | ||
OP2_R | AGTATTAGGCGTCAAGGTCC | ||
OP3_F | AGTCCCAAGTTCAGACGTAC | ||
OP3_R | GAAAAGTCCCAATGAGTGCC | ||
OP4_F | TCACTTGGTATCGAGAACGG | ||
OP4_R | TATCACGGAAGGACTCAACG | ||
OP5_F | AGATTGTTACTCCGACGGAC | ||
OP5_R | TATAACAGGCTGCTGAGACC | ||
Group1_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNGCATTTTGCCTACCGGTTTTTGC | ||
Group1_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTCTTGCCCGGCGTCAAC | ||
Group2_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNGAACGTTTTCCAATGATGAGCAC | ||
Group2_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNGTCCTCCGATCGTTGTCAGAAG | ||
Group3_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNAGTAAGAGAATTATGCAGTGCTGCC | ||
Group3_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTCGCCAGTTAATAGTTTGCGC | ||
Group4_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNCCAAACGACGAGCGTGACAC | ||
Group4_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNGCAATGATACCGCGAGACCC | ||
Group5_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNCGGCTGGCTGGTTTATTGC | ||
Group5_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNTATATGAGTAAACTTGGTCTGACAG | ||
501_F | AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGAC | ||
502_F | AATGATACGGCGACCACCGAGATCTACACATAGAGGCACACTCTTTCCCTACACGAC | ||
503_F | AATGATACGGCGACCACCGAGATCTACACCCTATCCTACACTCTTTCCCTACACGAC | ||
504_F | AATGATACGGCGACCACCGAGATCTACACGGCTCTGAACACTCTTTCCCTACACGAC | ||
505_F | AATGATACGGCGACCACCGAGATCTACACAGGCGAAGACACTCTTTCCCTACACGAC | ||
701_R | CAAGCAGAAGACGGCATACGAGATCGAGTAATGTGACTGGAGTTCAGACGTG | ||
702_R | CAAGCAGAAGACGGCATACGAGATTCTCCGGAGTGACTGGAGTTCAGACGTG |