Restriktionen endonucleases med ny sekvens specificitet kan udvikles fra enzymer, der genkender en delvist degenereret sekvens. Her giver vi en detaljeret protokol, som vi med succes har brugt til at ændre sekvensspecificiteten af NlaIV-enzymet. De vigtigste ingredienser i protokollen er in vitro-opdelingen af transskriptions-/oversættelsesreaktionen og udvælgelsen af varianter med nye sekvensspecificiteter.
Begrænsning endonuclease (REase) specificitet engineering er yderst vanskeligt. Her beskriver vi en multitrinsprotokol, der hjælper med at producere REase-varianter, der har strengere specificitet end forældreenzymet. Protokollen kræver oprettelse af et bibliotek af udtryk saetter (ESC’er) for varianter af REase, ideelt med variabilitet i positioner, der kan påvirke DNA-binding. ESC er flankeret på den ene side af en sekvens for den ønskede begrænsningsaktivitet og et biotinmærke og på den anden side af et restriktionssted for den uønskede aktivitet og et grundstykke. ECC’erne transskriberes og oversættes i en vand-i-olie-emulsion under forhold, der gør tilstedeværelsen af mere end ét DNA-molekyle pr. dråbe usandsynlig. Derfor udsættes DNA’et i hvert kassettemolekyle kun for aktiviteten af det oversatte, kodede enzym. REase varianter af den ønskede specificitet fjerne biotin tag, men ikke primer glødning site. Efter at have brudt emulsionen udsættes DNA-molekylerne for en biotinnedtagning, og kun dem i supernatanten bevares. Dette trin sikrer, at kun økonomiske og regionale rådgivende råd for varianter, der ikke har mistet den ønskede aktivitet, bevares. Disse DNA-molekyler udsættes derefter for en første PCR-reaktion. Spaltning i den uønskede sekvens afskærer primer binding site for en af de primere. Derfor forstærker PCR kun økonomiske og små økonomiske og små økonomiske og små økonomiske og små, Der udføres derefter endnu en PCR-reaktion for at genindføre begrænsningsstedet for den ønskede specificitet og biotinmærket, således at udvælgelsestrinnet kan gentages. Udvalgte åbne læserammer kan overudtrykkes i bakterieceller, der også udtrykker den bevidste methyltransferase af forældreneS REase, fordi den nyudviklede REase kun er rettet mod en delmængde af methyltransferase målwebstederne.
Sekvens specificitet engineering er ekstremt udfordrende for klasse II REases. I denne klasse af endonucleases er sekvensgenkendelse og katalyse tæt forbundet, sandsynligvis som en evolutionær sikkerhedsforanstaltning mod oprettelsen af en endonuclease af bredere specificitet end dets cognate methyltransferase, hvilket ville skade værts-DNA’et. Direkte udvikling af nye særlige forhold i celler kompliceres yderligere af behovet for at beskytte værts-DNA mod den nyudviklede endonuclease aktivitet. Derfor er der kun et par vellykkede forsøg på REase engineering rapporteret, og alle af dem udnytte de unikke funktioner i et bestemt enzym1,2,3,4,5,6,7.
Her giver vi en detaljeret protokol for specificitet engineering, der kan bruges til at generere endonuclease varianter, der har smallere specificitet end en forældrenes enzym, der er baseret på vores succesfulde konstruktion af en NlaIV endonuclease8. For ethvert sådant enzym med en vilkårlig genkendelsessekvens kan der indføres ekstra specificitet for baser i flankerne. For forældreenzymer, der genkender delvist degenererede sekvenser (såsom NlaIV med sit GGNNCC-mål), kan yderligere specificitet også indføres inden for genkendelsessekvensen. Da ekstra specificitet sandsynligvis vil kræve protein-DNA-kontakter, bør de nyligt anerkendte baser ligge inden for fodaftryk af forældrenes endonuclease på DNA. I princippet kan der oprettes udvælgelsesordninger for enhver ønsket specialisering af anerkendelsessekvensen. Men de fleste REases, der genkender palindromiske og næsten palindromiske målsekvenser er funktionelle dimers, der genkender kun et halvt sted af palindrome. Derfor er det usandsynligt, at udvælgelsen af nye specificiteter, der krænker symmetrien i proteinnukleininteraktioner, vil virke. For dimeric NlaIV, for eksempel, ggnNCC sekvens kan teoretisk indsnævres til GGATCC men indsnævring specificitetned til GGAACC forventes at være vanskeligere. Vores ordning indebærer både positiv og negativ udvælgelse.
Processen er mere effektiv, når negativ udvælgelse også bruges til at fjerne de særlige forhold, der kan kløve alle andre sekvenser end den foretrukne snævrere specificitet. F.eks. kan valg af GGATCC kombineres med antiselection mod GGBVCC (hvor B er en anden base end A, og V er en anden base end T). Når nogle af de mulige målsekvenser ikke er dækket, afhænger resultatet af udvælgelseseksperimentet af effektiviteten af positiv og negativ udvælgelse. I vores NlaIV arbejde, valgte vi for GGATCC, og mod GGSSCC (hvor S er G eller C), og opnåede en specificitet, at ignorere symmetri bryde mål, kunne beskrives som GGWWCC (hvor W er A eller T), hvilket tyder på, at i dette særlige tilfælde, negativ udvælgelse var mere vigtigt end positiv udvælgelse.
Vores tilgang starter med oprettelsen af et udtryk udvælgelse kassette (ESC). ØSU er struktureret i sektioner. På den indvendige kerne sektion, er der varianter af den åbne læseramme (ORF) af REase, under T7 promotor kontrol. Denne kernesektion af ESC må ikke indeholde noget cognate-sted for den udviklede REase. Kernen er klemt inde mellem to cognate steder for vilde type REase: en spaltning site for den uønskede aktivitet (counter valgt sekvens, GGSSCC i dette eksempel) og en spaltning site for den ønskede aktivitet (valgt sekvens, GGATCC i eksemplet). Det sidste trin i udarbejdelsen af ØSU i PCR tilføjer biotin tæt på den ønskede aktivitet i 5’s ende og skaber en række forskellige modudvalgte sekvenser (GGSSCC i eksemplet). Udvælgelsesstrategien bygger på anvendelse af omhyggeligt designede primere i ESC’s reamplificationprotokol efter en in vitro-transskriptions-/oversættelses-/udvælgelsesprotokol (figur 1A). ESC-biblioteket udtrykkes i en in vitro-opdelt transskriptionsoversættelse , som er vand-i-olie-emulsion9,10,11. Inden for hvert dråbe påvirker det udtrykte enzyms specificitet ESC ‘ets tilstand (figur 1B,trin I). For det beskrevne arrangement fjerner den ønskede spaltningsaktivitet af det oversatte protein DNA’s biotinmærke, men påvirker ikke den anden ESC-ende med den valgte tæller. Når emulsionen er brudt, fjernes biotinylatere fragmenter ved streptavidin affinitetspulldown, således at der kun er fragmenter fra dråber med den ønskede aktivitet tilbage(figur 1B, trin II). Dette trin fjerner inaktive REase-varianter. Den supernatant fraktion af pull-down trin forstærkes derefter af PCR. I de første PCR-reaktionsprimere anvendes F2 og R1(figur 1A,B, trin III). Primer F2 binder sig til ESC-sektionen mellem den valgte tællersekvens og molekyleenden. Derfor forstærkes økonomiske og økonomiske råd, der udtrykker varianter, der er i stand til at kløve den valgte tællersekvens (og derfor adskiller bindingsstederne for primer F2 og R1 i to forskellige DNA-molekyler) ikke og fjernes derfor fra biblioteket. Primer R1 binder sig mellem det valgte sted og kernen i ESC, så det ikke påvirkes af spaltningsstatus for det valgte sted og gendanner spaltningsstedet for den ønskede aktivitet (GGATCC). Cyklussen lukkes med en anden PCR (med primer F1 og R2), der tilføjer biotin i 5’s ende tæt på det valgte sted og genskaber designet variation ved det valgte tællersted tæt på den modsatte ende af ESC (Figur 1B, trin IV). Den resulterende DNA-blanding er klar til endnu en valgrunde.
Udvælgelsesprotokollens succes afhænger i høj grad af, at den nye og strengere målgenkendelsessekvens bliver et korrekt valg, og at mutagenesestrategien og dens effektive gennemførelse er udformet omhyggeligt. Fordi det er meget lettere at forbedre på mindre allerede eksisterende præferencer REase end at overvinde dem, anbefaler vi at starte med en kinetisk undersøgelse af eventuelle allerede eksisterende præferencer. Nødvendigheden af omhyggelig mutagenese design skyldes den begrænsede størrelse af en mutant bibliotek, der kan behandles af den præsenterede protokol (109 kloner i et enkelt eksperiment). Derfor kan alle 20 mulige aminosyresubstitutioner testes effektivt i få positioner (se Diskussion). Tilfældig mutagenese, såsom fejlbehæftet PCR (EP-PCR), der præsenteres som en alternativ metode, vil føre til en dybtgående undersampling af eksisterende kompleksitet. Hvis der foreligger oplysninger om potentielle aminosyrepositioner, der er involveret i kontakt med DNA (eller endda placeret i nærheden af de degenererede nukleotider i en cognatesekvens), bør de helt sikkert anvendes til at vælge nogle få aminosyrer til oligonukleotid styret mætningmutagenese (protokoltrin 1.6-3.10).
Den udvælgelsesprotokol, der er beskrevet her, blev testet for NlaIV8, en dimeric PD-(D/E)XK-foldegenkendelsessekvens, der genkender et palindromisk målsted med centrale NN-baser og katalyserer et stumpt endesnit mellem NN-baserne. NlaIV blev plukket, fordi spaltning mellem NN baser tyder på, at disse baser er tæt på proteinet i komplekset. I princippet kan protokollen anvendes til enhver sekvensspecifik begrænsning endonuclease, monomerisk eller dimeric, af enhver fold gruppe, katalysere dobbelt streng pauser af enhver vakle, uanset om katalytiske og specificitet domæner falder sammen (som i NlaIV eksempel) eller er separate (f.eks FokI). Desuden er protokollen i princippet nyttig ikke kun for generering af nye, mere snævre enzym specificitet, men kan også bruges til at fjerne stjerne aktiviteter, eller at skabe high fidelity endonucleases. Men alt dette er ikke blevet testet endnu. Især kan målrettet eliminering af stjerneaktivitet være kompliceret, fordi de samme aminosyrerester kan være involveret i binding til de ønskede og uønskede baser. De in vitro-trin, der er beskrevet i denne protokol, er ikke begrænset til udvælgelsen af indsnævrede særtræk, men kan også bruges til at vælge ellers ændrede specificiteter. Men der er så et problem med variant endonucleases: hvis spektret af substrater omfatter nye mål ikke kløvet af forældrenes endonuclease, er der generelt ingen god måde at beskytte celler mod de skadelige virkninger af denne aktivitet. Hvis endonuclease-specificiteten derimod kun indsnævres, er målene en delmængde af wild type-målene, og derfor bør det allerede tilgængelige cognate methyltransferase være fuldt beskyttende.
Vores protokol adskiller sig i flere henseender fra mange styrede evolutionsprotokoller. Åben læseramme mangfoldighed genereres én gang i begyndelsen af eksperimentet, ikke i hver iteration. Desuden er det skabt ved split-and-mix syntese, snarere end af EP-PCR. For NNS udskiftninger af codons, som anvendes i dette arbejde, er der (4 x 4 x 2)6 ~ 1,07 x 109 kombinationer for seks positioner. Derfor er en given variant til stede i gennemsnit en gang i 1,7 fmoles af ESC. Denne kapacitet kan øges til syv positioner ved hjælp af syntese med en blanding af 20 trinucleotid prækursorer, der tilbydes af Glen Research eller ved faldende mutationfrekvens i mindre lovende positioner med split-and-mix oligonukleotid syntese. Hvis det er muligt, anbefales det at begrænse omfanget af variation til seks positioner. Det er klart, at en sådan mutagenese målretning kræver en vis allerede eksisterende viden om i det mindste de regioner i REase involveret i substrat bindende. Split-and-mix-protokollen for at skabe mangfoldighed har klare fordele i forhold til EP-PCR. Ved hjælp af EP-PCR opnåede vi uændrede varianter og sekvenser, der medfører otte erstatninger for NlaIV ESCs i samme EP-PCR (tabel 4). Biblioteket fra EP-PCR indeholder en betydelig brøkdel af kloner, der bør undgås (vilde type sekvenser, flere udskiftninger, frameshift og nonsens mutationer, og mutationer på steder, der sandsynligvis ikke vil påvirke sekvens specificitet).
Vores protokol adskiller sig også fra mange andre styrede evolutionsprotokoller ved tilstedeværelsen af to sekventielle udvælgelsestrin. Positiv udvælgelse sikrer, at den ønskede aktivitet bevares, ellers fjernes biotinmærket ikke, og kodningssekvensen kan fjernes ved pull-down. Det er teknisk muligt, at den tilfældige fremkomst af en ny, ikke-overlappende specificitet (f.eks. Dette bør dog være højst usandsynligt. Negativ udvælgelse fjerner åbne læserammer, der koder for enzymer, der stadig har den uønskede aktivitet. Dette trin er ikke strengt obligatorisk, fordi protokollen stadig vil berige outputbiblioteket med varianter, der er i stand til at kløve udvælgelsessekvensen, men ikke er i stand til at kløve andre steder i ØSU, hvilket gør det uegnet til PCR-forstærkning. Udvælgelseseffektiviteten forventes dog at være lavere, fordi enzymer med den oprindelige sekvensspecificitet ikke vil blive fjernet fra outputtet og vil udkonkurrere lovende varianter med ændret specificitet, men også nedsat enzymatisk aktivitet. Bemærk, at på befolkningsniveau, både ønskede og uønskede mål sekvenser kan, men behøver ikke at være, degenerere. I NlaIV-eksemplet var antimålet degenereret, og målet var ikke-degenereret. Selv når der er degeneracy på befolkningsniveau, i en enkelt dråbe kun én (ikke-degenereret) mål eller anti-target er til stede. I vores protokol genindsættes mål- og antimålsekvenser ved hver gentagelse af udvælgelsestrinnene. Derfor skal en åben læseramme indkode et enzym, der kan kløve alle mulige mål, og ude af stand til at kløve nogen af antimålene, for at overleve flere udvælgelsesrunder. Bemærk, at behovet for at genindføre antiselection-målet ved hver gentagelse af protokollen håndhæver to sekventielle PCR’er. Den første PCR bruger en primer, der anneals uden for anti-målet, således at spaltning af anti-målet forhindrer PCR reaktion. Den anden PCR kræver en primer, der rækker ud over anti-målet, og genindfører anti-mål, for at sikre, at under flere runder af udvælgelse, hver åben læseramme er testet mod alle varianter af anti-target.
For enzymer, der genererer klæbrige ender, kan der anvendes en relateret alternativ protokol baseret på en tidligere beskrevet metode til isolering af REase ORF10. Udtømningen af inaktive varianter ved biotinindfangst, der anvendes i vores eksperimenter, erstattes i den alternative protokol ved at gøre den kompatible adapter med en sekvens, der bruges som primerbindingssted i en selektiv PCR (figur 9). Kun økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske og økonomiske Sekvensen af den klistrede ende af den afvalgte tæller skal være konstrueret således, at den ikke kan deltage i ligation med adaptere. Iteration af udvælgelsesprocessen kan nemt opnås ved at skifte mellem to forskellige adaptere og dermed to forskellige omvendte primere i selektiv PCR.
Selv med nye protokoller, opgaven med engineering nye særlige forhold in vitro er stadig meget udfordrende. For typiske type II REases afhænger sekvensspecificitet og endonukleolytisk aktivitet af de samme proteinområder. Det er derfor vanskeligt at ændre det ene uden at påvirke det andet. Succes er gjort mere sandsynligt ved en strategi, der tager hensyn til fodaftryk af enzymet, respekterer symmetrien i protein-DNA interaktioner, og bygger på allerede eksisterende enzymatiske præferencer, som bør bestemmes på forhånd i biokemiske eksperimenter, som det blev gjort for NlaIV eksempel8.
The authors have nothing to disclose.
Dette arbejde blev støttet af tilskud fra Ministeriet for Videnskab og Videregående Uddannelse (0295/B/PO1/2008/34 til MB og N301 100 31/3043 til KS), fra det polske nationale videnskabscenter (NCN) (UMO-2011/02/A/NZ1/00052, UMO-2014/13/B/NZ1/03991 og UMO-2014/14/M/NZ5/00558 til MB) og ved kort sigt EMBO stipendium til KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |