Begrensning endonucleases med ny sekvens spesifisitet kan utvikles fra enzymer gjenkjenne en delvis degenerert sekvens. Her gir vi en detaljert protokoll som vi med hell brukte til å endre sekvensspesifisiteten til NlaIV-enzymet. Viktige ingredienser i protokollen er in vitro compartmentalization av transkripsjon / oversettelse reaksjon og valg av varianter med nye sekvens spesifisiteter.
Begrensning endonuclease (REase) spesifisitet engineering er ekstremt vanskelig. Her beskriver vi en flertrinnsprotokoll som bidrar til å produsere REase-varianter som har strengere spesifisitet enn foreldreenzymet. Protokollen krever opprettelse av et bibliotek med uttrykksvalgkassetter (EsCer) for varianter av REase, ideelt sett med variabilitet i posisjoner som sannsynligvis vil påvirke DNA-binding. ESC er flankert på den ene siden av en sekvens for begrensning ser nettstedet aktivitet ønsket og en biotin tag og på den andre siden av en begrensning nettsted for uønsket aktivitet og en primer gløding området. EsCene transkribert og oversatt i en vann-i-olje emulsjon, under forhold som gjør tilstedeværelsen av mer enn ett DNA molekyl per dråpe usannsynlig. Derfor blir DNA i hvert kassettmolekyl bare utsatt for aktiviteten til det oversatte, kodede enzymet. REase varianter av ønsket spesifisitet fjerne biotin tag, men ikke primer annealing området. Etter å ha brutt emulsjonen, blir DNA-molekylene utsatt for en biotinpulldown, og bare de i supernatanten beholdes. Dette trinnet sikrer at bare ESCer for varianter som ikke har mistet ønsket aktivitet, beholdes. Disse DNA-molekylene blir deretter utsatt for en første PCR-reaksjon. Cleavage i uønsket rekkefølge kutter av primer bindende området for en av primere. PCR forsterker derfor bare ESCer fra dråper uten uønsket aktivitet. En annen PCR-reaksjon utføres deretter for å gjeninnføre begrensningsstedet for ønsket spesifisitet og biotinkoden, slik at valgtrinnet kan gjentas. Utvalgte åpne leserammer kan overuttrykkes i bakterielle celler som også uttrykker den cognate metyltransferase av foreldrene SEase, fordi den nyutviklede REase bare retter seg mot et undersett av metyltransferasemålsstedene.
Sekvensspesifisitetsteknikk er ekstremt utfordrende for klasse II REases. I denne klassen av endonukleases, sekvens anerkjennelse og katalyser er tett sammenvevd, mest sannsynlig som en evolusjonær beskyttelse mot etableringen av en endonuclease av bredere spesifisitet enn sin cognate metyltransferase, som ville skade verten DNA. Rettet utvikling av nye spesifisiteter i celler er ytterligere komplisert av behovet for å beskytte verten DNA mot den nylig konstruerte endonuclease aktivitet. Derfor er det bare noen få vellykkede forsøk på REase engineering rapportert og alle av dem utnytte de unike funksjonene til et bestemt enzym1,2,3,4,5,6,7.
Her gir vi en detaljert protokoll for spesifisitetsteknikk som kan brukes til å generere endonuclease-varianter som har smalere spesifisitet enn et foreldreenzym som er basert på vår vellykkede prosjektering av en NlaIV endonuclease8. For et slikt enzym med en vilkårlig gjenkjenningssekvens kan ekstra spesifisitet innføres for baser i flankene. For foreldreenzymer som gjenkjenner delvis degenererte sekvenser (for eksempel NlaIV med GGNNCC-målet), kan ytterligere spesifisitet også innføres i gjenkjenningssekvensen. Som ekstra spesifisitet vil trolig kreve protein-DNA-kontakter, bør de nylig anerkjente basene ligge innenfor fotavtrykket til foreldrenes endonuclease på DNA. I prinsippet kan valgordninger defineres for ønsket spesialisering av gjenkjenningssekvensen. Imidlertid er de fleste reases som gjenkjenner palindromic og nesten palindromic målsekvenser funksjonelle dimers som gjenkjenner bare et halvt sted av palindrome. Derfor er det lite sannsynlig at valg av nye spesifiteter som bryter symmetrien av proteinnukleærinteraksjoner, vil fungere. For den dimeric NlaIV, for eksempel, kan GGNNCC-sekvensen teoretisk begrenses til GGATCC, men innsnevring av spesifisiteten ned til GGAACC forventes å være vanskeligere. Vår ordning innebærer både positivt og negativt utvalg.
Prosessen er mer effektiv når negativt utvalg også brukes til å fjerne spesifisitetene som kan holde alle andre sekvenser enn den foretrukne smalere spesifisiteten. Valg for GGATCC kan for eksempel kombineres med antivalg mot GGBVCC (der B er en annen base enn A, og V er en annen base enn T). Når noen av de mulige målsekvensene ikke dekkes, avhenger utfallet av utvalgseksperimentet av effektiviteten av positivt og negativt utvalg. I vårt NlaIV-arbeid valgte vi for GGATCC, og mot GGSSCC (hvor S er G eller C), og fikk en spesifisitet som, ignorerer symmetribrytende mål, kan beskrives som GGWWCC (hvor W er A eller T), noe som tyder på at i dette spesielle tilfellet var negativt utvalg mer viktig enn positivt utvalg.
Vår tilnærming starter med opprettelsen av en uttrykksvalgkassett (ESC). ESC er strukturert i seksjoner. På innsiden kjernen delen, det er varianter av den åpne leserammen (ORF) av REase, under T7 arrangør kontroll. Denne kjernedelen av ESC kan ikke inneholde noe cognate-område for den konstruerte REase. Kjernen er klemt mellom to cognate nettsteder for vill type REase: en cleavage nettsted for uønsket aktivitet (counter valgt sekvens, GGSSCC i dette eksemplet) og en cleavage nettsted for ønsket aktivitet (valgt sekvens, GGATCC i eksemplet). Det siste trinnet i utarbeidelsen av ESC i PCR legger biotin nær ønsket aktivitet på 5’slutten og skaper en rekke teller utvalgte sekvenser (GGSSCC i eksemplet). Valgstrategien er avhengig av bruk av nøye utformede primere ved ESC-reampliiseringsprotokollen etter en in vitro transkripsjon/oversettelses-/utvelgelsesprotokoll (figur 1A). ESC-biblioteket uttrykkes i en in vitro compartmentalized transkripsjon oversettelse vann-i-olje emulsjon9,,10,11. Innenfor hver dråpe påvirker spesifisiteten til det uttrykte enzymet tilstanden til ESC(Figur 1B, trinn I). For den beskrevne ordningen fjerner ønsket spaltingsaktivitet av det oversatte proteinet DNA-ets biotinmerke, men påvirker ikke den andre ESC-enden med tellerenvalgt sekvens. Når emulsjonen er ødelagt, fjernes biotinylated fragmenter ved streptavidin affinitetspulldown, slik at bare fragmenter fra dråper med ønsket aktivitet forblir (Figur 1B, trinn II). Dette trinnet fjerner inaktive REase-varianter. Den supernatante fraksjonen av nedtrekkstrinnet forsterkes deretter av PCR. I den første PCR reaksjon primers F2 og R1 brukes (Figur 1A, B, trinn III). Primer F2 bindes til ESC-delen mellom den valgte telleren og molekyletden. Derfor er ESCs som uttrykker varianter som er i stand til å cleaving telleren valgt sekvens (og derfor skille bindingsstedene for primere F2 og R1 i to forskjellige DNA molekyler) ikke forsterkes og blir dermed fjernet fra biblioteket. Primer R1 binder seg mellom det valgte området og kjernen i ESC slik at det ikke påvirkes av spaltningsstatusen til det valgte området og gjenoppretter spaltningsstedet for ønsket aktivitet (GGATCC). Syklusen er lukket av en annen PCR (med primere F1 og R2) som legger biotin på 5’slutten nær det valgte området og gjenoppretter designet variasjon på telleren valgt sted nær motsatt ende av ESC(Figur 1B, trinn IV). Den resulterende DNA-blandingen er klar for en ny runde med valg.
Suksessen til utvelgelsesprotokollen avhenger sterkt av riktig valg av den nye, strengere målgjenkjenningssekvensen og forsiktig utforming av mutagenesisstrategien og den effektive implementeringen. Fordi det er mye lettere å forbedre på små eksisterende preferanser av REase enn å overvinne dem, anbefaler vi å starte med en kinetisk studie av eventuelle eksisterende preferanser. Nødvendigheten av forsiktig mutagenesis design skyldes den begrensede størrelsen på et mutert bibliotek som kan behandles av den presenterte protokollen (109 kloner i et enkelt eksperiment). Derfor kan alle 20 mulige aminosyresubstitusjoner effektivt testes i bare noen få stillinger (se Diskusjon). Tilfeldig mutagenesis, for eksempel feilutsatt PCR (EP-PCR) presentert som en alternativ metode, vil føre til dyp undersampling av eksisterende kompleksitet. Hvis informasjon om potensielle aminosyrestillinger involvert i kontakter med DNA (eller til og med ligger i nærheten av degenererte nukleotider i en cognate sekvens) er tilgjengelig, bør det absolutt brukes til å velge noen aminosyrer for oligonucleotide guidet metningmutagenesis (protokolltrinn 1.6-3.10).
Utvalgsprotokollen som er beskrevet her ble testet for NlaIV8, en dimeric PD-(D/E)XK fold anerkjennelse sekvens som gjenkjenner en palindromisk målområde med sentrale NN baser og katalyserer en stump ende kuttet mellom NN baser. NlaIV ble plukket fordi spalting mellom NN-basene tyder på at disse basene er nær proteinet i komplekset. I prinsippet kan protokollen brukes til enhver sekvens spesifikk begrensning endonuclease, monomeric eller dimeric, av en fold gruppe, katalysere dobbel tråd pauser av noen forskjøvet, uavhengig av om katalytiske og spesifisitet domener faller sammen (som i NlaIV eksempel) eller er separate (f.eks FokI). Videre er protokollen i prinsippet nyttig ikke bare for generering av nye, smalere enzymspesifisitet, men kan også brukes til å eliminere stjerneaktiviteter, eller for å skape high fidelity endonucleases. Alt dette er imidlertid ikke testet ennå. Spesielt kan målrettet eliminering av stjerneaktivitet være komplisert, fordi de samme aminosyrerester kan være involvert i binding til de ønskede og uønskede basene. In vitro trinnene som er beskrevet i denne protokollen er ikke begrenset til valg av innsnevrede spesifisiteter, men kan også brukes til å velge ellers endrede spesifisiteter. Det er imidlertid da et problem med variant endonucleases: hvis spekteret av substrater inkluderer nye mål som ikke spaltes av foreldrenes endonuclease, er det generelt ingen god måte å beskytte celler mot de skadelige effektene av denne aktiviteten. I motsetning, hvis endonuclease spesifisitet bare er innsnevret, målene er et delsett av vill type mål, og dermed den allerede tilgjengelige cognate metyltransferase bør være fullt beskyttende.
Vår protokoll skiller seg på flere måter fra mange regisserte evolusjonsprotokoller. Åpne leserammemangfold genereres en gang i begynnelsen av eksperimentet, ikke i hver iterasjon. Videre er det skapt av split-and-mix syntese, snarere enn av EP-PCR. For NNS-erstatninger av codons, som brukt i dette arbeidet, er det (4 x 4 x 2)6 ~ 1,07 x 109 kombinasjoner for seks posisjoner. Derfor er en gitt variant til stede i gjennomsnitt en gang i 1,7 fmoles av ESC. Denne kapasiteten kan økes til syv posisjoner ved hjelp av syntese med en blanding av 20 trinucleotide forløpere som tilbys av Glen Research eller ved å redusere mutasjonsfrekvens i mindre lovende posisjoner med split-and-mix oligonucleotide syntese. Hvis det er mulig, anbefales det å begrense omfanget av variasjon til seks stillinger. Selvfølgelig krever slik mutagenesis målretting noen eksisterende kunnskap om minst regionene i REase involvert i substratbinding. Split-and-mix-protokollen for å generere mangfold har klare fordeler i forhold til EP-PCR. Ved hjelp av EP-PCR fikk vi uendret varianter og sekvenser med åtte erstatninger for NlaIV-ESCer i samme EP-PCR (tabell 4). Biblioteket fra EP-PCR inneholder en betydelig brøkdel av kloner som bør unngås (vill type sekvenser, flere substitusjoner, frameshift og tull mutasjoner, og mutasjoner på steder usannsynlig å påvirke sekvensspesifisitet).
Vår protokoll skiller seg også fra mange andre anrettede evolusjonsprotokoller ved tilstedeværelsen av to sekvensielle utvalgstrinn. Positivt valg sørger for at ønsket aktivitet beholdes, ellers fjernes ikke biotinkoden, og kodesekvensen kan fjernes ved å trekke ned. Det er teknisk mulig at den falske fremveksten av en roman, ikke-overlappende spesifisitet (f.eks GCATGC) kan føre til utsslutt av biotinkoden også, hvis et passende spaltingssted er til stede i nærheten av ønsket spalting, men ikke andre steder. Dette bør imidlertid være svært usannsynlig. Negativt utvalg fjerner åpne leserammer som kode for enzymer som fortsatt har uønsket aktivitet. Dette trinnet er ikke strengt obligatorisk, fordi protokollen fortsatt vil berike utdatabiblioteket med varianter som er i stand til å holde utvalgssekvensen, men ikke i stand til å holde seg andre steder i ESC, og dermed gjøre den uegnet for PCR forsterkning. Imidlertid forventes utvalgseffektiviteten å være lavere fordi enzymer med den opprinnelige sekvensspesifisiteten ikke vil bli fjernet fra utgangen og vil konkurrere lovende varianter med endret spesifisitet, men også redusert enzymatisk aktivitet. Vær oppmerksom på at på befolkningsnivå kan både ønskede og uønskede målsekvenser, men trenger ikke være, degenerere. I NlaIV-eksemplet ble antimålet degenerert og målet ikke-degenerert. Selv når det er degeneracy på befolkningsnivå, i en enkelt dråpe bare ett (ikke-degenerert) mål eller anti-mål er til stede. I vår protokoll gjeninnføres mål- og antimålsekvenser ved hver repetisjon av valgtrinnene. Derfor må en åpen leseramme kode et enzym som er i stand til å holde alle mulige mål, og ute av stand til å holde noen av antimålene, for å overleve flere valgrunder. Legg merke til at behovet for å gjeninnføre antiselection målet ved hver iterasjon av protokollen håndhever to sekvensielle PCRs. Den første PCR bruker en primer som anneals utenfor anti-målet, slik at cleavage av anti-målet hindrer PCR reaksjon. Den andre PCR krever en primer som når utover anti-målet, og gjeninnfører anti-mål, for å sikre at hver åpen avlesningsramme testes mot alle varianter av antimålet under flere runder med valg.
For enzymer som genererer klebrig ender, kan en relatert alternativ protokoll basert på en tidligere beskrevet metode for isolering av REase ORF10 brukes. Uttømming av inaktive varianter av biotinfangst som brukes i våre eksperimenter, erstattes i den alternative protokollen ved å ligation av den kompatible adapteren med en sekvens som brukes som et primerbindingssted i en selektiv PCR (figur 9). Bare ESCer som produserer enzymer med den valgte spesifisiteten genererer ligation-kompatible ender og vil derfor bli valgt. Sekvensen av den klissete enden av telleren som ikke er valgt, må utformes på en slik måte at den ikke kan delta i ligation med adaptere. Iterasjon av utvelgelsesprosessen kan enkelt oppnås ved å bytte mellom to forskjellige adaptere og dermed to forskjellige omvendte primere i selektiv PCR.
Selv med nye protokoller er oppgaven med å konstruere nye spesifisiteter in vitro fortsatt svært utfordrende. For typisk type II REases er sekvensspesifisitet og endonucleolytic aktivitet avhengig av de samme proteinområdene. Det er derfor vanskelig å endre den ene uten å påvirke den andre. Suksess er gjort mer sannsynlig av en strategi som tar hensyn til fotavtrykket til enzymet, respekterer symmetrien av protein-DNA interaksjoner, og bygger på eksisterende enzymatiske preferanser, som bør bestemmes på forhånd i biokjemiske eksperimenter, som ble gjort for NlaIV eksempel8.
The authors have nothing to disclose.
Dette arbeidet ble støttet av bevilgningene fra Vitenskaps- og høyere utdanningsdepartementet (0295/B/PO1/2008/34 til MB og N301 100 31/3043 til KS), fra Det polske nasjonale vitenskapssenteret (NCN) (UMO-2011/02/A/NZ1/00052, UMO-2014/13/B/NZ1/03991 og UMO-2014/14/M/NZ5/00558 til MB) og ved kortsiktig EMBO-fellesskap til KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |