Detta manuskript beskriver en genomskala cell-baserade screening metod för att identifiera extracellulära receptor-ligand interaktioner.
Intercellulär kommunikation medierad genom direkt interaktion mellan membran-inbäddade cellytceptorer är avgörande för normal utveckling och funktion av flercelliga organismer. Upptäcka dessa interaktioner är dock fortfarande tekniskt utmanande. Detta manuskript beskriver en systematisk genomskala CRISPR/Cas9 knockout genetisk screening metod som avslöjar cellulära vägar som krävs för specifika cell yta erkännande händelser. Denna analys använder rekombinanta proteiner som produceras i ett däggdjur protein uttryckssystem som ivrig bindande sonder för att identifiera interaktion partner i en cellbaserad genetisk skärm. Denna metod kan användas för att identifiera de gener som behövs för interaktioner med cellytor som detekteras av rekombinanta bindningssonder som motsvarar ectodomains av membraninbäddade receptorer. Viktigt, med tanke på genomet-skala karaktär av detta tillvägagångssätt, det har också fördelen av att inte bara identifiera den direkta receptorn utan också de cellulära komponenter som krävs för presentation av receptorn på cellytan, vilket ger värdefulla insikter i biologi receptorn.
Extracellulära interaktioner genom cellytanreceptorproteiner direkt viktiga biologiska processer såsom vävnadsorganisation, host-patogen erkännande, och immun reglering. Att undersöka dessa interaktioner är av intresse för det bredare biomedicinska samhället, eftersom membranreceptorer är genomförbara mål för systematiskt levererade terapier såsom monoklonala antikroppar. Trots deras betydelse, studera dessa interaktioner är fortfarande tekniskt utmanande. Detta beror främst på att membraninbäddade receptorer är amfipatiska, vilket gör dem svåra att isolera från biologiska membran för biokemisk manipulation, och deras interaktioner kännetecknas av de svaga interaktionsaffiniteterna (KDi μM-mM-området)1. Följaktligen är många vanliga metoder olämpliga för att upptäcka denna klass av proteininteraktioner1,2.
En rad metoder har utvecklats för att specifikt undersöka extracellulära receptor-ligand interaktioner som tar deras unika biokemiska egenskaper beaktas3. Ett antal av dessa metoder innebär att uttrycka hela ectodomain av en receptor som ett lösligt rekombinant protein i däggdjur eller insektscellbaserade system för att säkerställa att dessa proteiner innehåller posttranslationala modifieringar som är strukturellt viktiga, såsom glykaner och disulfidbindningar. För att övervinna den lågaffinitet bindande, ectodomains är ofta oligomeriserade att öka deras bindande avidity. Avid protein ectodomains har framgångsrikt använts som bindande sonder för att identifiera interaktion partner i direkt rekombinant protein-protein interaktion skärmar4,5,6,7. Medan i stort sett framgångsrika, rekombinanta proteinbaserade metoder kräver att ectodomain av en membranreceptor produceras som ett lösligt protein. Därför är det endast allmänt tillämpligt på proteiner som innehåller en sammanhängande extracellulär region (t.ex. enkelpass typ I, typ II eller GPI-förankrad) och är i allmänhet inte lämplig för receptorkomplex och membranproteiner som spänner över membranet flera gånger.
Uttryck kloning tekniker där ett bibliotek av kompletterande DNAs (cDNAs) är transfected till celler och testas för en vinst-av-bindande fenotyp har också använts för att identifiera extracellulära protein-protein interaktioner8. Tillgången till stora samlingar av klonade och sekvenserade cDNA uttryck plasmider under de senaste åren har underlättat metoder där cellinjer överuttryck cDNAs kodning cellyteceptorer screenas för bindning av rekombinanta proteiner för att identifiera interaktioner9,10. CDNA overexpression-baserade metoder, till skillnad från rekombinanta proteinbaserade metoder, ger möjlighet att identifiera interaktioner i samband med plasmamembranet. Framgången med att använda cDNA-uttryckskonstruktioner beror dock på cellernas förmåga att överuttrycka proteinet i korrekt vikt form, men detta kräver ofta cellulära tillbehörsfaktorer som transportörer, förkläde och korrekt oligomeric-sammansättning. Att transfecting en enda cDNA kan därför inte vara tillräckligt för att uppnå cellytan uttryck.
Screeningtekniker med hjälp av cDNA-konstruktioner eller rekombinanta proteinsonder är resurskrävande och kräver stora samlingar av cDNA- eller rekombinanta proteinbibliotek. Särskilt utformade masspektrometribaserade metoder har nyligen använts för att identifiera extracellulära interaktioner som inte kräver montering av stora bibliotek. Dessa tekniker kräver dock kemisk manipulering av cellytan, vilket kan förändra den biokemiska karaktären hos de molekyler som finns på cellernas yta och som för närvarande endast är tillämpliga för interaktioner som medierats av glykosylaterade proteiner11,12. Majoriteten av de för närvarande tillgängliga metoderna fokuserar också kraftigt på interaktioner mellan proteiner samtidigt som man till stor del ignorerar bidraget från membranemikromiljön, inklusive molekyler som glykaner, lipider och kolesterol.
Den senaste tidens utveckling av högeffektiv bialleleic inriktning med hjälp av CRISPR-baserade metoder har möjliggjort genom-skala bibliotek av celler som saknar definierade gener i en enda pool som kan screenas på ett systematiskt och opartiskt sätt att identifiera cellulära komponenter som är involverade i olika sammanhang, inklusive dissekering av cellulära signalprocesser, identifiering av störningar som ger resistens mot läkemedel, toxiner och patogener, och bestämma specificitet av antikroppar13,,14,,15,16. Här beskriver vi en genomskalas CRISPR-baserad knockoutcellscreeninganalys som ger ett alternativ till de nuvarande biokemiska metoderna för att identifiera extracellulära receptor-ligandinteraktioner. Detta tillvägagångssätt för att identifiera interaktioner som medieras av membranreceptorer genom genetiska skärmar är särskilt lämpligt för forskare som har ett fokuserat intresse för enskilda ligander eftersom det undviker behovet av att sammanställa stora bibliotek av cDNAs eller rekombinanta proteiner.
Denna analys består av tre huvudsteg: 1) Mycket ivrig rekombinant protein bindande sonder som består av de extracellulära regionerna av en receptor av intresse produceras och används i fluorescens-baserade flöde cytometri-baserade bindande analyser; 2) De bindande analyserna används för att identifiera en cellinje som uttrycker interaktionspartnern för den rekombinanta proteinsonden; 3) En Cas9-uttrycksversion av cellinjen som interagerar med det protein som är av intresse produceras och en genomskalas CRISPR/Cas9-baserad knockoutskärm utförs (figur 1). I denna genetiska skärm används bindning av ett rekombinant protein till cellinjer som en mätbar fenotyp där celler i knockout-biblioteket som har förlorat förmågan att binda sonden sorteras med fluorescensbaserad aktiverad cellsortering (FACS) och de gener som orsakade förlusten av den bindande fenotyp som identifierats genom sekvensering. I princip identifieras de gener som kodar den receptor som är ansvarig för att binda ivrigsonden och de som krävs för dess cellyt display.
Det första steget i detta protokoll innebär produktion av ivrig rekombinanta proteinsonder som representerar ectodomain av de membranbundna receptorerna. Dessa receptorer är kända för att ofta behålla sina extracellulära bindningsfunktioner när deras ectodomainer uttrycks som ett rekombinantlösligt protein1. För ett protein av intresse kan lösliga rekombinanta proteiner produceras i alla lämpliga eukaryota proteinuttryckssystem i alla format, förutsatt att det kan oligomeriseras för ökad bindningsaviditet, och det innehåller taggar som kan användas i fluorescensbaserade flödescytometribaserade bindningsanalyser (t.ex. FLAG-tag, biotin-tag). Detaljerade protokoll för produktion av lösliga ectodomainer av membranreceptorer med hjälp av HEK293 proteinuttryckssystem, samt olika multimeriseringstekniker och proteinuttryckskonstruktioner för produktion av både pentameriska proteiner och monomeraproteiner har tidigare beskrivits1,17. Protokollet här kommer att beskriva stegen för att generera fluorescerande ivrig sonder från monomera biotinylerade proteiner genom att konjugera dem till streptavidin konjugerade till en fluorokrom (t.ex. fykoerythrin, eller PE), som kan användas direkt i cellbaserade bindande analyser och har fördelen av att inte kräva en sekundär antikropp för detektion. Allmänna protokoll för att utföra genom-skala skärmar har redan beskrivits20,21, vilket protokollet främst fokusera på detaljerna i utför flöde cytometri-baserade rekombinanta protein bindande skärmar med hjälp av CRISPR/Cas9 knockout screening system med hjälp av Human V1 (“Yusa”) bibliotek18.
En CRISPR-baserad screeningstrategi för att identifiera gener som kodar cellulära komponenter som är involverade i cellulär igenkänning beskrivs. Ett liknande tillvägagångssätt med CRISPR-aktivering ger också ett genetiskt alternativ för att identifiera direkt interagerande receptorer av rekombinanta proteiner utan att behöva generera stora proteinbibliotek26. En stor fördel med detta tillvägagångssätt är dock att det är tillämpligt på interaktioner medierade av ytmolekyler som inbyggt visas på cellen och inte beror på överuttryck av receptorer, vilket kan påverka receptorns bindande aviditet. Till skillnad från andra metoder, därför gör denna teknik inga antaganden om biokemisk natur eller cellbiologi av receptorerna och ger en möjlighet att studera interaktioner medierad av proteiner som normalt är svåra att studera med hjälp av biokemiska metoder, såsom mycket stora proteiner, eller de som korsar membranet flera gånger eller bildar komplex med andra proteiner, och andra molekyler än proteiner såsom glykaner, glykolipider och fosfolipider. Med tanke på metodens genomskalaskaraktär har detta tillvägagångssätt också fördelen att inte bara identifiera receptorn utan även ytterligare cellulära komponenter som krävs för den bindande händelsen, vilket ger insikter i receptorns cellbiologi.
En av de viktigaste begränsningarna med denna metod när du använder den för att identifiera receptorn för ett särläkemedel protein är det ursprungliga kravet att först identifiera en cellinje som binder till proteinet. Detta är inte alltid lätt och identifiera en cellinje som visar en bindande fenotyp som också är tillåtande för genetiska skärmar kan vara det tidsbegränsande steget för att distribuera denna analys. Vissa cellinjer tenderar att binda till fler proteiner än andra. Detta är särskilt relevant för proteiner som binder HS, eftersom dessa proteiner tenderar att binda till någon cellinje som visar HS sidokedjor, oavsett den inhemska bindande sammanhang. Dessutom har vi observerat att uppreglering av syndekaner (dvs. proteoglykaner som innehåller HS) i cellinjer leder till ökad bindning av HS-bindande proteiner26. Detta kan vara en faktor att ta hänsyn till när du väljer cellinjen för screening. Men också viktigt att notera är att tillsatsbindningen av HS inte stör bindningen till en specifik receptor. Detta innebär att om bindningen följs är det möjligt att den endast förmedlas av HS, eftersom den bindning som HS förmedlar i denna analys är additiv snarare än medberoende19. I ett sådant scenario kan heparinblockeringsmetoden identifiera sådana beteenden utan att behöva utföra en hel genetisk skärm.
En användbar resurs för att välja cellinjer är Cell Model Passport, som innehåller genomik, transkriptomik och kulturvillkorsinformation för ~1 000 cancercelllinjer27. Beroende på det biologiska sammanhanget kan celler väljas baserat på deras uttrycksprofiler. För att underlätta valet av cellinjer, grupperade vi ~ 1.000 cellinjer i Cell Modell Passport enligt uttrycket ~1.500 föranmälda mänskliga cellen yta glykoproteiner28 (Kompletterande figur 2; kluster information för varje cellinje tillsammans med tillväxtvillkor finns i kompletterande tabell 2). Vid testning av bindning av ett protein med okänd funktion är det användbart att välja en panel av representativa cellinjer från varje kluster för att öka risken för att täcka ett brett spektrum av receptorer. Med tanke på ett val, rekommenderas att välja cellinjer som är lätta att odla och lätt att transduce. Eftersom dessa cellinjer kommer att användas vid genomskalasscreening är det bättre att de lätt kan odlas i stora mängder och är tillåtande förlentiviral transduktion, eftersom det är den vanligaste metoden för leverans av sgRNA för CRISPR-baserad genetisk screening i de senare stegen.
I allmänhet utförs fenotypvalen i en enda sort. Detta bestäms dock av ljusstyrkan hos den färgade cellpopulationen jämfört med kontrollen. Iterativa urvalsrundor kan antas för scenarier där signal-brus-förhållandet mellan den önskade fenotypen är låg, eller när syftet med skärmen är att identifiera mutanter som har starka fenotyper. När du använder en iterativ urvalsmetod för FACS-baserade skärmar är det viktigt att tänka på att sorteringsprocessen kan orsaka celldöd, främst på grund av sorterarens blotta kraft. Således kommer inte alla insamlade celler att representeras i nästa sortningsrunda.
Bibliotekskomplexitet är en mycket viktig faktor för att utföra framgångsrika genetiska skärmar, särskilt för negativa urvalsskärmar eftersom omfattningen av utarmning i dessa endast kan bestämmas genom att jämföra resultaten med vad som fanns i startbiblioteket. För negativa urvalsskärmar är det vanligt att behålla bibliotek med 500-1 000 x komplexitet. Positiva urvalsskärmar är dock mer robusta för biblioteksstorlekar, eftersom endast ett litet antal mutanter i sådana skärmar förväntas väljas för en viss fenotyp. Därför, i den positiva urvalsskärmen som beskrivs här, kan bibliotekets storlek minskas till 50-100x komplexitet utan att kompromissa med skärmens kvalitet. Dessutom, i dessa skärmar är det också möjligt att använda ett kontrollbibliotek för en viss cellinje på en viss dag som en “allmän kontroll” för alla prover sorterade på dagen för den angivna cellinjen. Detta minskar antalet kontrollbibliotek som behöver produceras och sekvenseras.
En annan viktig faktor för att använda detta tillvägagångssätt är begränsningarna av förlust av funktion skärmar för att identifiera gener som är nödvändiga för in vitro-celltillväxt. Tidpunkten för skärmarna är avgörande i detta avseende, eftersom ju längre de muterade cellerna hålls i kultur, desto högre är sannolikheten att celler med mutationer i viktiga gener blir olönsam och inte längre representeras i mutantbiblioteket. De senaste genetiska skärmarna som utförs som en del av project score-initiativet i över 300 cellinjer visar att flera gener i KEGG-kommenterade proteinsekretion och N-glykosyleringsväg ofta identifieras som nödvändiga för ett antal cellinjer(tilläggsbild 3)29. Detta kan beaktas vid utformningen av skärmar om effekten av gener som krävs för spridning och livskraft ska undersökas i samband med cellulär igenkänningsprocess. I detta fall skulle det i allmänhet vara lämpligt att utföra skärmar vid en tidig tidpunkt (t.ex. posttransduktion dag 9). Men om metoden används för att identifiera några mål med starka storlekseffekter snarare än allmänna cellulära vägar, kan det vara lämpligt att utföra skärmar vid en senare tidpunkt (t.ex. dag 15-16 posttransduktion).
Resultaten från screeningen är mycket robusta. i åtta rekombinanta proteinbindningsskärmar som utförts tidigare var cellytans receptor den översta träffen i varje fall19. När man använder denna metod för att identifiera interaktionspartnern bör man därför förvänta sig att receptorn och de faktorer som bidrar till dess presentation på ytan identifieras med högt statistiskt förtroende. När skärmen utförs och en träff valideras med hjälp av en enda gRNA knockout, ytterligare uppföljningar kan utföras med hjälp av befintliga biokemiska metoder såsom AVEXIS4 och direkt mättnad bindning av renade proteiner med hjälp av ytan plasmon resonans. Den metod som beskrivs här är tillämplig för alla proteiner för vilka det är möjligt att generera en löslig rekombinant bindningssond.
Sammanfattningsvis är detta en genomskalad CRISPR knockout-metod för att identifiera interaktioner som medierats av cellytproteiner. Denna metod är i allmänhet tillämplig för att identifiera cellulära vägar som krävs för att igenkänna cellytan i ett brett spektrum av olika biologiska sammanhang, bland annat mellan en organisms egna celler (t.ex. neurala och immunologiska erkännanden), samt mellan värdceller och patogenproteiner. Denna metod ger ett genetiskt alternativ till biokemiska metoder avsedda för receptoridentifiering, och eftersom det inte kräver några tidigare antaganden om den biokemiska naturen eller cellbiologi receptorerna har stor potential att göra helt oväntade upptäckter.
The authors have nothing to disclose.
Detta arbete stöddes av Wellcome Trust grant nummer 206194 som tilldelades GJW. Vi tackar Cytometry Core anläggningen: Bee Ling Ng, Jennifer Graham, Sam Thompson, och Christopher Hall för hjälp med FACS.
Anti-mouse alkaline phosphatase | Sigma | A4656 | |
Blasticidin | Chem-Cruz | SC-204655 | |
Blood & Cell Culture DNA Maxi Kit | Qiagen | 13362 | |
BSA | Sigma | A9647-100G | |
Diethanolamine | Sigma | 398179 | |
DMEM | Gibco | 31966-021 | |
Dneasy Blood and Tissue kit | Qiagen | 69504 | |
DynaMag-96 Side Magnet | Invitrogen | 12331D | |
HEK293T packaging cells | ATCC | CRL-3216 | |
Heparin | Sigma | H4784-1G | |
KAPA HiFi HotStart ReadyMix | Kapa | KK2602 | |
Lipofectamine LTX with PLUS reagent | Invitrogen | 15338100 | |
MoFlo XDP cell sorter | BD | ||
Ni2+-NTA agarose beads | Jena Bioscience | AC-501-25 | |
OPTI-MEM | Life Technologies | 31985-070 | |
OX-68 antibody | AbD Serotec | MCA1022R | |
p-nitrophenyl phosphate | Sigma | 1040-506 | |
PD-10 desalting columns | GE healthcare | 17085101 | |
Polybrene | Millipore | TR-1003-G | |
Polypropylene tubes with 5 mL bed volume | Qiagen | 34964 | |
Proteinase K, recombinant, PCR Grade | Roche | 3115879001 | |
Puromycin | Gibco | A11138-03 | |
Q5 Hot Start High-Fidelity 2× Master Mix | NEB | M0494L | |
QIAquick PCR purification kit | Qiagen | 28104 | |
SCFA filter | Nalgene | 190-2545 | |
Sony Cell sorter | Sony | ||
SPRI beads (Agencourt AMPure XP beads) | Beckman | A63881 | |
Streptavidin-coated microtitre plates | Nalgene | 734-1284 | |
Streptavidin-PE | Biolegend | 405204 |