Dette manuskript beskriver en genom-skala celle-baseret screening tilgang til at identificere ekstracellulære receptor-ligand interaktioner.
Intercellulære kommunikation medieret af direkte interaktioner mellem membran-indlejrede celleoverflade receptorer er afgørende for den normale udvikling og funktion af flercellede organismer. Detektering af disse interaktioner er dog fortsat teknisk udfordrende. Dette manuskript beskriver en systematisk genom-skala CRISPR/Cas9 knockout genetisk screening tilgang, der afslører cellulære veje, der kræves for specifikke celle overflade anerkendelse begivenheder. Denne analyse udnytter rekombinant proteiner produceret i et pattedyr protein ekspression system som ivrig bindende sonder til at identificere interaktion partnere i en celle-baseret genetisk skærm. Denne metode kan anvendes til at identificere de gener, der er nødvendige for celleoverfladeinteraktioner, der påvises ved rekombinant bindingssonder, der svarer til ektodomæner af membraninfæsterede receptorer. Det er vigtigt, i betragtning af genom-skala karakter af denne tilgang, det har også den fordel, at ikke kun identificere den direkte receptor, men også de cellulære komponenter, der er nødvendige for præsentationen af receptoren på celleoverfladen, hvilket giver værdifuld indsigt i biologi receptoren.
Ekstracellulære interaktioner af celleoverflade receptor proteiner direkte vigtige biologiske processer såsom væv organisation, vært-patogen anerkendelse, og immun regulering. Undersøgelse af disse interaktioner er af interesse for det bredere biomedicinske samfund, fordi membranreceptorer er handlingsrettede mål for systematisk leverede terapeutiske såsom monoklonale antistoffer. På trods af deres betydning er det teknisk udfordrende at studere disse interaktioner. Dette skyldes hovedsageligt, at membran-indlejrede receptorer er amfipatiske, hvilket gør dem vanskelige at isolere fra biologiske membraner til biokemisk manipulation, og deres interaktioner er karakteriseret ved de svage interaktion tilhørsforhold(KDs i μM-mM rækkevidde)1. Derfor er mange almindeligt anvendte metoder uegnede til at påvise denne klasse af proteininteraktioner1,2.
En række metoder er blevet udviklet til specifikt at undersøge ekstracellulære receptor-ligand interaktioner, der tager deres unikke biokemiske egenskaber i betragtning3. En række af disse tilgange indebærer, at hele ectodomain af en receptor som et opløseligt rekombinant protein i pattedyr eller insektcellebaserede systemer for at sikre, at disse proteiner indeholder posttranslationelle ændringer, der er strukturelt vigtige, såsom glycaner og disulfidbindinger. For at overvinde den lave affinitet bindende, er ectodomains ofte oligomerized at øge deres bindende begærlighed. Avid proteinektodomæner er med succes blevet anvendt som bindende sonder til at identificere interaktionspartnere i direkte rekombinant proteinproteininteraktionsskærme4,5,6,7. Mens bredt vellykket, rekombinant protein-baserede metoder kræver, at ektodomæne af en membran receptor produceres som et opløseligt protein. Det gælder derfor kun generelt for proteiner, der indeholder en sammenhængende ekstracellulær region (f.eks. enkeltpastype I, type II eller GPI-forankret) og er generelt ikke egnet til receptorkomplekser og membranproteiner, der spænder over membranen flere gange.
Ekspressionskloningsteknikker, hvor et bibliotek med supplerende DNO’er (cDA’er) transficeres til celler og testes for en gain-of-binding fænotype er også blevet brugt til at identificere ekstracellulære protein-protein interaktioner8. Tilgængeligheden af store samlinger af klonede og sekvenserede cDNA-ekspressionsplasmider i de senere år har lettet metoder , hvor cellelinjer, der overekspressende cDNAs-kodningscellereceptorer, screenes for binding af rekombinant proteiner for at identificere interaktioner9,10. CDNA-overekspressionsbaserede tilgange giver i modsætning til rekombinant proteinbaserede metoder mulighed for at identificere interaktioner i forbindelse med plasmamembranen. Men succesen med at bruge cDNA udtryk konstruktioner afhænger af cellernes evne til at overudtryke proteinet i korrekt foldet form, men dette kræver ofte cellulære tilbehørsfaktorer såsom transportører, chaperoner og korrekt oligomerer forsamling. Transfecting en enkelt cDNA kan derfor ikke være nok til at opnå celleoverfladeudtryk.
Screeningsteknikker ved hjælp af cDNA-konstruktioner eller rekombinant proteinsonder er ressourcekrævende og kræver store samlinger af cDNA- eller rekombinant proteinbiblioteker. Specielt designet massespektrometri-baserede metoder er blevet brugt for nylig til at identificere ekstracellulære interaktioner, der ikke kræver samling af store biblioteker. Disse teknikker kræver imidlertid kemisk manipulation af celleoverfladen, som kan ændre den biokemiske karakter af de molekyler, der findes på cellernes overflade, og som i øjeblikket kun kan anvendes til interaktioner medieret af glycosylerede proteiner11,12. De fleste af de nuværende tilgængelige metoder også stærkt fokusere på samspillet mellem proteiner, mens stort set ignorerer bidraget fra membranen mikromiljø, herunder molekyler som glykaniner, lipider, og kolesterol.
Den seneste udvikling af højeffektiv bialleleic målretning ved hjælp af CRISPR-baserede tilgange har gjort det muligt genom-skala biblioteker af celler mangler definerede gener i en enkelt pulje, der kan screenes på en systematisk og upartisk måde at identificere cellulære komponenter, der er involveret i forskellige sammenhænge, herunder dissekering af cellesignaler, identifikation af forstyrrelser, der giver resistens over for lægemidler, toksiner og patogener, og bestemmelse af antistoffernesspecificitet 13,,14,15og16. Her beskriver vi en CRISPR-baseret knockoutcellescreeningsanalyse i genomskala, der giver et alternativ til de nuværende biokemiske tilgange til at identificere ekstracellulære receptor-ligandinteraktioner. Denne tilgang til at identificere interaktioner medieret af membran receptorer af genetiske skærme er særligt velegnet til forskere, der har en fokuseret interesse på de enkelte ligander, fordi det undgår behovet for at udarbejde store biblioteker af cDNAs eller rekombinant proteiner.
Denne analyse består af tre hovedtrin: 1) Meget ivrige rekombinant proteinbindingssonder bestående af ekstracellulære områder af en modtagende receptor produceres og anvendes i fluorescensbaserede flowcytometry-baserede bindende analyser; 2) De bindende analyser bruges til at identificere en cellelinje, der udtrykker interaktion partner rekombinant protein sonden; 3) Der produceres en Cas9-ekspresserende version af cellelinjen, der interagerer med det pågældende protein, og der udføres en genome-skala CRISPR/Cas9-baseret knockoutskærm (Figur 1). På denne genetiske skærm anvendes binding af et rekombinant protein til cellelinjer som en målbar fænotype, hvor celler i knockoutbiblioteket, der har mistet evnen til at binde sonden, sorteres ved hjælp af fluorescensbaseret aktiveret cellesortering (FACS) og de gener, der forårsagede tabet af den bindende fænotype, der identificeres ved sekvensering. I princippet identificeres de gener, der kodificerer den receptor, der er ansvarlig for bindingen af den ivrige sonde, og de gener, der kræves til dens celleoverfladedisplay.
Det første trin i denne protokol indebærer produktion af ivrige rekombinant proteinsonder, der repræsenterer ektodomænet for de membranbundne receptorer. Disse receptorer er kendt for ofte at bevare deres ekstracellulære bindingsfunktioner, når deres ektodomæner udtrykkes som et rekombinant opløseligt protein1. For et protein af interesse, opløselige rekombinant proteiner kan produceres i enhver egnet eukaryote protein ekspression system i ethvert format, forudsat at det kan oligomerized for øget bindende avidity, og det indeholder tags, der kan bruges i fluorescens-baserede flow cytometri-baserede bindende analyser (f.eks FLAG-tag, biotin-tag). Detaljerede protokoller for produktion af opløselige ektodomæner af membranreceptorer ved hjælp af HEK293-proteinekspressionssystemet samt forskellige multimerizationsteknikker og proteinudtrykskonstruktioner til produktion af både pentamericproteiner og monomeriske proteiner er tidligere beskrevet1,17. Protokollen her vil beskrive trinene til generering af fluorescerende avid sonder fra monomererede biotinylerede proteiner ved at konjugere dem til streptavidin konjugeret til en fluorochrome (f.eks phycoerythrin, eller PE), som kan anvendes direkte i celle-baserede bindende assays og har den fordel, at der ikke kræver et sekundært antistof til påvisning. Generelle protokoller for udførelse af genomskalaskærme er allerede blevet beskrevet20,21, og protokollen fokuserer således primært på detaljerne i at udføre flowcytometribaserede rekombinant proteinbindingsskærme ved hjælp af CRISPR/Cas9-knockoutscreeningssystemet ved hjælp af Human V1 -biblioteket (“Yusa”)18.
En CRISPR-baseret screeningstrategi til identifikation af gener, der kodning cellulære komponenter, der er involveret i cellulære anerkendelse er beskrevet. En lignende tilgang ved hjælp af CRISPR aktivering giver også et genetisk alternativ til at identificere direkte interagerende receptorer af rekombinant proteiner uden behov for at generere store proteinbiblioteker26. Men en stor fordel ved denne tilgang er, at det gælder for interaktioner medieret af overflade molekyler indbygget vises på cellen og ikke afhænger af overekspression af receptorer, som kan påvirke bindende begærlighed af receptoren. I modsætning til andre metoder, derfor denne teknik giver ingen antagelser om den biokemiske karakter eller cellebiologi af receptorer og giver mulighed for at studere interaktioner medieret af proteiner, der normalt er vanskelige at studere ved hjælp af biokemiske tilgange, såsom meget store proteiner, eller dem, der krydser membranen flere gange eller danne komplekser med andre proteiner, og andre molekyler end proteiner såsom glycaner, gliplycoids, og fosfolipider. I betragtning af metodens genomskala har denne tilgang også den fordel, at den ikke kun identificerer receptoren, men også yderligere cellulære komponenter, der er nødvendige for den bindende begivenhed, hvilket giver indsigt i receptorens cellebiologi.
En af de vigtigste begrænsninger ved denne metode, når du bruger den til at identificere receptoren af et forældreløst protein, er det oprindelige krav om først at identificere en cellelinje, der binder sig til proteinet. Dette er ikke altid let og identificere en celle linje, der viser en bindende fænotype, der også er eftergivende til genetiske skærme kan være den tidsbegrænsende skridt for at implementere denne analyse. Nogle cellelinjer har tendens til at binde sig til flere proteiner end andre. Dette er især relevant for proteiner, der binder HS, fordi disse proteiner har tendens til at binde sig til enhver cellelinje, der viser HS sidekæder, uanset den oprindelige bindingskontekst. Derudover har vi observeret, at opregulering af syndekaner (dvs. proteoglycaner, der indeholder HS) i cellelinjer fører til øget binding af HS-bindende proteiner26. Dette kan være en faktor, der skal tages i betragtning, når du vælger cellelinjen til screening. Men også vigtigt at bemærke er, at tilsætningsstoffet binding af HS ikke forstyrrer bindingen til en bestemt receptor. Det betyder, at hvis bindingen overholdes, er det muligt, at det er medieret udelukkende af HS, fordi den binding, der er medieret af HS i denne analyse, er additiv snarere end codependent19. I et sådant scenario, heparin blokering beskrevet kan identificere en sådan adfærd uden at have behov for at udføre en fuld genetisk skærm.
En nyttig ressource til at vælge cellelinjer er Cell Model Passport, som indeholder genomforskning, transskriptioner og oplysninger om kulturtilstand for ~1.000 kræftcellelinjer27. Afhængigt af den biologiske kontekst kan celler vælges baseret på deres udtryksprofiler. For at hjælpe med udvælgelsen af cellelinjer grupperede vi ~1.000 cellelinjer i cellemodelpas i henhold til udtrykket ~1.500 præannoterede humane celleoverfladeglykoproteiner28 (Supplerende figur 2; klyngeoplysninger for hver cellelinje sammen med vækstbetingelser findes i supplerende tabel 2). Når du tester bindingen af et protein med ukendt funktion, er det nyttigt at vælge et panel af repræsentative cellelinjer fra hver klynge for at øge chancen for at dække en bred vifte af receptorer. Givet et valg, anbefales det at vælge cellelinjer, der er nemme at kultur og let at transduce. Da disse cellelinjer vil blive anvendt i genom-skala screening, er det at foretrække, at de kan dyrkes let i store mængder og er eftergivende over for lentiviral transduktion, fordi det er den mest almindeligt tilgængelige metode til levering af sgRNA for CRISPR-baseret genetisk screening i de senere trin.
Generelt udføres fænotypevalgene i en enkelt slags. Dette bestemmes dog af lysstyrken af den farvede cellepopulation sammenlignet med kontrollen. Iterative valgrunder kan vedtages for scenarier, hvor signal-støj-forholdet for den ønskede fænotype er lavt, eller når formålet med skærmen er at identificere mutanter, der har stærke fænotyper. Når du bruger en iterativ udvælgelsesmetode for FACS-baserede skærme, er det vigtigt at overveje, at sorteringsprocessen kan forårsage celledød, hovedsagelig på grund af sorteringsmaskinens store kraft. Således vil ikke alle indsamlede celler være repræsenteret i den næste runde af sortering.
Bibliotekskompleksitet er en meget vigtig faktor i udførelsen af vellykkede genetiske skærme, især for negative udvælgelsesskærme, fordi omfanget af udtynding i disse kun kan bestemmes ved at sammenligne resultater med det, der var til stede i startbiblioteket. For negative markeringsskærme er det almindeligt at vedligeholde biblioteker med en kompleksitet på 500-1.000 x. Positive valgskærme er dog mere robuste over for biblioteksstørrelser, fordi der på sådanne skærme kun forventes et lille antal mutanter at blive udvalgt til en bestemt fænotype. Derfor kan bibliotekets størrelse på den positive markeringsskærm, der er beskrevet her, reduceres til 50-100x kompleksitet uden at gå på kompromis med skærmens kvalitet. Hertil kommer, at i disse skærme er det også muligt at bruge et kontrolbibliotek for en given cellelinje på en given dag som en “generel kontrol” for alle prøver sorteret på dagen for den givne cellelinje. Dette vil reducere antallet af kontrolbiblioteker, der skal produceres og sekvenseres.
En anden vigtig overvejelse for at bruge denne tilgang er begrænsningerne ved tab af funktionsskærme i forbindelse med identifikation af gener, der er afgørende for in vitro cellevækst. Timingen af skærmene er afgørende i denne henseende, da jo længere mutantcellerne holdes i kultur, jo større er sandsynligheden for, at celler med mutationer i essentielle gener bliver ikke-levedygtige og ikke længere er repræsenteret i det mutante bibliotek. De seneste genetiske skærme, der er udført som en del af Project Score-initiativet i over 300 cellelinjer, viser, at flere gener i KEGG-annoteret proteinsekretion og N-glycosylationsvejen ofte identificeres som værende væsentlige for en række cellelinjer (supplerende figur 3)29. Dette kan tages i betragtning ved udformningen af skærme, hvis virkningen af gener, der er nødvendige for spredning og levedygtighed, skal undersøges i forbindelse med cellegenkendelsesprocessen. I dette tilfælde vil det generelt være hensigtsmæssigt at udføre skærme på et tidligt tidspunkt (f.eks. dag 9 efter overtransmuktionen). Men hvis tilgangen bruges til at identificere nogle få mål med stærke størrelseseffekter i stedet for generelle cellulære veje, kan det være hensigtsmæssigt at udføre skærme på et senere tidspunkt (f.eks. dag 15-16 eftertransduktion).
Resultaterne af screeningen er meget robuste. i otte rekombinant protein bindende skærme udført i fortiden, cellen overflade receptor var den øverste hit i hvert tilfælde19. Når man anvender denne metode til at identificere interaktionspartneren, bør man derfor forvente, at receptoren og de faktorer, der bidrager til dens præsentation på overfladen, identificeres med en høj statistisk tillid. Når skærmen er udført, og et hit er valideret ved hjælp af en enkelt gRNA knockout, yderligere opfølgninger kan udføres ved hjælp af eksisterende biokemiske metoder såsom AVEXIS4 og direkte mættet binding af renset proteiner ved hjælp af overflade plasmon resonans. Den her beskrevne fremgangsmåde gælder for alle proteiner, for hvilke det er muligt at generere en opløselig rekombinant bindingssonde.
Sammenfattende er dette en genom-skala CRISPR knockout tilgang til at identificere interaktioner medieret af celleoverflade proteiner. Denne metode kan generelt anvendes til at identificere celleveje, der kræves til cellere overfladegenkendelse i en lang række forskellige biologiske sammenhænge, herunder mellem en organismes egne celler (f.eks. neural og immunologisk genkendelse) samt mellem værtsceller og patogenproteiner. Denne metode giver et genetisk alternativ til biokemiske tilgange designet til receptor identifikation, og fordi det ikke kræver nogen forudgående antagelser om den biokemiske karakter eller cellebiologi af receptorer det har et stort potentiale for at gøre helt uventede opdagelser.
The authors have nothing to disclose.
Dette arbejde blev støttet af Wellcome Trust-tilskudsnummeret 206194 tildelt GJW. Vi takker Cytometry Core facilitet: Bee Ling Ng, Jennifer Graham, Sam Thompson, og Christopher Hall for hjælp med FACS.
Anti-mouse alkaline phosphatase | Sigma | A4656 | |
Blasticidin | Chem-Cruz | SC-204655 | |
Blood & Cell Culture DNA Maxi Kit | Qiagen | 13362 | |
BSA | Sigma | A9647-100G | |
Diethanolamine | Sigma | 398179 | |
DMEM | Gibco | 31966-021 | |
Dneasy Blood and Tissue kit | Qiagen | 69504 | |
DynaMag-96 Side Magnet | Invitrogen | 12331D | |
HEK293T packaging cells | ATCC | CRL-3216 | |
Heparin | Sigma | H4784-1G | |
KAPA HiFi HotStart ReadyMix | Kapa | KK2602 | |
Lipofectamine LTX with PLUS reagent | Invitrogen | 15338100 | |
MoFlo XDP cell sorter | BD | ||
Ni2+-NTA agarose beads | Jena Bioscience | AC-501-25 | |
OPTI-MEM | Life Technologies | 31985-070 | |
OX-68 antibody | AbD Serotec | MCA1022R | |
p-nitrophenyl phosphate | Sigma | 1040-506 | |
PD-10 desalting columns | GE healthcare | 17085101 | |
Polybrene | Millipore | TR-1003-G | |
Polypropylene tubes with 5 mL bed volume | Qiagen | 34964 | |
Proteinase K, recombinant, PCR Grade | Roche | 3115879001 | |
Puromycin | Gibco | A11138-03 | |
Q5 Hot Start High-Fidelity 2× Master Mix | NEB | M0494L | |
QIAquick PCR purification kit | Qiagen | 28104 | |
SCFA filter | Nalgene | 190-2545 | |
Sony Cell sorter | Sony | ||
SPRI beads (Agencourt AMPure XP beads) | Beckman | A63881 | |
Streptavidin-coated microtitre plates | Nalgene | 734-1284 | |
Streptavidin-PE | Biolegend | 405204 |