Dette papir beskriver den komplette XChem-proces til krystalbaseret fragmentscreening, startende fra ansøgning om adgang og alle efterfølgende trin til dataformidling.
I fragmentbaseret lægemiddelopdagelse testes hundreder eller ofte tusinder af forbindelser mindre end ~ 300 Da mod proteinet af interesse for at identificere kemiske enheder, der kan udvikles til potente lægemiddelkandidater. Da forbindelserne er små, er interaktionerne svage, og screeningsmetoden skal derfor være meget følsom; Desuden har strukturelle oplysninger tendens til at være afgørende for at uddybe disse hits til blylignende forbindelser. Derfor har proteinkrystallografi altid været en guldstandardteknik, men historisk set for udfordrende til at finde udbredt anvendelse som en primær skærm.
Indledende XChem-eksperimenter blev demonstreret i 2014 og derefter afprøvet med akademiske og industrielle samarbejdspartnere for at validere processen. Siden da har en stor forskningsindsats og betydelig stråletid strømlinet prøveforberedelsen, udviklet et fragmentbibliotek med hurtige opfølgningsmuligheder, automatiseret og forbedret I04-1 beamlines kapacitet til ubemandet dataindsamling og implementeret nye værktøjer til datastyring, analyse og hitidentifikation.
XChem er nu en facilitet til storskala krystallografisk fragmentscreening, der understøtter hele krystaller-til-aflejring-processen og tilgængelig for akademiske og industrielle brugere over hele verden. Det peer-reviewed akademiske brugerprogram er blevet aktivt udviklet siden 2016 for at imødekomme projekter fra så bredt et videnskabeligt omfang som muligt, herunder velvaliderede såvel som sonderende projekter. Akademisk adgang tildeles gennem halvårlige indkaldelser af peer-reviewed forslag, og proprietært arbejde arrangeres af Diamonds Industrial Liaison Group. Denne arbejdsgang er allerede rutinemæssigt blevet anvendt på over hundrede mål fra forskellige terapeutiske områder og identificerer effektivt svage bindemidler (1% -30% hitrate), som både tjener som udgangspunkt af høj kvalitet til sammensat design og giver omfattende strukturel information om bindingssteder. Processens modstandsdygtighed blev demonstreret ved fortsat screening af sars-CoV-2-mål under covid-19-pandemien, herunder en 3-ugers turn-around for hovedproteasen.
Fragment-Based Drug Discovery (FBDD) er en udbredt strategi for blyopdagelse, og siden dens fremkomst for 25 år siden har den leveret fire lægemidler til klinisk brug, og mere end 40 molekyler er blevet avanceret til kliniske forsøg 1,2,3. Fragmenter er små kemiske enheder, normalt med en molekylvægt på 300 Da eller mindre. De er udvalgt på grund af deres lave kemiske kompleksitet, som giver gode udgangspunkter for udvikling af stærkt ligandeffektive hæmmere med fremragende fysisk-kemiske egenskaber. Deres størrelse betyder, at de sampler proteinernes bindingslandskab mere grundigt end biblioteker af større lægemiddel- eller blylignende forbindelser og dermed også afslører hot spots og formodede allosteriske steder. Kombineret med strukturel information giver fragmenter et detaljeret kort over de potentielle molekylære interaktioner mellem protein og ligand. Pålidelig påvisning og validering af disse enheder, som har tendens til at binde svagt til målproteinet, kræver ikke desto mindre en række robuste og følsomme biofysiske screeningsmetoder såsom overfladeplasmonresonans (SPR), kernemagnetisk resonans (NMR) eller isotermisk titreringskalorimetri (ITC)4,5.
Røntgenkrystallografi er en væsentlig del af FBDD-værktøjssættet: det er følsomt nok til at identificere svage bindemidler og giver direkte strukturel information om interaktionerne på molekylært niveau. Det er komplementært til andre biofysiske skærme og normalt afgørende for at udvikle fragmenthits til blyforbindelser; det kræver krystalsystemer af høj kvalitet, hvilket betyder, at krystallisering er meget reproducerbar, og krystaller ideelt diffrakterer til bedre end 2,8 Å opløsning.
Historisk set har det været meget vanskeligt at bruge krystallografi som primær fragmentskærm 6,7,8, hvad enten det er i den akademiske verden eller i industrien. I modsætning hertil opnåede synkrotroner størrelsesordensforbedringer inden for robotteknologi, automatisering 9,10,11 og detektorteknologi 12,13, og kombineret med lige accelereret computerkraft og algoritmer til databehandling14,15,16 kan komplette diffraktionsdatasæt måles i sekunder og et stort antal af dem helt uden opsyn, som banebrydende på LillyCAT7 og senere MASSIF17,18 (European Synchrotron Radiation Facility (ESRF)). Dette førte synkrotroner til at udvikle meget strømlinede platforme for at gøre krystalbaseret fragmentscreening som primær skærm tilgængelig for et bredt brugerfællesskab (XChem at Diamond; CrystalDirect på EMBL/ESRF19; BESSY på Helmholtz-Zentrum Berlin20; FragMax på MaxIV21).
Dette papir dokumenterer de protokoller, der udgør XChem-platformen til fragmentscreening ved røntgenkrystallografi, fra prøveforberedelse til de endelige strukturelle resultater af 3D-modellerede hits. Rørledningen (figur 1) krævede udvikling af nye tilgange til krystalidentifikation22, blødgøring 23 og høstning24 samt datastyringssoftware 25 og en algoritmisk tilgang til identifikation af fragmenter 26, der nu er meget udbredt i samfundet. Krystalhøstningsteknologien sælges nu af en leverandør (se materialetabellen), og den åbne tilgængelighed af værktøjerne har gjort det muligt for andre synkrotroner at tilpasse dem til at oprette tilsvarende platforme21. Igangværende projekter omhandler dataanalyse, modelfærdiggørelse og dataformidling gennem Fragalyse-platformen27. Prøveforberedelseslaboratoriet støder op til beamline I04-1, hvilket forenkler logistikken med at overføre hundredvis af frosne prøver til strålelinjen, og dedikeret stråletid på I04-1 muliggør hurtig røntgenfeedback til at guide kampagnen.
XChem er en integreret del af Diamonds brugerprogram med to opkald om året (begyndelsen af april og oktober). Peer review-processen er blevet raffineret i samråd med eksperter i lægemiddelopdagelse fra den akademiske verden og industrien. Sammen med en stærk videnskabelig sag kræver forslagsprocessen28 , at ansøgere selv vurderer ikke kun krystalsystemets parathed, men også deres ekspertise inden for biokemiske og ortogonale biofysiske metoder og kapacitet til at udvikle screeningshits gennem opfølgende kemi. Adgangsformerne har også udviklet sig for at imødekomme det tværfaglige brugersamfund:
Niveau 1 (enkeltprojekt ) er for projekter i undersøgelsesfasen, og det er ikke nødvendigt at anvende valideringsværktøjer (biofysik eller biokemiske værktøjer) og opfølgningsstrategier. Hvis projektet accepteres, tildeles projektet et reduceret antal stråletidsskift, nok til bevis for konceptet.
Niveau 2 (enkeltprojekt) er til velvaliderede projekter og kræver, at downstream-værktøjer og opfølgningsstrategier er på plads. Hvis det accepteres, tildeles projektet tilstrækkelig stråletid til en fuld fragmentscreeningskampagne. Enkeltprojekter (tier 1 eller tier 2) skal afsluttes inden for de 6 måneder af tildelingsperioden (enten april til september eller oktober til marts).
Block Allocation Group (BAG) er for et konsortium af grupper og projekter, hvor en robust måludvælgelses- og prioriteringsproces er på plads inden for BAG sammen med en klar opfølgningspipeline. BAG’er skal have mindst én fuldt XChem-uddannet ekspert (superbruger), som koordinerer deres aktiviteter med Diamond-personale og træner BAG-medlemmerne. Det tildelte antal beamtimeskift defineres af antallet af videnskabeligt stærke projekter i BAG og revurderes pr. tildelingsperiode baseret på BAG’s rapport. Adgangen er tilgængelig i 2 år.
XChem-eksperimentet er opdelt i tre faser med et beslutningspunkt for hver af dem: opløsningsmiddeltolerancetest, præ-skærm og hovedskærm (figur 2). Opløsningsmiddeltolerancetesten hjælper med at definere blødgøringsparametrene, mængden af opløsningsmiddel (DMSO, ethylenglycol eller andre kryoprotektorer, hvis det er nødvendigt), krystalsystemet kan tåle, og hvor længe. Opløsningsmiddelkoncentrationer varierer typisk fra 5% -30% over mindst to tidspunkter. Diffraktionsdata indsamles og sammenlignes med krystalsystemets basediffraktion; Dette bestemmer blødgøringsparametrene for det følgende trin. Til forskærmen gennemblødes 100-150 forbindelser under anvendelse af de betingelser, der er bestemt i opløsningsmiddeltesten, og dens formål er at bekræfte, at krystallerne kan tolerere forbindelserne under disse forhold. Om nødvendigt tilsættes kryoprotektanten efterfølgende til de dråber, der allerede indeholder fragmenterne. Succeskriterierne er, at 80% eller mere af krystallerne overlever godt nok til at give diffraktionsdata af god og ensartet kvalitet; Hvis dette mislykkes, revideres blødgøringsbetingelserne normalt ved at ændre blødgøringstiden eller opløsningsmiddelkoncentrationen. Efter en vellykket forundersøgelse kan resten af de forbindelser, der er valgt til eksperimentet, indstilles ved hjælp af de endelige parametre.
Det DSI-pariserede bibliotek (se materialetabel) blev bevidst designet til at muliggøre hurtig opfølgningsprogression ved hjælp af klar kemi29 og har været facilitetens arbejdshestebibliotek. Den er tilgængelig for brugere i en koncentration på 500 mM i DMSO. Akademiske brugere kan også få adgang til andre biblioteker, der leveres af samarbejdspartnere (over 2.000 forbindelser i alt) i koncentrationer på 100-500 mM i DMSO (en komplet liste findes på webstedet28). Meget af den samlede samling er også tilgængelig i ethylenglycol til krystalsystemer, der ikke tåler DMSO. Brugere kan også medbringe deres egne biblioteker, forudsat at de er i plader, der er kompatible med det akustiske væskehåndteringssystem (se materialetabel).
For alle tre trin i eksperimentet (opløsningsmiddelkarakterisering, præ-skærm eller fuld skærm) er følgende prøveforberedelsesprocedurer identiske (figur 3): valg af forbindelsesdispenseringssted gennem billeddannelse og målretning af krystalliseringsdråber med TeXRank22; dispensering i dråber ved hjælp af det akustiske væskedispenseringssystem for både opløsningsmiddel og forbindelser23; effektiv høst af krystallerne ved hjælp af krystalskifteren24; og upload af eksempeloplysninger til beamline-databasen (ISPyB). Den nuværende grænseflade til eksperimentdesign og udførelse er en Excel-baseret applikation (SoakDB), der genererer de nødvendige inputfiler til platformens forskellige udstyr og sporer og registrerer alle resultater i en SQLite-database. Stregkodescannere bruges på forskellige stadier i hele processen til at hjælpe med at spore prøver, og disse data føjes til databasen.
Diffraktionsdata indsamles i uovervåget tilstand ved hjælp af dedikeret beamtime på beamline I04-1. To centreringstilstande er tilgængelige, nemlig optisk og røntgenbaseret17. For nåle- og stavformede krystaller anbefales røntgencentrering, mens klumpede krystaller generelt understøtter optisk tilstand, hvilket er hurtigere og derfor gør det muligt at indsamle flere prøver i den tildelte stråletid. Afhængigt af opløsningen af krystallerne (etableret før de kommer ind på platformen) kan dataindsamling enten være 60 s eller 15 s total eksponering. Dataindsamling under opløsningsmiddeltestfasen informerer normalt om, hvilken kombination der fungerer bedst med ydeevnen af strålelinje I04-1.
Den store mængde dataanalyse styres via XChemExplorer (XCE)25, som også kan bruges til at starte hitidentifikationstrinnet ved hjælp af PanDDA26. XCE er et datastyrings- og workflowværktøj, der understøtter storskala analyse af protein-ligandstrukturer (figur 4); den læser ethvert af de automatiske behandlingsresultater fra data indsamlet på Diamond Light Source (DIALS16, Xia214, AutoPROC30 og STARANISO31) og vælger automatisk et af resultaterne baseret på datakvalitet og lighed med en referencemodel. Det er vigtigt, at modellen er repræsentativ for det krystalsystem, der anvendes til XChem-screening, og skal omfatte alt vand eller andre opløsningsmiddelmolekyler samt alle cofaktorer, ligander og alternative konformationer, der er synlige i krystaller, der kun er gennemblødt med opløsningsmiddel. Kvaliteten af denne referencemodel vil direkte påvirke mængden af arbejde, der kræves i modelbygnings- og forbedringsfasen. PanDDA bruges til at analysere alle data og identificere bindingssteder. Det justerer strukturer til en referencestruktur, beregner de statistiske kort, identificerer begivenheder og beregner begivenhedskort26,32. I PanDDA-paradigmet er det hverken nødvendigt eller ønskeligt at opbygge den fulde krystallografiske model; Det, der skal modelleres, er kun synet af proteinet, hvor et fragment er bundet (bound-state-modellen), så fokus behøver kun at være på at opbygge liganden og omgivende rester/opløsningsmiddelmolekyler i henhold til begivenhedskortet32.
Processen, der er skitseret i dette papir, er blevet grundigt testet af brugerfællesskabet, og tilpasningsevnen af de protokoller, der er beskrevet her, er nøglen til håndtering af den brede vifte af projekter, der typisk opstår på platformen. Imidlertid er nogle få forudsætninger for krystalsystemet nødvendige.
For enhver fragmentscreeningskampagne, der udføres ved hjælp af røntgenkrystallografi, er et reproducerbart og robust krystalsystem kritisk. Da standard XChem-protokollen involverer tilsætning af fragmentet direkte til krystaldråben, bør optimering fokusere på antallet af dråber, der indeholder krystaller af høj kvalitet snarere end det samlede antal krystaller. Hvis dråber indeholder flere krystaller, er de effektivt overflødige, selvom de kan lindre høstprocessen. Desuden kan overførsel af krystalliseringsprotokollen fra hjemmeinstituttet til faciliteter på stedet være udfordrende. Dette opnås generelt bedst ved hjælp af krystalsåning for at fremme reproducerbar kimdannelse54, og derfor er en god praksis, at brugerne leverer frøbestande sammen med deres protein- og krystalliseringsopløsninger.
For at sikre god sammensat opløselighed og støtte, de høje blødgøringskoncentrationer, der er beregnet til at drive binding af svage fragmenter, tilvejebringes fragmentbiblioteker i organiske opløsningsmidler, specifikt DMSO og ethylenglycol. Tilvejebringelse af to forskellige opløsningsmidler giver brugerne et alternativ til krystaller, der slet ikke tåler DMSO, eller hvor det udelukker binding af fragmenter på et interessant sted. Brugere kan levere alternative biblioteker i vandig buffer: forbindelser dispenseres godt, forudsat at de er fuldstændigt opløst og formateret i plader, der er kompatible med væskedispenseringsrobotten.
For projekter, hvor det ikke er muligt at finde et passende organisk opløsningsmiddel, der både opløser biblioteket og tolereres af krystalsystemet, er en alternativ procedure at anvende tørrede forbindelser som fastlagt i BESSY55.
I samfundet er der et langvarigt spørgsmål om at være i stand til at suge forbindelser i krystaller dyrket under krystalliseringsbetingelser, der indeholder høje saltkoncentrationer. Praktisk set observeres mere udfældning af forbindelserne og hurtig dannelse af saltkrystaller i høstfasen, hvilket reduceres ved at anvende et fugtigt miljø omkring høstområdet. Generelt giver screeningskampagner i krystalsystemer fra høje saltkrystalliseringsbetingelser en sammenlignelig hitrate med lave saltforhold.
De indledende faser af XChem-processen (test af opløsningsmiddeltolerance og præ-screening) er relativt små og hurtige eksperimenter, men giver mulighed for klar go/no go-beslutning for projektet. Mest smertefuldt skal alternative krystalsystemer findes, hvis hverken opløsningsmiddel tolereres, eller forskærmen resulterer i en meget lav hitrate. I modsætning hertil, hvis de lykkes, informerer resultaterne direkte blødgøringstilstanden, der skal bruges til screeningseksperimentet, og den bedste strategi for dataindsamling. Da kvaliteten af dataene, især opløsningen, vil påvirke kvaliteten af elektrondensiteten til hitidentifikation og analyse, er målet at suge ved den højest mulige sammensatte koncentration, der ikke har en skadelig effekt på diffraktionskvaliteten (hvor størstedelen af datasæt (~ 80%) diffrakterer til en opløsning på 2,8 Å eller bedre).
Dataanalyseprocessen er strømlinet i XChemExplorer, som er afhængig af PanDDA-softwaren til påvisning af svage bindemidler og giver brugerne mulighed for hurtigt at visualisere og gennemgå resultaterne af screeningskampagnen. XChemExplorer importerer databehandlingsresultater fra de pakker, der er tilgængelige på Diamond (DIALS16, autoPROC 30, STARANISO31 og Xia214) med opløsningsgrænser bestemt af standardmetoden for hver pakke (dvs.CC1/2 = 0,3). Som standard er valg af datasæt baseret på en score beregnet ud fra I/sigI, fuldstændighed og en række unikke refleksioner, men specifikke behandlingsresultater kan vælges til brug både globalt eller for individuelle eksempler25. Data er også udelukket fra analyse af PanDDA baseret på kriterier, herunder opløsning,R-fri og forskel i enhedscellevolumen mellem reference- og måldata (standardindstillinger er henholdsvis 3,5 Å, 0,4 og 12%), så dårligt diffrakterende, forkert centrerede eller forkert indekserede krystaller ikke påvirker analysen.
PanDDA-algoritmen udnytter det betydelige antal datasæt, der indsamles under en fragmentkampagne, til at registrere ligander med delvis belægning, der ikke er synlige på standardkrystallografiske kort. Indledningsvis bruger PanDDA data indsamlet under opløsningsmiddeltolerancetesten og præ-screen-trin til at udarbejde et gennemsnitstæthedskort, som derefter bruges til at oprette en jordtilstandsmodel. Da denne model vil blive brugt til alle efterfølgende analysetrin, er det afgørende, at den nøjagtigt repræsenterer det ikke-liganderede protein under de betingelser, der anvendes til fragmentskærmen. PanDDA bruger derefter en statistisk analyse til at identificere bundne ligander, hvilket genererer et begivenhedskort for krystallens bundne tilstand. Et hændelseskort genereres ved at trække den ubundne fraktion af krystallen fra datasættet for delvis belægning og præsenterer, hvad der ville blive observeret, hvis liganden var bundet ved fuld belægning. Selv fragmenter, der vises tydelige i konventionelle 2mFo-DF c-kort , kan blive fejlmodelleret, hvis begivenhedskortene ikke konsulteres32. Mens PanDDA er en kraftfuld metode til at identificere datasæt, der adskiller sig fra de gennemsnitlige kort (som normalt er tegn på fragmentbinding), og målinger som RSCC, RSZD, B-faktorforhold og RMSD under forfining leveres til brugerens fordel, er brugeren i sidste ende ansvarlig for at beslutte, om den observerede tæthed nøjagtigt viser den forventede ligand og den mest egnede konformation.
Efter dataanalyse og forfining er det muligt for alle brugere samtidig at deponere flere strukturer i Protein Data Bank (PDB) ved hjælp af XChemExplorer. For hver fragmentskærm foretages to gruppeaflejringer. Den første deponering indeholder alle fragmentbundne modeller med koefficienter til beregning af PanDDA-begivenhedskort inkluderet i MMCIF-filer. Den anden aflejring giver den ledsagende jordtilstandsmodel langs de målte strukturfaktorer for alle datasæt i eksperimentet: disse data kan bruges til at reproducere PanDDA-analysen og til udvikling af fremtidige algoritmer. Med hensyn til hits-strukturerne, når fragmentbelægningen er lav, opfører raffinement sig bedre, hvis modeller er en sammensætning af de ligandbundne og forvirrende jordtilstandsstrukturer32; Ikke desto mindre er praksis kun at deponere bound-state fraktionerne, da de fulde sammensatte modeller generelt er komplekse og vanskelige at fortolke. Som følge heraf er nogle kvalitetsindikatorer, der er genberegnet af FBF (navnlig R/Rfree), undertiden let forhøjede. Det er også muligt at levere alle rådata ved hjælp af platforme som Zenodo56, selvom dette i øjeblikket ikke understøttes af XChem-rørledningen.
Samlet set kunne fragmentligander siden driften i 2016 identificeres i over 95% af målene ved hjælp af denne procedure. Erfaringer fra de mange projekter, som XChem har støttet, blev destilleret til bedste praksis for krystalforberedelse33, mens der blev udviklet et fragmentbibliotek, der implementerede det klare koncept til at hjælpe fragmentprogression29, hvilket også hjalp med at etablere praksis med at offentliggøre bibliotekskomposition. Platformen har demonstreret vigtigheden af velholdt infrastruktur og dokumenterede processer, der er beskrevet her, og gjort det muligt at evaluere andre fragmentbiblioteker57,58, sammenligne biblioteker48 og informere designet af det kollaborative EUOpenscreen-DRIVE-bibliotek 59,60.
The authors have nothing to disclose.
Dette arbejde repræsenterer en stor fælles indsats mellem Diamond Light Source og Structure Genomic Consortium. Forfatterne vil gerne anerkende Diamonds forskellige støttegrupper og MX-gruppe for deres bidrag til automatiseringen af i04-1 beamline og for at levere strømlinede dataindsamlings- og autobehandlingsrørledninger, som almindeligvis køres på tværs af alle MX-strålelinjer. De vil også gerne takke SGC PX-gruppen for deres modstandsdygtighed ved at være de første brugere til at teste opsætningen og Evotec for at være den første seriøse industrielle bruger. Dette arbejde blev støttet af iNEXT-Discovery (Grant 871037) finansieret af Europa-Kommissionens Horizon 2020-program.
DSI-poised library | Enamine | DSI-896 | fragment library |
Echo 550 and 650 series | Beckman-Coulter | acoustic dispensing system | |
Echo microplates | Beckman-Coulter | 001-12380; 001-8768; 001-6025 | 1536-well and 384-well microplates |
Shifter | Oxford Lab Technology | harvesting device | |
Microplate centrifuge with a swing-out rotor | Sigma | model 11121 | microplate centrifuge |
3-drops crystallisation plates | Swissci | 3W96T-UVP | Crystallisation plates |
Formulatrix plate imager and Rockmaker software | Formulatrix | Crystallisation plates imaging device |