I detta papper presenteras ett protokoll för bearbetning av cryo-EM-bilder med hjälp av programvarupaketet SPHIRE. Det föreliggande protokollet kan tillämpas för nästan alla enskilda partikel-EM-projekt som riktar sig mot när-atomupplösning.
SPHIRE (SPARX för högupplösande elektronmikroskopi) är en ny öppen källkod, användarvänlig mjukvarusupport för halvautomatiserad behandling av data med enkelpartikelelektronkryo-mikroskopi (cryo-EM). Protokollet som presenteras här beskriver i detalj hur man erhåller en närbildsupplösningsstruktur som startar från cryo-EM mikrograph-filmer genom att styra användarna genom alla steg i bestämningsrörledningen för enkelpartikelstruktur. Dessa steg styrs från det nya grafiska användargränssnittet SPHIRE och kräver minst användarintervention. Med användning av detta protokoll härleddes en 3,5 Å-struktur av TcdAl, ett Tc- toxinkomplex från Photorhabdus luminescens , från endast 9500 enskilda partiklar. Detta strömlinjeformade tillvägagångssätt kommer att hjälpa nybörjare utan omfattande behandlingserfarenhet och a priori strukturell information, för att erhålla bullerfria och opartiska atommodeller av sina renade makromolekylära komplex i sitt ursprungsland.
Efter utvecklingen av direktelektrondetektortekniken omformar den anmärkningsvärda framstegen i single particle cryo-EM för närvarande strukturella biologi 1 . Jämfört med röntgenkristallografi kräver denna teknik endast en liten mängd proteinmaterial utan behov av kristallisation, samtidigt som det ställer färre restriktioner avseende provets renhet och tillåter fortfarande bestämning av strukturer vid näratomisk upplösning. Viktigt är att olika kompositioner eller tillstånd nu kan beräknas separeras från varandra och strukturbestämning av de olika konformationerna kan utföras vid en aldrig tidigare skådad detaljnivå. Nyligen kunde täthetskartor av utmanande molekyler framställas vid resolutioner som möjliggjorde de novo modellbyggnad och därigenom djup förståelse av deras handlingssätt 2 , 3 , 4 , 5.
Ett brett utbud av programvarupaket för bildbehandling finns i 3DEM (3D Electron Microscopy) -samhället (https://en.wikibooks.org/wiki/Software_Tools_For_Molecular_Microscopy) och de flesta av dem är under kontinuerlig utveckling. Nära atomupplösning har uppnåtts för proteiner som uppvisar olika molekylvikter och symmetrier med flera olika mjukvarupaket, inklusive EMAN2 6 , IMAGIC 7 , FREALIGN 8 , RELION 9 , SPIDER 10 och SPARX 11 . Varje paket kräver en annan nivå av användarkunskap och ger en annan nivå av användarvägledning, automatisering och utökningsbarhet. Dessutom, medan vissa program ger fullständiga miljöer för att underlätta alla steg med bildanalys, är andra utformade för att optimera specifika uppgifter, såsom förfining av anpassningsparametrar som börjar från en känd rFördelstruktur. Mer nyligen har flera plattformar utvecklats, inklusive APPION 12 och SCIPION 13 , som tillhandahåller en enda bearbetningsrörledning som integrerar tillvägagångssätt och protokoll från de olika mjukvarupaket som anges ovan.
För att bidra till den nuvarande utvecklingen av kryo-EM, utvecklades SPARX till en ny fristående och komplett plattform för enkelpartikelanalys, kallad SPHIRE (SPARX för högupplösande elektronmikroskopi). För att öka tillgängligheten till tekniken för nya forskare inom fältet och hantera den stora mängd data som produceras av moderna helautomatiska avancerade elektronmikroskop, redigerades och förenklades bearbetningsrörledningen genom att introducera en enkel att använda Grafiskt användargränssnitt (GUI) och automatisering av de viktigaste stegen i arbetsflödet. Dessutom tillsattes nya algoritmer för att tillåta snabb, reproducerbar och automatiserad strukturbestämning från crYo-EM-bilder. Vidare infördes validering genom reproducerbarhet för att undvika vanliga artefakter producerade under förfining och heterogenitetsanalys.
Även om programmet var omfattande modifierat, behölls dess uppskattade kärnfunktioner: enkel öppen källkod, den moderna objektorienterade designen och Python-gränssnittet för alla grundläggande funktioner. Således blev det inte ändrat till ett svart lådprogram, vilket gör det möjligt för användare att studera och enkelt modifiera Python-koden, skapa ytterligare applikationer eller ändra det övergripande arbetsflödet. Detta är särskilt användbart för icke-standardiserade cryo-EM-projekt.
Här presenterar vi ett protokoll för att erhålla en nära-atomisk upplösningstäthetskarta från cryo-EM-bilder med hjälp av GUI av SPHIRE. Det beskriver i detalj alla steg som krävs för att generera en täthetskarta från råcryo-EM direktdetektorfilmer och är inte begränsad till någon speciell makromolekyltyp. Detta protokoll avser främst att styra newcOmers i fältet genom arbetsflödet och ge viktig information om viktiga steg i behandlingen samt några av de möjliga fallgroparna och hindren. Mer avancerade funktioner och den teoretiska bakgrunden bakom SPHIRE kommer att beskrivas någon annanstans.
Enkeltpartikelkryo-EM har visat en snabb utveckling under de senaste åren och levererat många atomupplösningsstrukturer av makromolekylära komplex med stor biologisk betydelse 25 . För att stödja det stora antalet nybörjare som går in i fältet utvecklade vi enhetspartikelbildanalysplattformen SPHIRE och presenterar här ett genomgångsprotokoll för hela arbetsflödet inklusive filmjustering, partikelplockning, CTF-estimering, första modell Beräkning, 2D och 3D heterogenitetsanalys, 3D-raffinering med hög upplösning och lokal upplösning uppskattning och filtrering.
Protokollet som beskrivs här är avsett som en kort guide till 3D-strukturbestämning med användning av cryo-EM-mikrografer av proteinet av intresse och med hjälp av beräkningsverktyg som tillhandahålls av SPHIREs fristående GUI.
Huvuddelen av arbetsflödet är det mestaAv förfarandena behöver endast köras en gång, eftersom de bygger på begreppet validering genom reproducerbarhet 19 och kräver inte parameterjustering. Denna automatiska valideringsmekanism är en viktig fördel med SPHIRE jämfört med andra mjukvarupaket, eftersom resultaten tenderar att vara objektiva såväl som reproducerbara och, viktigast av allt, erhållas till en acceptabel beräkningskostnad. Rörledningen ger dessutom en mängd diagnostisk information för erfarna användare att genomföra ytterligare oberoende validering och bedömning med egna metoder. Ändå bör en nybörjare som har åtminstone elementär teoretisk bakgrund i strukturell biologi och elektronmikroskopi kunna erhålla strukturer med näratomisk upplösning med egen data och de automatiserade valideringsprocedurerna.
Att erhålla en närbildsupplösningsstruktur är emellertid inte alltid okomplicerad och resultatet kommer mycket att bero på provets kvalitet och ingångsdatanen. För de förfaranden som presenteras här antas det att ett tillräckligt antal högkvalitativa, oanpassade råa EM-filmer är tillgängliga, med deras medelvärden som visar klart urskiljbara homogena och slumpmässigt orienterade enskilda partiklar. Generellt finns det inga restriktioner vad gäller symmetri, storlek eller övergripande form av molekylen, men en låg molekylvikt kan vara en begränsande faktor, speciellt när proteinet har en featurlös globform. Vanligtvis är analys av större, välbeställda partiklar med högpunktsgruppsymmetri mindre krävande. Det är därför starkt rekommenderat för nybörjare att köra nuvarande protokoll först med en välkänd cryo-EM dataset. Antingen SPHIRE handledning data (http: /sphire.mpg.de) eller en av EMPIAR inlämnade dataset (https://www.ebi.ac.uk/pdbe/emdb/empiar/) med råa filmer är en bra utgångspunkt .
Vid bearbetning av egna data är det mycket troligt att vissa dataset eller några bilder inte uppfyller vissa kvalifikationerTy kriterier. I det här sammanhanget, förutom de automatiska stabilitets- och reproducerbarhetskontrollerna som utförs av programmet för stora steg i arbetsflödet, rekommenderas det fortfarande att användarna visuellt inspekterar resultaten vid vissa "kontrollpunkter" i protokollet, särskilt om den slutliga återuppbyggnaden Är inte tillfredsställande.
Den första visuella inspektionen kan utföras på mikrografnivå efter filminriktningen (protokollsteg 2 ) och CTF-estimeringen (protokollsteg 3 ). De resulterande rörelsereglerade medelvärdena bör tydligt urskilja och separerade enskilda partiklar och deras effektspektra bör visa klart urskiljbara, isotropa Thon-ringar. Den rumsliga frekvensen som de är synliga definierar i de flesta fall den högsta upplösningen som strukturen i princip i slutändan kan bestämmas. Exempel på ett rörelsekorrigerat medelvärde av tillräcklig kvalitet och dess effektspektrum visas i avsnittet & #34; Representativa resultat. "Utgående bilder som kan ha negativ inverkan på slutresultatet kan avlägsnas med hjälp av SPHIREs GUI-verktyg för drift och CTF (http://sphire.mpg.de/wiki/doku.php).
När det gäller partikelskärmning är det avgörande steget i SPHIRE-rörledningen 2D-klassificeringen med användning av ISAC (protokollsteg 5.2) . Här bör användaren kontrollera att de reproducerbara 2D-klassernas medelvärden identifieras automatiskt genom att programmet antar en rad orienteringar som är tillräckliga för att kvasi jämnt täcka vinkelutrymmet. Om kvaliteten på klassens medelvärden inte är tillfredsställande (bullriga och / eller suddiga bilder) och / eller antalet reproducerbara klassmedelvärden är mycket lågt, överväga att förbättra automatisk plockningskvalitet, optimera datasetbilder eller provberedning. I de flesta fall är det inte möjligt att beräkna en tillförlitlig rekonstruktion från en dataset som inte ger bra 2D-klassmedelvärden. Exempel på högkvalitativ 2D-klass aveRaser visas i avsnittet "Representativa resultat".
Minst 100 klassmedelvärden krävs för att få en pålitlig initial 3D-modell med RVIPER på ett automatiserat sätt (protokoll steg 6.1 ). För detta steg ska användaren välja medelvärden med högsta kvalitet och inkludera så många olika orienteringar av partikeln som möjligt. Kvaliteten på den ursprungliga modellen är avgörande för framgången för den efterföljande 3D-raffineringen med hög upplösning.
I andra mjukvarupaket görs 3D klassificering ibland för att ta bort "dåliga" partiklar 8 , 9 . I SPHIRE elimineras emellertid de flesta av dessa partiklar automatiskt redan under 2D-klassificering med ISAC. Således rekommenderas det att utföra det beräkningsintensiva steget för 3D-sortering endast om rekonstruktionen och 3D-variabilitetsanalysen indikerar heterogenitet i datasetet.
Viktigast av allt bör användaren noggrant inspektera de resulterande 3D-volymerna noggrant (protokoll steg 9.3 ) och bekräfta att egenskaperna hos respektive densitet överensstämmer väl med den nominella upplösningen. Vid en upplösning av <9 Å blir stavliknande densiteter som motsvarar a-helixer synliga. Vid en upplösning <4,5 Å är densiteter som motsvarar strängar i p-ark normalt väl separerade och skrymmande aminosyror blir synliga. En kartong med hög upplösning (<3 Å) ska visa tydligt urskiljbara sidokedjor, vilket möjliggör byggandet av en exakt atommodell.
Resultat som hittills erhållits visar att det här protokollet i allmänhet är tillämpligt på alla typer av enkelpartikel-kryo-EM-projekt, med hjälp av SPHIREs automatiska reproducerbarhetstest och minimala visuella inspektioner. Representativa resultat av varje behandlingssteg visas för rekonstruktionen av TcdA1-toxinet avPhotorhabdus luminescens 21 , som har lösts till nära atomisk upplösning. Densitetskartor av liknande kvalitet kan användas för att konstruera tillförlitliga atommodeller genom de novo ryggradsspårning samt ömsesidig eller verklig rymdförädling och därigenom ge en solid strukturell ram för förståelse av komplexa molekylära mekanismer.
Tillskottskoder:
Koordinaterna för EM-strukturen och de obearbetade filmerna har deponerats i elektronmikroskopibildbanken och elektronmikroskopipilotbildarkivet enligt anslutningsnummer EMD-3645 respektive EMPIAR-10089.
The authors have nothing to disclose.
Vi tackar D. Roderer för att ge oss TcdA1-mikrografer. Vi tackar Steve Ludtke för hans pågående stöd för EMAN2-infrastrukturen. Detta arbete stöddes av medel från Max Planck Society (till SR) och Europeiska rådet under Europeiska unionens sjunde ramprogram (RP7 / 2007-2013) (bidrag nr 615984) (till SR) och bidrag från National Institutes of Hälsa R01 GM60635 till PAP).
SPHIRE | Max Planck Institute of Molecular Physiology- Dortmund and Houston Medical School, Houston, Texas | http://sphire.mpg.de | |
UCSF Chimera | University of California, San Francisco | http://www.cgl.ucsf.edu/chimera/ | |
Unblur | Janelia Farm Research Campus, Ashburn | http://grigoriefflab.janelia.org/unblur | |
Coot | MRC Laboratory of Molecular Biology, Cambridge | http://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | |
EMAN2 | Baylor College of Medicine, Houston | http://blake.bcm.edu/emanwiki/EMAN2 | |
Computing Cluster with 1824 cores | Max Planck Institute of Molecular Physiology | Linux Cluster with 76 nodes, each with 2 Processors Xeon E5-2670v3 12C 2.30 GHz and 128 Gb RAM | |
TITAN KRIOS electron microscope | FEI | 300 kV, Cs correction, XFEG | |
Falcon II direct electron detector | FEI | ||
EPU (automated data acquisition software) | FEI | https://www.fei.com/software/epu/ |