Djupsekvensering av jäst populationer valts för positiva jäst 2-hybrid interaktioner potentiellt ger en mängd information om samverkande partner proteiner. Här, beskriver vi driften av specifika bioinformatiska verktyg och anpassade uppdaterad programvara för att analysera sekvensdata från sådana skärmar.
Vi har anpassat jäst 2-hybrid analysen för att samtidigt avslöja dussintals övergående och statiska proteininteraktioner inom en enda skärm som utnyttjar hög genomströmning kort-Läs DNA-sekvensering. Den resulterande sekvensen datamängder kan inte bara spåra vilka gener i en population som är berikad under markeringen för positiva jäst 2-hybrid interaktioner, men också ge detaljerad information om relevanta underdomäner av proteiner tillräckligt för interaktion. Här beskriver vi en full sviten av fristående program som gör icke-experter att utföra alla bioinformatik och statistisk steg för att bearbeta och analysera DNA sekvens fastq filer från en batch jäst 2-hybrid assay. Processtegen omfattas av dessa programvara inkluderar: (1) kartläggning och räknande sekvensen läser motsvarar varje kandidat protein kodade inom ett jäst 2-hybrid prey bibliotek; (2) en statistisk analysprogram som utvärderar de berikning profilerna; och 3) verktyg för att undersöka translationell ram och ställning i regionen kodande i varje berikad plasmiden som kodar de samverkande proteinerna av intresse.
En metod att upptäcka proteininteraktioner är jäst 2-hybrid (Y2H) analysen, som utnyttjar konstruerad jästceller som växer endast när ett protein av intresse binder till ett fragment av ett samverkande partner1. Påvisande av flera Y2H interaktioner kan nu göras med hjälp av massiva parallella hög genomströmning sekvensering. Flera format har varit beskrivs2,3,4,5 inklusive en som vi utvecklat där populationer odlas i batch villkor som väljer för jäst som innehåller plasmider som producerar en positiva Y2H interaktion6. Arbetsflödet vi utvecklat, kallas DEEPN (dynamisk anrikning för utvärdering av Protein nätverk), identifierar differential interactomes från samma prey biblioteken att identifiera proteiner som samverkar med en protein (eller domän) vs. ett annat protein eller en conformationally distinkta mutant domän. En av de största stegen i det här arbetsflödet är korrekt bearbetning och analys av DNA sekvensering data. Viss information kan härledas genom att bara räkna antalet läsningar för varje gen både före och efter markeringen av Y2H interaktioner i en mode analogt med ett RNA-seq experiment. Dock kan mycket mer ingående information utvinnas ur dessa datamängder inklusive information om underdomänen av ett visst protein som är kapabel att producera en Y2H interaktion. Den DEEPN metoden är värdefull, kan analysera många prov replikat dessutom vara, omständligt och dyrt. Problemet lindras med hjälp av en statistisk modell som utvecklats specifikt för DEEPN datauppsättningar där antalet replikat är begränsad6. För att bearbetning och analys av DNA sekvensering datamängder tillförlitlig, komplett, robust och tillgänglig utredare utan bioinformatik expertis, utvecklat vi en svit av program som täcker alla steg i analysen.
Denna svit av fristående program som körs på stationära datorer inkluderar MAPster, DEEPN och Stat_Maker. MAPster är ett grafiskt användargränssnitt som låter varje fastq fil i kö för mappning till genomet använder i HISAT2 program7, producerar en standard .sam fil för användning i efterföljande program. DEEPN har flera moduler. Det tilldelar och räkningar läser motsvarande särskild gen liknar en RNA-seq typ kvantifiering använder modulen ‘Genen Count’. Också extraheras de sekvenser som motsvarar korsningen mellan Gal4 transkriptionell domänen och sekvensen bytesdjur och sammanställer placeringen av dessa korsningar att tillåta sin inspektion av jämförande tabeller och diagram (med modulen ‘Junction_Make’) Modulen ‘Blast_Query’ tillåter enkel inspektion, kvantifiering och jämförelse av korsningen Gal4 junction sekvenser. Stat_Maker utvärderar läser per gen anrikning data statistiskt som ett sätt att prioritera sannolikt Y2H träffar. Här beskriver vi hur du använder dessa program och att fullt ut analysera DNA-sekvensen data från en DEEPN Y2H experimentera. Versioner av DEEPN finns att köra på PC, Mac och Linux-system. Andra program, såsom kartläggning program MAPster och modulen DEEPN statistik Stat_Maker lita på subrutiner som körs under Unix och finns endast på Mac och linux-system.
Den programserien som beskrivs här tillåter en att helt bearbeta och analysera hög genomströmning DNA sekvensering data från ett DEEPN experiment. Det första programmet som används är MAPster, som tar den DNA sekvens läser i standard fastq filer och kartor sin position på en referens DNA för nedströms behandling av en hel mängd informatik program inklusive DEEPN programvara. Verktyget MAPster gränssnittet och dess förmåga att köa flera jobb, kombinera indatafiler, 눇Mycket namn utdatafiler, tillsammans …
The authors have nothing to disclose.
Detta arbete stöds av National Institutes of Health: NIH R21 EB021870-01A1 och av NSF forskning projektbidrag: 1517110.
Mapster | https://github.com/emptyewer/MAPster/releases | ||
DEEPN software | https://github.com/emptyewer/DEEPN/releases | ||
Statmaker | https://github.com/emptyewer/DEEPN/releases | ||
Minimum computer system | Apple | Mac Intel Core i5 or better | |
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | OS 10.10 or higher | ||
Dell | Intel i5-7400 or better | ||
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | Windows 7 or higher |