Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens

Venkatramanan Krishnamani; Tabitha A. Peterson; Robert C. Piper; Mark A. Stamnes

doi:10.3791/57802

JoVE Journal > Genetics

Please note that all translations are automatically generated. Click here for the English version.

Genetics

Datoriserad analys av sekvensdata från Batch jäst 2-Hybrid skärmar

Published: June 28, 2018

doi:

10.3791/57802

Venkatramanan Krishnamani, Tabitha A. Peterson, Robert C. Piper, Mark A. Stamnes

¹Molecular Physiology and Biophysics,University of Iowa

Summary

Djupsekvensering av jäst populationer valts för positiva jäst 2-hybrid interaktioner potentiellt ger en mängd information om samverkande partner proteiner. Här, beskriver vi driften av specifika bioinformatiska verktyg och anpassade uppdaterad programvara för att analysera sekvensdata från sådana skärmar.

Abstract

Vi har anpassat jäst 2-hybrid analysen för att samtidigt avslöja dussintals övergående och statiska proteininteraktioner inom en enda skärm som utnyttjar hög genomströmning kort-Läs DNA-sekvensering. Den resulterande sekvensen datamängder kan inte bara spåra vilka gener i en population som är berikad under markeringen för positiva jäst 2-hybrid interaktioner, men också ge detaljerad information om relevanta underdomäner av proteiner tillräckligt för interaktion. Här beskriver vi en full sviten av fristående program som gör icke-experter att utföra alla bioinformatik och statistisk steg för att bearbeta och analysera DNA sekvens fastq filer från en batch jäst 2-hybrid assay. Processtegen omfattas av dessa programvara inkluderar: (1) kartläggning och räknande sekvensen läser motsvarar varje kandidat protein kodade inom ett jäst 2-hybrid prey bibliotek; (2) en statistisk analysprogram som utvärderar de berikning profilerna; och 3) verktyg för att undersöka translationell ram och ställning i regionen kodande i varje berikad plasmiden som kodar de samverkande proteinerna av intresse.

Introduction

En metod att upptäcka proteininteraktioner är jäst 2-hybrid (Y2H) analysen, som utnyttjar konstruerad jästceller som växer endast när ett protein av intresse binder till ett fragment av ett samverkande partner¹. Påvisande av flera Y2H interaktioner kan nu göras med hjälp av massiva parallella hög genomströmning sekvensering. Flera format har varit beskrivs²^,³^,⁴^,⁵ inklusive en som vi utvecklat där populationer odlas i batch villkor som väljer för jäst som innehåller plasmider som producerar en positiva Y2H interaktion⁶. Arbetsflödet vi utvecklat, kallas DEEPN (dynamisk anrikning för utvärdering av Protein nätverk), identifierar differential interactomes från samma prey biblioteken att identifiera proteiner som samverkar med en protein (eller domän) vs. ett annat protein eller en conformationally distinkta mutant domän. En av de största stegen i det här arbetsflödet är korrekt bearbetning och analys av DNA sekvensering data. Viss information kan härledas genom att bara räkna antalet läsningar för varje gen både före och efter markeringen av Y2H interaktioner i en mode analogt med ett RNA-seq experiment. Dock kan mycket mer ingående information utvinnas ur dessa datamängder inklusive information om underdomänen av ett visst protein som är kapabel att producera en Y2H interaktion. Den DEEPN metoden är värdefull, kan analysera många prov replikat dessutom vara, omständligt och dyrt. Problemet lindras med hjälp av en statistisk modell som utvecklats specifikt för DEEPN datauppsättningar där antalet replikat är begränsad⁶. För att bearbetning och analys av DNA sekvensering datamängder tillförlitlig, komplett, robust och tillgänglig utredare utan bioinformatik expertis, utvecklat vi en svit av program som täcker alla steg i analysen.

Denna svit av fristående program som körs på stationära datorer inkluderar MAPster, DEEPN och Stat_Maker. MAPster är ett grafiskt användargränssnitt som låter varje fastq fil i kö för mappning till genomet använder i HISAT2 program⁷, producerar en standard .sam fil för användning i efterföljande program. DEEPN har flera moduler. Det tilldelar och räkningar läser motsvarande särskild gen liknar en RNA-seq typ kvantifiering använder modulen ‘Genen Count’. Också extraheras de sekvenser som motsvarar korsningen mellan Gal4 transkriptionell domänen och sekvensen bytesdjur och sammanställer placeringen av dessa korsningar att tillåta sin inspektion av jämförande tabeller och diagram (med modulen ‘Junction_Make’) Modulen ‘Blast_Query’ tillåter enkel inspektion, kvantifiering och jämförelse av korsningen Gal4 junction sekvenser. Stat_Maker utvärderar läser per gen anrikning data statistiskt som ett sätt att prioritera sannolikt Y2H träffar. Här beskriver vi hur du använder dessa program och att fullt ut analysera DNA-sekvensen data från en DEEPN Y2H experimentera. Versioner av DEEPN finns att köra på PC, Mac och Linux-system. Andra program, såsom kartläggning program MAPster och modulen DEEPN statistik Stat_Maker lita på subrutiner som körs under Unix och finns endast på Mac och linux-system.

Protocol

1. kartläggning Fastq filer Obs: DEEPN programvara samt många bioinformatik program använda DNA-sekvensdata vari varje sekvens Läs har mappats för dess position i referens DNA. En mängd kartprogram kan användas för detta inklusive MAPster gränssnittet här som använder programmet HISTAT2 för att producera .sam filer som används i efterföljande steg. Mappa sekvensdata till rätt version av genomet. För Y2H bibliotek av mus ursprung, använda UCSC mm10 genomet; för dem s…

Representative Results

Mappning av fastq data: det första stegetI praktiskt taget alla NGS program inklusive DEEPN inledande utdata är en fil av kort sekvens läser som måste mappas av anpassningen till genomisk, hänvisning transcriptomic, eller annan DNA8. Nyligen utvecklades HISAT2 justering programmet som använder algoritmer för indexering av state-of-the-art att dramatiskt öka den mappning hastighet7,9</…

Discussion

Den programserien som beskrivs här tillåter en att helt bearbeta och analysera hög genomströmning DNA sekvensering data från ett DEEPN experiment. Det första programmet som används är MAPster, som tar den DNA sekvens läser i standard fastq filer och kartor sin position på en referens DNA för nedströms behandling av en hel mängd informatik program inklusive DEEPN programvara. Verktyget MAPster gränssnittet och dess förmåga att köa flera jobb, kombinera indatafiler, 눇Mycket namn utdatafiler, tillsammans …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Detta arbete stöds av National Institutes of Health: NIH R21 EB021870-01A1 och av NSF forskning projektbidrag: 1517110.

Materials

Mapster		https://github.com/emptyewer/MAPster/releases
DEEPN software		https://github.com/emptyewer/DEEPN/releases
Statmaker		https://github.com/emptyewer/DEEPN/releases
Minimum computer system	Apple	Mac Intel Core i5 or better
	–	4 Gb RAM or better
	–	500 Gb Disk spce or better
	–	OS 10.10 or higher
	Dell	Intel i5-7400 or better
	–	4 Gb RAM or better
	–	500 Gb Disk spce or better
	–	Windows 7 or higher

References

Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

Datoriserad analys av sekvensdata från Batch jäst 2-Hybrid skärmar

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Datoriserad analys av sekvensdata från Batch jäst 2-Hybrid skärmar

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below