Vi præsenterer et systembiologisk værktøj JUMPn til at udføre og visualisere netværksanalyse for kvantitative proteomics-data med en detaljeret protokol, herunder dataforbehandling, co-ekspressionsklyngedannelse, vejberigelse og protein-protein interaktionsnetværksanalyse.
Med de seneste fremskridt inden for massespektrometribaserede proteomics-teknologier er dyb profilering af hundredvis af proteomer blevet mere og mere mulig. Det er imidlertid en udfordring at udlede biologisk indsigt fra sådanne værdifulde datasæt. Her introducerer vi en systembiologisk baseret software JUMPn og dens tilhørende protokol til at organisere proteomet i protein-co-ekspressionsklynger på tværs af prøver og protein-protein interaktion (PPI) netværk forbundet med moduler (f.eks. Proteinkomplekser). Ved hjælp af R/Shiny-platformen strømliner JUMPn-softwaren analysen af co-ekspressionsklynger, pathwayberigelse og PPI-moduldetektion med integreret datavisualisering og en brugervenlig grænseflade. De vigtigste trin i protokollen inkluderer installation af JUMPn-softwaren, definitionen af differentielt udtrykte proteiner eller det (dys) regulerede proteom, bestemmelse af meningsfulde co-ekspressionsklynger og PPI-moduler og resultatvisualisering. Mens protokollen demonstreres ved hjælp af en isobarisk mærkningsbaseret proteomprofil, er JUMPn generelt anvendelig på en bred vifte af kvantitative datasæt (f.eks. Etiketfri proteomik). JUMPn-softwaren og -protokollen giver således et kraftfuldt værktøj til at lette biologisk fortolkning i kvantitativ proteomics.
Massespektrometribaseret haglgeværproteomik er blevet nøglemetoden til analyse af proteomdiversitet af komplekse prøver1. Med de seneste fremskridt inden for massespektrometriinstrumentering 2,3, kromatografi 4,5, ionmobilitetsdetektion6, erhvervelsesmetoder (datauafhængig7 og dataafhængig erhvervelse8), kvantificeringsmetoder (multiplex isobarisk peptidmærkningsmetode, fx TMT 9,10 og etiketfri kvantificering11,12) og dataanalysestrategier / softwareudvikling 13,14,15,16,17,18, kvantificering af hele proteomet (f.eks. over 10,000 proteiner) er nu rutine 19,20,21. Men hvordan man får mekanistisk indsigt fra så dybe kvantitative datasæt er stadig udfordrende22. Indledende forsøg på at undersøge disse datasæt var overvejende afhængige af annotationen af individuelle elementer i dataene og behandlede hver komponent (protein) uafhængigt. Biologiske systemer og deres adfærd kan imidlertid ikke udelukkende forklares ved at undersøge individuelle komponenter23. Derfor er en systemtilgang, der placerer de kvantificerede biomolekyler i sammenhæng med interaktionsnetværk, afgørende for forståelsen af komplekse systemer og de tilknyttede processer såsom embryogenese, immunrespons og patogenese af humane sygdomme24.
Netværksbaseret systembiologi er opstået som et stærkt paradigme til analyse af store kvantitative proteomics-data 25,26,27,28,29,30,31,32,33. Konceptuelt kunne komplekse systemer som pattedyrceller modelleres som et hierarkisk netværk34,35, hvor hele systemet er repræsenteret i niveauer: først af et antal store komponenter, som hver især derefter iterativt modelleres af mindre delsystemer. Teknisk set kan strukturen af proteomdynamik præsenteres af indbyrdes forbundne netværk af co-udtrykte proteinklynger (fordi co-udtrykte gener / proteiner ofte deler lignende biologiske funktioner eller mekanismer for regulering36) og fysisk interagerende PPI-moduler37. Som et nyligt eksempel25 genererede vi tidsmæssige profiler af hele proteom og fosfoproteom under T-celleaktivering og brugte integrerende co-ekspressionsnetværk med PPI’er til at identificere funktionelle moduler, der formidler T-celle hvileudgang. Flere bioenergetiske relaterede moduler blev fremhævet og eksperimentelt valideret (f.eks. mitoribosom og komplekse IV-modul25 og et-kulstofmodul38). I et andet eksempel26 udvidede vi yderligere vores tilgang til at studere patogenesen af Alzheimers sygdom og prioriterede med succes sygdomsprogressionsassocierede proteinmoduler og molekyler. Det er vigtigt, at mange af vores upartiske opdagelser blev valideret af uafhængige patientkohorter26,29 og / eller sygdomsmusemodeller26. Disse eksempler illustrerede kraften i den systembiologiske tilgang til dissekering af molekylære mekanismer med kvantitativ proteomics og andre omics-integrationer.
Her introducerer vi JUMPn, en strømlinet software, der udforsker kvantitative proteomics-data ved hjælp af netværksbaserede systembiologiske tilgange. JUMPn fungerer som downstream-komponenten i den etablerede JUMP proteomics-softwarepakke 13,14,39 og har til formål at udfylde hullet fra individuelle proteinkvantificeringer til biologisk meningsfulde veje og proteinmoduler ved hjælp af systembiologimetoden. Ved at tage kvantificeringsmatrixen af differentielt udtrykte (eller de mest variable) proteiner som input sigter JUMPn mod at organisere proteomet i et lagdelt hierarki af proteinklynger, der er co-udtrykt på tværs af prøver og tæt forbundne PPI-moduler (f.eks. Proteinkomplekser), som yderligere kommenteres med offentlige vejdatabaser ved overrepræsentation (eller berigelse) analyse (figur 1). JUMPn er udviklet med R/Shiny platform40 til en brugervenlig grænseflade og integrerer tre store funktionelle moduler: co-expression clustering analyse, pathway enrichment analyse og PPI netværksanalyse (figur 1). Efter hver analyse visualiseres resultaterne automatisk og kan justeres via R/shiny widget-funktionerne og kan let downloades som publikationstabeller i Microsoft Excel-format. I den følgende protokol bruger vi kvantitative hele proteomdata som et eksempel og beskriver de vigtigste trin i brugen af JUMPn, herunder installation af JUMPn-softwaren, definitionen af differentielt udtrykte proteiner eller det (dys) regulerede proteom, co-ekspressionsnetværksanalyse og PPI-modulanalyse, resultatvisualisering og fortolkning og fejlfinding. JUMPn-software er frit tilgængelig på GitHub41.
Her introducerede vi vores JUMPn-software og dens protokol, som er blevet anvendt i flere projekter til dissekering af molekylære mekanismer ved hjælp af dybe kvantitative proteomics-data 25,26,27,30,64. JUMPn-softwaren og -protokollen er blevet fuldt optimeret, herunder overvejelse af DE-proteiner til co-ekspressionsnetanalyse, en samling af omfattende PPI-…
The authors have nothing to disclose.
Finansieringsstøtte blev ydet af National Institutes of Health (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 og U54NS110435) og ALSAC (American Lebanese Syrian Associated Charities). MS-analysen blev udført i St. Jude Children’s Research Hospital’s Center of Proteomics and Metabolomics, som delvist blev støttet af NIH Cancer Center Support Grant (P30CA021765). Indholdet er udelukkende forfatternes ansvar og repræsenterer ikke nødvendigvis de officielle synspunkter fra National Institutes of Health.
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. | Apple Inc. | MacBook Pro 13'' | Hardware used for software development and testing |
Anoconda | Anaconda, Inc. | version 4.9.2 | https://docs.anaconda.com/anaconda/install/ |
miniconda | Anaconda, Inc. | version 4.9.2 | https://docs.conda.io/en/latest/miniconda.html |
RStudio | RStudio Public-benefit corporation | version 4.0.3 | https://www.rstudio.com/products/rstudio/download/ |
Shiny Server | RStudio Public-benefit corporation | https://shiny.rstudio.com/articles/shinyapps.html |