Översättning av ribosomer avkodar tre nukleotider per kodon till peptider. Deras rörelse längs mRNA, fångad av ribosomprofilering, producerar fotavtrycken som uppvisar karakteristisk triplettperiodicitet. Detta protokoll beskriver hur man använder RiboCode för att dechiffrera denna framträdande funktion från ribosomprofileringsdata för att identifiera aktivt översatta öppna läsramar på hela transkriptomnivån.
Identifiering av öppna läsramar (ORF), särskilt de som kodar för små peptider och aktivt översätts under specifika fysiologiska sammanhang, är avgörande för omfattande anteckningar av kontextberoende translatomer. Ribosomprofilering, en teknik för att detektera bindningsplatser och densiteter för att översätta ribosomer på RNA, erbjuder en väg att snabbt upptäcka var översättning sker i genomomfattande skala. Det är emellertid inte en trivial uppgift inom bioinformatik att effektivt och omfattande identifiera de översättande ORF: erna för ribosomprofilering. Här beskrivs ett lättanvänt paket, med namnet RiboCode, som är utformat för att aktivt översätta ORF:er av alla storlekar från förvrängda och tvetydiga signaler i ribosomprofileringsdata. Med vår tidigare publicerade datauppsättning som exempel innehåller den här artikeln stegvisa instruktioner för hela RiboCode-pipelinen, från förbearbetning av rådata till tolkning av de slutliga utdataresultatfilerna. För att utvärdera översättningshastigheterna för de kommenterade ORF: erna beskrivs dessutom förfaranden för visualisering och kvantifiering av ribosomdensiteter på varje ORF också i detalj. Sammanfattningsvis är den här artikeln en användbar och aktuell instruktion för forskningsområdena relaterade till översättning, små ORF och peptider.
Nyligen har en växande mängd studier avslöjat utbredd produktion av peptider översatta från ORF av kodande gener och de tidigare kommenterade generna som icke-kodande, såsom långa icke-kodande RNA (lncRNA) 1,2,3,4,5,6,7,8. Dessa översatta ORF regleras eller induceras av celler för att reagera på miljöförändringar, stress och celldifferentiering1,8,9,10,11,12,13. Översättningsprodukterna från vissa ORF har visat sig spela viktiga regulatoriska roller i olika biologiska processer inom utveckling och fysiologi. Till exempel upptäckte Chng et al.14 ett peptidhormon som heter Elabela (Ela, även känt som Apela / Ende / Toddler), vilket är avgörande för kardiovaskulär utveckling. Pauli et al. föreslog att Ela också fungerar som en mitogen som främjar cellmigration i det tidiga fiskembryot15. Magny et al. rapporterade två mikropeptider av mindre än 30 aminosyror som reglerar kalciumtransport och påverkar regelbunden muskelkontraktion i Drosophila-hjärtat10.
Det är fortfarande oklart hur många sådana peptider som kodas av genomet och om de är biologiskt relevanta. Därför är systematisk identifiering av dessa potentiellt kodande ORF mycket önskvärt. Att direkt bestämma produkterna från dessa ORF (dvs. protein eller peptid) med hjälp av traditionella metoder såsom evolutionär bevarande16,17 och masspektrometri18,19 är emellertid utmanande eftersom detektionseffektiviteten för båda metoderna är beroende av längden, överflödet och aminosyrasammansättningen hos de producerade proteinerna eller peptiderna. Tillkomsten av ribosomprofilering, en teknik för att identifiera ribosomens beläggning på mRNA vid nukleotidupplösning, har gett ett exakt sätt att utvärdera kodningspotentialen för olika transkript3,20,21, oavsett deras längd och sammansättning. En viktig och ofta använd funktion för att identifiera aktivt översätta ORF med ribosomprofilering är tre-nukleotid (3-nt) periodiciteten hos ribosomens fotavtryck på mRNA från startkodon till stoppkodonet. Ribosomprofileringsdata har emellertid ofta flera problem, inklusive låga och glesa sekvenseringsläsningar längs ORF, högt sekvenseringsbrus och ribosomala RNA (rRNA) -föroreningar. Således försvagar de förvrängda och tvetydiga signalerna som genereras av sådana data 3-nt periodicitetsmönstren för ribosomernas fotavtryck på mRNA, vilket i slutändan gör identifieringen av de högförtroendeöversatta ORF: erna svåra.
Ett paket med namnet “RiboCode” anpassade ett modifierat Wilcoxon-signerat rank-test och P-värdesintegrationsstrategi för att undersöka om ORF har betydligt fler ribosomskyddade fragment i ramen (RPF) än RPF:er utanför ramen22. Det visade sig vara mycket effektivt, känsligt och korrekt för de novo-anteckning av översättningen i simulerade och verkliga ribosomprofileringsdata. Här beskriver vi hur du använder det här verktyget för att upptäcka potentialen att översätta ORF:er från de råa ribosomprofileringssekvenseringsdataset som genererades av den tidigare studien23. Dessa dataset hade använts för att undersöka funktionen hos EIF3-underenheten “E” (EIF3E) i översättning genom att jämföra ribosombeläggningsprofilerna för MCF-10A-celler transfekterade med kontroll (si-Ctrl) och EIF3E (si-eIF3e) små interfererande RNA (siRNA). Genom att tillämpa RiboCode på dessa exempeldatauppsättningar upptäckte vi 5 633 nya ORF som potentiellt kodar för små peptider eller proteiner. Dessa ORF kategoriserades i olika typer baserat på deras platser i förhållande till de kodande regionerna, inklusive uppströms ORF (uORF), nedströms ORF (dORF), överlappade ORF, ORF från nya proteinkodande gener (nya PCG) och ORF från nya icke-proteinkodande gener (nya icke-PCPG). RPF-läsdensiteterna på uORF ökade signifikant i EIF3E-bristfälliga celler jämfört med kontrollceller, vilket åtminstone delvis kan orsakas av anrikningen av aktivt översättande ribosomer. Den lokaliserade ribosomackumuleringen i regionen från den 25: e till 75: e kodonen av EIF3E-bristfälliga celler indikerade en blockering av översättningsförlängning i det tidiga skedet. Detta protokoll visar också hur man visualiserar RPF-densiteten för den önskade regionen för att undersöka 3-nt periodicitetsmönstren för ribosomfotavtryck på identifierade ORF. Dessa analyser visar RiboCodes kraftfulla roll när det gäller att identifiera översättning av ORF och studera reglering av översättning.
Ribosomprofilering erbjuder en oöverträffad möjlighet att studera ribosomernas verkan i celler i genomskala. Exakt dechiffrering av informationen som bärs av ribosomprofileringsdata kan ge insikt i vilka regioner av gener eller transkript som aktivt översätts. Detta steg-för-steg-protokoll ger vägledning om hur du använder RiboCode för att analysera ribosomprofileringsdata i detalj, inklusive paketinstallation, förberedelse av data, kommandokörning, resultatförklaring och datavisualisering. Analysresultaten …
The authors have nothing to disclose.
Författarna vill erkänna stödet från de beräkningsresurser som tillhandahålls av HPCC-plattformen vid Xi’an Jiaotong University. Z.X. tackar tacksamt Young Topnotch Talent Support Plan från Xi’an Jiaotong University.
A computer/server running Linux | Any | – | – |
Anaconda or Miniconda | Anaconda | – | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | – | https://www.r-project.org/ |
Rstudio | Rstudio | – | https://www.rstudio.com/ |