Oversættelse af ribosomer afkoder tre nukleotider pr. Codon til peptider. Deres bevægelse langs mRNA, fanget ved ribosomprofilering, producerer fodsporene, der udviser karakteristisk tripletperioditet. Denne protokol beskriver, hvordan du bruger RiboCode til at dechiffrere denne fremtrædende funktion fra ribosomprofileringsdata for at identificere aktivt oversatte åbne læserammer på hele transkriptomniveau.
Identifikation af åbne læserammer (ORF’er), især dem, der koder for små peptider og aktivt oversættes under specifikke fysiologiske sammenhænge, er afgørende for omfattende kommentarer til kontekstafhængige translatomer. Ribosomprofilering, en teknik til påvisning af bindingssteder og tætheder ved oversættelse af ribosomer på RNA, giver en mulighed for hurtigt at opdage, hvor translation sker på genom-bred skala. Det er dog ikke en triviel opgave inden for bioinformatik effektivt og omfattende at identificere de oversættende ORF’er til ribosomprofilering. Beskrevet her er en brugervenlig pakke, der hedder RiboCode, designet til aktivt at oversætte ORF’er af enhver størrelse fra forvrængede og tvetydige signaler i ribosomprofileringsdata. Med vores tidligere offentliggjorte datasæt som et eksempel indeholder denne artikel trinvise instruktioner til hele RiboCode-pipelinen, fra forbehandling af de rå data til fortolkning af de endelige outputresultatfiler. For at evaluere oversættelseshastighederne for de kommenterede ORF’er er procedurerne for visualisering og kvantificering af ribosomtætheder på hver ORF også beskrevet detaljeret. Sammenfattende er denne artikel en nyttig og rettidig instruktion for forskningsområderne relateret til oversættelse, små ORF’er og peptider.
For nylig har en voksende mængde undersøgelser afsløret udbredt produktion af peptider oversat fra ORF’er af kodende gener og de tidligere kommenterede gener som ikke-kodende, såsom lange ikke-kodende RNA’er (lncRNA’er)1,2,3,4,5,6,7,8. Disse oversatte ORF’er reguleres eller induceres af celler til at reagere på miljøændringer, stress og celledifferentiering1,8,9,10,11,12,13. Oversættelsesprodukterne fra nogle ORF’er har vist sig at spille vigtige regulerende roller i forskellige biologiske processer inden for udvikling og fysiologi. For eksempel opdagede Chng et al.14 et peptidhormon ved navn Elabela (Ela, også kendt som Apela / Ende / Toddler), som er kritisk for kardiovaskulær udvikling. Pauli et al. foreslog, at Ela også fungerer som et mitogen, der fremmer cellemigration i det tidlige fiskeembryo15. Magny et al. rapporterede to mikropeptider på mindre end 30 aminosyrer, der regulerer calciumtransport og påvirker regelmæssig muskelkontraktion i Drosophila-hjertet10.
Det er fortsat uklart, hvor mange sådanne peptider der er kodet af genomet, og om de er biologisk relevante. Derfor er systematisk identifikation af disse potentielt kodende ORF’er yderst ønskelig. Direkte bestemmelse af produkterne fra disse ORF’er (dvs. protein eller peptid) ved hjælp af traditionelle tilgange såsom evolutionær bevarelse16,17 og massespektrometri18,19 er imidlertid udfordrende, fordi detektionseffektiviteten af begge tilgange er afhængig af længden, overfloden og aminosyresammensætningen af de producerede proteiner eller peptider. Fremkomsten af ribosomprofilering, en teknik til identifikation af ribosombelægningen på mRNA’er ved nukleotidopløsning, har givet en præcis måde at evaluere kodningspotentialet for forskellige transkripter3,20,21, uanset deres længde og sammensætning. En vigtig og hyppigt anvendt funktion til identifikation af aktivt oversættelse af ORF’er ved hjælp af ribosomprofilering er tre-nukleotid (3-nt) periodiciteten af ribosomets fodaftryk på mRNA fra startkodonen til stopkodonen. Imidlertid har ribosomprofileringsdata ofte flere problemer, herunder lave og sparsomme sekventeringslæsninger langs ORF’er, høj sekventeringsstøj og ribosomal RNA (rRNA) forurening. Således svækker de forvrængede og tvetydige signaler, der genereres af sådanne data, 3-nt periodicitetsmønstrene for ribosomers fodaftryk på mRNA, hvilket i sidste ende gør identifikationen af de højtillidsoversatte ORF’er vanskelig.
En pakke med navnet “RiboCode” tilpassede en modificeret Wilcoxon-signed-rank test og P-værdi integrationsstrategi for at undersøge, om ORF har betydeligt flere ribosombeskyttede fragmenter (RPF’er) i rammen end off-frame RPF’er22. Det blev påvist at være yderst effektivt, følsomt og nøjagtigt for de novo-annotation af translatomet i simulerede og reelle ribosomprofileringsdata. Her beskriver vi, hvordan du bruger dette værktøj til at registrere de potentielle oversættelses-ORF’er fra de rå ribosomprofileringssekventeringsdatasæt, der blev genereret af den foregående undersøgelse23. Disse datasæt var blevet brugt til at undersøge funktionen af EIF3-underenheden “E” (EIF3E) i oversættelse ved at sammenligne ribosombelægningsprofilerne for MCF-10A-celler transfekteret med kontrol (si-Ctrl) og EIF3E (si-eIF3e) småinterfererende RNA’er (siRNA’er). Ved at anvende RiboCode på disse eksempeldatasæt opdagede vi 5.633 nye ORF’er, der potentielt koder for små peptider eller proteiner. Disse ORF’er blev kategoriseret i forskellige typer baseret på deres placering i forhold til de kodende regioner, herunder opstrøms ORF’er (uORF’er), nedstrøms ORF’er (dORF’er), overlappede ORF’er, ORF’er fra nye proteinkodende gener (nye PCG’er) og ORF’er fra nye ikke-proteinkodende gener (nye ikke-PCG’er). RPF-læsetæthederne på uORF’er blev signifikant øget i EIF3E-mangelfulde celler sammenlignet med kontrolceller, hvilket i det mindste delvist kan være forårsaget af berigelsen af aktivt oversættende ribosomer. Den lokaliserede ribosomakkumulering i regionen fra den 25. til 75. codon af EIF3E-mangelfulde celler indikerede en blokering af translationsforlængelse i det tidlige stadium. Denne protokol viser også, hvordan man visualiserer RPF-densiteten i det ønskede område til undersøgelse af 3-nt periodicitetsmønstre af ribosomfodaftryk på identificerede ORF’er. Disse analyser viser RiboCodes stærke rolle i at identificere oversættelse af ORF’er og studere reguleringen af oversættelse.
Ribosomprofilering giver en hidtil uset mulighed for at studere ribosomernes virkning i celler på genomskala. Præcis dechifrering af de oplysninger, der bæres af ribosomprofileringsdataene, kan give indsigt i, hvilke regioner af gener eller transkripter der aktivt oversættes. Denne trinvise protokol giver vejledning i, hvordan du bruger RiboCode til at analysere ribosomprofileringsdata i detaljer, herunder pakkeinstallation, dataforberedelse, kommandoudførelse, resultatforklaring og datavisualisering. Analyseresulta…
The authors have nothing to disclose.
Forfatterne vil gerne anerkende støtten fra de beregningsmæssige ressourcer, der leveres af HPCC-platformen fra Xi’an Jiaotong University. Z.X. takker taknemmeligt Young Topnotch Talent Support Plan fra Xi’an Jiaotong University.
A computer/server running Linux | Any | – | – |
Anaconda or Miniconda | Anaconda | – | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | – | https://www.r-project.org/ |
Rstudio | Rstudio | – | https://www.rstudio.com/ |