Här presenterar vi ett protokoll som demonstrerar installation och användning av en bioinformatisk pipeline för att analysera chimära RNA-sekvenseringsdata som används i studien av in vivo RNA:RNA-interaktioner.
En förståelse av in vivo-genregulatoriska interaktioner mellan små icke-kodande RNA (sncRNA), såsom mikroRNA (miRNA), och deras mål-RNA har utvecklats under de senaste åren genom biokemiska metoder som använder tvärbindning följt av ligering för att fånga sncRNA:mål-RNA-interaktioner genom bildandet av chimära RNA och efterföljande sekvenseringsbibliotek. Även om datauppsättningar från chimär RNA-sekvensering ger genomomfattande och betydligt mindre tvetydiga indata än miRNA-förutsägelseprogramvara, kräver destillering av dessa data till meningsfull och användbar information ytterligare analyser och kan avskräcka forskare som saknar beräkningsbakgrund. Den här rapporten innehåller en handledning för att stödja beräkningsbiologer på nybörjarnivå i att installera och tillämpa ett nytt programvaruverktyg med öppen källkod: Small Chimeric RNA Analysis Pipeline (SCRAP). Plattformskrav, uppdateringar och en förklaring av pipelinesteg och manipulering av viktiga variabler för användarindata tillhandahålls. Att minska ett hinder för biologer att få insikter från chimära RNA-sekvenseringsmetoder har potential att bli språngbrädan för upptäcktsbaserade undersökningar av regulatoriska sncRNA:mål-RNA-interaktioner i flera biologiska sammanhang.
Små icke-kodande RNA är mycket studerade för sina post-transkriptionella roller i koordinering av uttryck från sviter av gener i olika processer såsom differentiering och utveckling, signalbehandling och sjukdom 1,2,3. Förmågan att noggrant bestämma måltranskripten för genreglerande små icke-kodande RNA (sncRNA), inklusive mikroRNA (miRNA), är av betydelse för studier av RNA-biologi på både grundläggande och translationell nivå. Bioinformatiska algoritmer som utnyttjar förväntad komplementaritet mellan miRNA-frösekvensen och dess potentiella mål har ofta använts för att förutsäga miRNA:mål-RNA-interaktioner. Även om dessa bioinformatiska algoritmer har varit framgångsrika, kan de också innehålla både falskt positiva och falskt negativa resultat, vilket har granskats på andra ställen 4,5,6. Nyligen har flera biokemiska metoder utformats och implementerats som möjliggör entydig och semikvantitativ bestämning av de vivo sncRNA:mål-RNA-interaktioner genom in vivo-tvärbindning och efterföljande införlivande av ett ligeringssteg för att fysiskt fästa sncRNA till dess mål för att bilda ett enda chimärt RNA 4,5,7,8,9,10 . Efterföljande beredning av sekvenseringsbibliotek från de chimära RNA:erna möjliggör bedömning av sncRNA:mål-RNA-interaktionerna genom beräkningsbearbetning av sekvenseringsdata. Den här videon ger en handledning för att installera och använda en beräkningspipeline som kallas liten chimär RNA-analyspipeline (SCRAP), som är utformad för att möjliggöra robust och reproducerbar analys av sncRNA:mål-RNA-interaktioner från chimära RNA-sekvenseringsbibliotek6.
Ett mål med denna handledning är att hjälpa utredare att undvika överdrivet beroende av rent prediktiva bioinformatiska algoritmer genom att sänka barriärerna för analys av data som genereras genom biokemiska metoder som ger chimära molekylära avläsningar av sncRNA:mål-RNA-interaktioner. Denna handledning ger praktiska steg och tips för att vägleda beräkningsforskare på nybörjarnivå genom användning av en pipeline, SCRAP, utvecklad för att analysera chimära RNA-sekvenseringsdata, som kan genereras av flera befintliga biokemiska protokoll, inklusive tvärbindning, ligering och sekvensering av hybrider (CLASH) och kovalent ligering av endogena argonautebundna RNA – tvärbindning och immunoprecipitation (CLEAR-CLIP)7,9.
Användningen av SCRAP erbjuder flera fördelar för analys av chimära RNA-sekvenseringsdata, jämfört med andra beräkningspipelines6. En framträdande fördel är dess omfattande anteckningar och införlivandet av anrop till välstödda och rutinmässigt uppdaterade bioinformatiska skript i pipelinen, jämfört med alternativa pipelines som ofta förlitar sig på anpassade och/eller icke-stödda skript för steg i pipelinen. Denna funktion ger stabilitet till SCRAP, vilket gör det mer värt för forskare att bekanta sig med pipelinen och att införliva dess användning i sitt arbetsflöde. SCRAP har också visat sig överträffa alternativa pipelines när det gäller att anropa toppar av sncRNA:mål-RNA-interaktioner och att ha plattformsoberoende funktionalitet, vilket beskrivs i en tidigare publikation6.
I slutet av den här självstudien kommer användarna att kunna (i) känna till plattformskraven för SCRAP och installera SCRAP-pipelines, (ii) installera referensgenom och konfigurera kommandoradsparametrar för SCRAP, och (iii) förstå toppanropskriterier och utföra toppanrop och toppnotering.
Den här videon kommer att beskriva i praktisk detalj hur forskare som studerar RNA-biologi kan installera och optimalt använda beräkningspipelinen, SCRAP, för att analysera sncRNA-interaktioner med mål-RNA, såsom budbärar-RNA, i chimära RNA-sekvenseringsdata som erhållits genom en av de diskuterade biokemiska metoderna för sekvenseringsbiblioteksberedning.
SCRAP är ett kommandoradsverktyg. I allmänhet, genom att följa guiden nedan, måste användaren (i) ladda ner och installera SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) installera referensgenom och köra SCRAP, och (iii) utföra toppanrop och anteckningar.
Mer information om beräkningsstegen i den här proceduren finns på https://github.com/Meffert-Lab/SCRAP. Den här artikeln kommer att ge installations- och bakgrundsinformation för att göra det möjligt för utredare med beräkningskunskaper på nybörjarnivå att installera, optimera och använda SCRAP på chimära RNA-sekvenseringsbiblioteksdatauppsättningar.
Detta protokoll om användningen av SCRAP-pipeline för analys av sncRNA:mål-RNA-interaktioner är utformat för att hjälpa utredare som går in i beräkningsanalys. Slutförandet av handledningen förväntas vägleda utredare med nybörjar- eller större beräkningserfarenhet genom de steg som krävs för installation och användning av denna pipeline och dess tillämpning för att analysera data som erhållits från chimära RNA-sekvenseringsbibliotek. Åtgärder som är avgörande för slutförandet av detta protoko…
The authors have nothing to disclose.
Vi tackar medlemmarna i Meffert-laboratoriet för givande diskussioner, inklusive BH Powell och WT Mills IV, för kritisk feedback om beskrivningen av installationen och implementeringen av rörledningen. Detta arbete stöddes av ett pris från Braude Foundation, Maryland Stem Cell Research Fund Launch Program, Blaustein Endowment for Pain Research and Education Award och NINDS RO1NS103974 och NIMH RO1MH129292 till M.K.M.
Genomes | UCSC Genome browser | N/A | https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/ |
Linux | Linux | Ubuntu 20.04 or 22.04 LTS recommended | |
Mac | Apple | Mac OSX (>11) | |
Platform setup | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] |
SCRAP pipeline | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP |
Unix shell | Unix operating system | bash >=5.0 | |
Unix shell | Unix operating system | zsh (5.9 recommended) | |
Windows | Windows | WSL Ubuntu 20.04 or 22.04 LTS |