Biology

Handledning för beräkningsanalys för chimära små icke-kodande RNA: Mål-RNA-sekvenseringsbibliotek

Published: December 1, 2023 doi: 10.3791/65779

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert^1,2

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Summary

Här presenterar vi ett protokoll som demonstrerar installation och användning av en bioinformatisk pipeline för att analysera chimära RNA-sekvenseringsdata som används i studien av in vivo RNA:RNA-interaktioner.

Abstract

En förståelse av in vivo-genregulatoriska interaktioner mellan små icke-kodande RNA (sncRNA), såsom mikroRNA (miRNA), och deras mål-RNA har utvecklats under de senaste åren genom biokemiska metoder som använder tvärbindning följt av ligering för att fånga sncRNA:mål-RNA-interaktioner genom bildandet av chimära RNA och efterföljande sekvenseringsbibliotek. Även om datauppsättningar från chimär RNA-sekvensering ger genomomfattande och betydligt mindre tvetydiga indata än miRNA-förutsägelseprogramvara, kräver destillering av dessa data till meningsfull och användbar information ytterligare analyser och kan avskräcka forskare som saknar beräkningsbakgrund. Den här rapporten innehåller en handledning för att stödja beräkningsbiologer på nybörjarnivå i att installera och tillämpa ett nytt programvaruverktyg med öppen källkod: Small Chimeric RNA Analysis Pipeline (SCRAP). Plattformskrav, uppdateringar och en förklaring av pipelinesteg och manipulering av viktiga variabler för användarindata tillhandahålls. Att minska ett hinder för biologer att få insikter från chimära RNA-sekvenseringsmetoder har potential att bli språngbrädan för upptäcktsbaserade undersökningar av regulatoriska sncRNA:mål-RNA-interaktioner i flera biologiska sammanhang.

Introduction

Små icke-kodande RNA är mycket studerade för sina post-transkriptionella roller i koordinering av uttryck från sviter av gener i olika processer såsom differentiering och utveckling, signalbehandling och sjukdom ^1,2,3. Förmågan att noggrant bestämma måltranskripten för genreglerande små icke-kodande RNA (sncRNA), inklusive mikroRNA (miRNA), är av betydelse för studier av RNA-biologi på både grundläggande och translationell nivå. Bioinformatiska algoritmer som utnyttjar förväntad komplementaritet mellan miRNA-frösekvensen och dess potentiella mål har ofta använts för att förutsäga miRNA:mål-RNA-interaktioner. Även om dessa bioinformatiska algoritmer har varit framgångsrika, kan de också innehålla både falskt positiva och falskt negativa resultat, vilket har granskats på andra ställen ^4,5,6. Nyligen har flera biokemiska metoder utformats och implementerats som möjliggör entydig och semikvantitativ bestämning av in vivo sncRNA:mål-RNA-interaktioner genom in vivo-tvärbindning och efterföljande införlivande av ett ligeringssteg för att fysiskt fästa sncRNA till dess mål för att bilda ett enda chimärt RNA 4,5,7,8,9,10 . Efterföljande beredning av sekvenseringsbibliotek från de chimära RNA:erna möjliggör bedömning av sncRNA:mål-RNA-interaktionerna genom beräkningsbearbetning av sekvenseringsdata. Den här videon ger en handledning för att installera och använda en beräkningspipeline som kallas liten chimär RNA-analyspipeline (SCRAP), som är utformad för att möjliggöra robust och reproducerbar analys av sncRNA:mål-RNA-interaktioner från chimära RNA-sekvenseringsbibliotek⁶.

Ett mål med denna handledning är att hjälpa utredare att undvika överdrivet beroende av rent prediktiva bioinformatiska algoritmer genom att sänka barriärerna för analys av data som genereras genom biokemiska metoder som ger chimära molekylära avläsningar av sncRNA:mål-RNA-interaktioner. Denna handledning ger praktiska steg och tips för att vägleda beräkningsforskare på nybörjarnivå genom användning av en pipeline, SCRAP, utvecklad för att analysera chimära RNA-sekvenseringsdata, som kan genereras av flera befintliga biokemiska protokoll, inklusive tvärbindning, ligering och sekvensering av hybrider (CLASH) och kovalent ligering av endogena argonautebundna RNA - tvärbindning och immunoprecipitation (CLEAR-CLIP)^7,9.

Användningen av SCRAP erbjuder flera fördelar för analys av chimära RNA-sekvenseringsdata, jämfört med andra beräkningspipelines⁶. En framträdande fördel är dess omfattande anteckningar och införlivandet av anrop till välstödda och rutinmässigt uppdaterade bioinformatiska skript i pipelinen, jämfört med alternativa pipelines som ofta förlitar sig på anpassade och/eller icke-stödda skript för steg i pipelinen. Denna funktion ger stabilitet till SCRAP, vilket gör det mer värt för forskare att bekanta sig med pipelinen och att införliva dess användning i sitt arbetsflöde. SCRAP har också visat sig överträffa alternativa pipelines när det gäller att anropa toppar av sncRNA:mål-RNA-interaktioner och att ha plattformsoberoende funktionalitet, vilket beskrivs i en tidigare publikation⁶.

I slutet av den här självstudien kommer användarna att kunna (i) känna till plattformskraven för SCRAP och installera SCRAP-pipelines, (ii) installera referensgenom och konfigurera kommandoradsparametrar för SCRAP, och (iii) förstå toppanropskriterier och utföra toppanrop och toppnotering.

Den här videon kommer att beskriva i praktisk detalj hur forskare som studerar RNA-biologi kan installera och optimalt använda beräkningspipelinen, SCRAP, för att analysera sncRNA-interaktioner med mål-RNA, såsom budbärar-RNA, i chimära RNA-sekvenseringsdata som erhållits genom en av de diskuterade biokemiska metoderna för sekvenseringsbiblioteksberedning.

SCRAP är ett kommandoradsverktyg. I allmänhet, genom att följa guiden nedan, måste användaren (i) ladda ner och installera SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) installera referensgenom och köra SCRAP, och (iii) utföra toppanrop och anteckningar.

Mer information om beräkningsstegen i den här proceduren finns på https://github.com/Meffert-Lab/SCRAP. Den här artikeln kommer att ge installations- och bakgrundsinformation för att göra det möjligt för utredare med beräkningskunskaper på nybörjarnivå att installera, optimera och använda SCRAP på chimära RNA-sekvenseringsbiblioteksdatauppsättningar.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

OBS: Protokollet börjar med att ladda ner och installera programvara som krävs för att analysera chimära RNA-sekvenseringsbibliotek med hjälp av SCRAP.

1. Montering

Innan du installerar SCRAP installerar du beroendena Git och Miniconda på den dator som ska användas för analyserna. Git är troligen redan installerat. På Mac OSX-plattformen, till exempel, verifiera detta med vilken git för att se att " git "-verktyget finns och är installerat i den här katalogen. Kontrollera om Miniconda är installerat med vilken conda. Om inget returneras, installera Miniconda. Miniconda kräver 400 MB diskutrymme för att installeras.
1. Det finns några metoder för att installera Miniconda, och de skiljer sig åt beroende på plattform. Se PLATFORM-SETUP-markdown-filen på Meffert Labs GitHub-lagringsplats [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] där det finns ytterligare instruktioner för installation på Windows, MacOS och Ubuntu. För Linux-användare har Linux en egen standardpakethanterare (apt). I det fall som är specifikt för den här studien använder du kommandot brew install Miniconda för att installera Miniconda med hjälp av en befintlig pakethanterare, brew.
  OBS: 'Homebrew', kallad 'brew' är ett system för hantering av programvarupaket med öppen källkod som förenklar installationen av programvara på Apples operativsystem, macOS.
2. Om conda installeras för första gången kör du conda init för det specifika gränssnitt som används. I exemplet här är det skalet som används zsh. Stäng sedan skalet och öppna det igen. Om conda har installerats visas basmiljön som är aktiverad i terminalsessionen.
Ladda ned SCRAP-källan och installera dess beroenden.
1. Den föredragna metoden för att hämta SCRAP-källan är att använda Git. Få åtkomst till detta genom att köra git clone https://github.com/Meffert-Lab/SCRAP för att få den senaste kopian av källkoden.
2. Installera mamba, en förbättrad paketlösare för conda, och installera alla beroenden för SCRAP från SCRAP_environment.yml till sin egen conda-miljö med hjälp av följande kommandon:
  conda install -n base conda-forge::mamba
  mamba env create -f SCRAP/SCRAP_environment.yml -n SCRAP
Kör sedan referensinstallationen för SCRAP. Argumenten som används i referensinstallationen kommer att vara specifika för den organism vars sncRNA-mRNA-interaktioner analyseras.
bash SCRAP/bin/Reference_Installation.sh -r full/path/to/SCRAP/ -m har -g hg38 -s human
1. Ange katalogen för SCRAP-källmappen för referensinstallation. Installationsstegen kommer sedan att utföras med hjälp av filerna i mapparna fasta och annotation . Visa en lista över den fullständiga sökvägen utan förkortning. Avsluta med ett snedstreck.
2. Se tabellerna i README.md för korrekta förkortningar av miRbase-arter. De aktuella referensgenomen finns på https://genome.ucsc.edu/ eller https://www.ncbi.nlm.nih.gov/data-hub/genome/. I det här exemplet kommer hg38 att användas för musens GRCm38-genom.
3. De arter som för närvarande ingår för annotering är människa, mus och mask. Visa motsvarande species.annotation.bed-filer i annoteringskatalogen i källmappen SCRAP. Om du vill använda en annan art för analys anger du en annotation.bed-fil som följer samma namngivningsschema species.annotation.bed.

2. Köra SKROT

Nu när beroendena och SCRAP har installerats kör du skriptet SCRAP.sh
bash SCRAP/bin/SCRAP.sh -d full/sökväg/till/CLASH_Human/ -a full/sökväg/till/CLASH_Human/CLASH_Human_Adapters.txt -p nej -f ja -r full/sökväg/till/SKROT/ -m har -g hg38
1. Visa en lista över hela sökvägen till exempelkatalogerna utan förkortning. Formatera exempelkatalogerna med mappnamnet som matchar exempelnamnet exakt, som du ser i bild 1.
2. Observera att sökvägen som visas är sökvägen till katalogen som innehåller alla exempelmappar, inte sökvägen till någon enskild exempelmapp eller en exempelfil (se kommandoraden i steg 2.1).
3. Lista sedan hela sökvägen till adapterfilen. Kontrollera att exempelnamnen i adapterfilen matchar de tidigare nämnda mappnamnen och filnamnen (se kommandoraden i steg 2.1).
4. Ange om proverna är parade och om filtrering för pre-miRNA och/eller tRNA kommer att utföras eller inte. Lägg till ett filter för rRNA-rengöring om så önskas (se kommandoraden i steg 2.1).
  OBS: Användarna kan välja att använda dessa filter beroende på provtyperna och experimentmålen. Beroende på den experimentella designen kan pre-miRNA, tRNA och rRNA konsumera tillgängligt sekvenseringsdjup för verkliga sncRNA:mål-RNA-chimärer och användare kan använda filter för att utesluta dem. Användare kan dock vilja undvika sådan filtrering under vissa omständigheter (t.ex. mappning av sncRNA-mål till mitokondriegenomet, som innehåller mitokondriella rRNA).
5. Lista sedan hela sökvägen till referenskatalogen, miRbase-förkortningen och referensgenomförkortningen (se kommandoraden i steg 2.1).
  Skriptet kan ta några timmar att slutföra, beroende på datauppsättningens storlek och processorn på den dator som används.

3. Toppsamtal och kommentarer

När SCRAP har körts kontrollerar du att utdata bland annat innehåller en SAMPLE.aligned.unique.bam-fil. Detta är en binär fil som innehåller anpassningar av mål-RNA till det referensgenom som tillhandahålls av användaren.
Utför nu toppsamtal genom att köra Peak_Calling.sh.
bash SKROT/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f nej -r SKROT/ -m har -g hg38
OBS: Peak calling är en funktion i SCRAP, som är utformad för att göra det möjligt för forskare att enkelt utvärdera de mest robusta och reproducerbara små icke-kodande RNA:mål-RNA-interaktionerna i sina chimära RNA-bibliotek. Den här funktionen kan till exempel hjälpa forskare att identifiera interaktioner som de kanske vill välja för vidare undersökning. Steg 3.2.2 nedan beskriver hur användaren ställer in de kriterier som de vill ska användas för att definiera stringensen med vilken en topp anropas - detta inkluderar antalet unika interaktioner, eller sekvensläsningar, som måste ha inträffat för att toppen ska anropas, samt antalet bibliotek där denna specifika interaktion måste ha inträffat.
1. Återigen listar du de fullständiga sökvägarna till katalogen som innehåller exempelmapparna och adapterfilen (se kommandoraden i steg 3.2).
2. Ställ sedan in det minsta antalet sekvensläsningar som krävs för att en topp ska anropas (se kommandoraden i steg 3.2).
3. Ange det minsta antalet distinkta sekvenseringsbibliotek som måste innehålla en topp för att den ska anropas (se kommandoraden i steg 3.2).
  Anmärkning: Valet av värden för både 3.2.2 och 3.2.3 beror på arten av de sekvenserade proverna och antalet prover eller provtyper. Här krävs minst 3 chimära sekvenseringsläsningar i ett exempel för att anropa en topp, och toppen måste stödjas av minst 2 exempel. En utredare som utvärderar en datauppsättning där det finns många repliker av sekvenseringsbibliotek för ett visst villkor kan till exempel bestämma sig för att kräva att läsningarna finns i ett större antal exempelsekvenseringsbibliotek.
4. Ange om sncRNA i samma familj måste bidra till samma topp. Till exempel, eftersom miRNA från samma familj delar frösekvenser, kan dessa miRNA binda delade och överlappande uppsättningar av genmål; En användare kanske vill identifiera den fulla effekten av en familj på dessa mål genom att bedöma deras kollektiva toppar (se kommandoraden i steg 3.2).
5. Ange sedan den fullständiga sökvägen till referenskatalogen, förkortningen miRBase och referensgenomförkortningen (se kommandoraden i steg 3.2).
När toppanropet är klart kör du toppnoteringen.
bash SKROT / bin / Peak_Annotation.sh -p CLASH_Human / toppar.bed -r SKROT / -s mänsklig
1. Visa en lista över den fullständiga sökvägen till den resulterande peaks.bed-filen (eller peaks.family.bed ) från toppanrop, den fullständiga sökvägen till referenskatalogen och önskad art för anteckning.

4. Visualisering av data

OBS: Alla steg för analys med SCRAP är nu slutförda. För visualisering av data rekommenderas flera metoder:

Slå samman alla .bam-filer (binär SAM-fil) som du vill visualisera tillsammans (samtools merge).
Sortera den resulterande sammanslagna .bam-filen (samtools sort). Filinnehållet sorteras rad för rad så att samtools kan indexeras.
Indexera den sorterade .bam-filen (samtools index). En BAI-fil (binary samtools format index) genereras för att möjliggöra visualisering i IGV (Integrative Genomics Viewer).
Öppna slutligen den resulterande sorterade .bam- och indexerade .bai-filen i IGV.
OBS: SncRNA: Mål-RNA-interaktioner av intresse kan prioriteras för uppföljning på ett antal undersökningsspecifika sätt. En allmän inledande metod är att utvärdera de interaktioner för vilka toppar som stöds av de mest chimära sekvensläsningarna. Interaktioner av intresse kan också visualiseras med hjälp av DuplexFold-webbservern från RNAstructure-paketet genom att mata in sekvensen för både sncRNA och mål-RNA från den detekterade interaktionen¹¹. För varje topp kan kromosomen (första kolumnen) och genomiska koordinater (start: 1:a kolumnslutet: 2:a kolumnen) hittas i den peaks.bed.species.annotation.txt filen som genereras i toppannoteringen. I synnerhet för miRNA, även om reproducerbara och funktionella interaktioner kan sakna omfattande frömatchad bindning (t.ex. kan interaktioner använda 3'-kompensatorisk bindning), kan förekomsten av frömatchade platser i ett besläktat bindningsmotiv av mål-RNA ändå bedömas som en validerande egenskap hos funktionellt viktiga detekterade interaktioner ^4,12. Kompletterande databehandling skulle kunna omfatta jämförelser av differentiell avläsningstäckning mellan toppar i distinkta biologiska förhållanden och eventuellt bedömning av klusterbildning av reglerade gener i signalvägar med hjälp av ett analysverktyg för signalvägar.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Resultat för sncRNA:mål-RNA detekterat av en modifierad version av SCRAP (SCRAP release 2.0, som implementerar modifieringar för rRNA-filtrering) på tidigare publicerade sekvenseringsdataset framställda med CLEAR-CLIP⁹ visas i figur 2 och tabell 1. Användare kan uppskatta minskningen av den relativa fraktionen av miRNA-interaktioner med intronregioner som inträffar efter isolering av interaktioner med hög konfidens genom toppanrop i SCRAP. Ytterligare data från analyser med hjälp av SCRAP finns också tillgängliga i den första publiceringen av denna pipeline⁶. Beroende på det experimentella tillvägagångssättet kan filtrering av sekvenseringsdata från förberedda chimära RNA-bibliotek krävas för att minska artefakter i resultaten. Suboptimal biokemisk beredning av sekvenseringsbiblioteket och/eller suboptimal filtrering av sekvenseringsdata har potential att resultera i felaktig inkludering av läsningar som inte uppstått från ligering av sncRNA och mål-RNA bundna av Argonaute. Dessa artefaktiska läsningar kan inkludera primerdimerer eller adapterdimerer, rRNA och pre-miRNA. Tabell 2 beskriver möjliga artefakter som kan upptäckas i resultat och potentiella lösningar.

Bild 1: Formatering för datakataloger. Filer som innehåller råläsningar för varje sekvenseringsbibliotek måste anges i .fastq.gz-format. (A) Om biblioteken inte är parade kommer en enda .fastq.gz fil att användas i analysen. Den här filen ska heta "SAMPLE.fastq.gz" där SAMPLE är det exakta exempelnamnet som anges av användaren i adapterfilen. Filen ska finnas i en mapp som matchar exempelnamnet exakt. (B) För sekvenseringsbibliotek med parad ände används två .fastq.gz filer. Dessa filer ska heta "SAMPLE-R1.fastq.gz" och "SAMPLE-R2.fastq.gz" och ska finnas i en mapp som matchar exempelnamnet exakt. Alla sådana kataloger med namnet SAMPLE ska finnas i samma överordnade katalog, som användaren kommer att tillhandahålla SCRAP som "exempelkatalog". Klicka här för att se en större version av denna figur.

Figur 2: Andel miRNA:mål-RNA-interaktioner efter måltyp och Peak Calling-metoder. Chimär sncRNA:mål-RNA-sekvensering publicerade data från bibliotek framställda med CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ analyserades med hjälp av en modifierad version av SCRAP (SCRAP release 2.0) med rRNA-filtrering implementerad. Pre-miRNA, tRNA och rRNA filtrerades, och distinkta toppanropsinställningar användes för "hög konfidens" (minst 3 läsningar och 2 bibliotek) och "alla interaktioner" (minst 1 läsning och 1 bibliotek). Interaktioner grupperades efter miRNA-familj eller ogrupperade. Relativa fraktioner av chimära RNA-avläsningar för kategorierna (CDS, 5' UTR, intergenic, intron, 3'UTR) beräknades och graferades. Klicka här för att se en större version av denna figur.

	Alla interaktioner		Interaktioner med hög konfidens
	Enskilda miRNA	miRNA-familjer	Enskilda miRNA	miRNA-familjer
CD	8675	8679	925	1046
5' UTR	338	338	38	43
Intergen	2230	2230	320	339
Intron	9522	9519	382	406
3' UTR	6814	6813	548	644
Totalt antal interaktioner:	31033	31034	4219	4597

Tabell 1: Chimära läsantal miRNA:mål-RNA-interaktioner efter måltyp och toppanropsmetod. Chimära sncRNA:mål-RNA-sekvenseringsdata publicerade från bibliotek framställda med CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ analyserades med en modifierad version av SCRAP (SCRAP release 2.0) med rRNA-filtrering implementerad. Pre-miRNA, tRNA och rRNA filtrerades, och distinkta toppanropsinställningar användes för hög konfidens (minst 3 läsningar och 2 bibliotek) och alla (minst 1 läsning och 1 bibliotek) interaktioner, grupperade efter miRNA-familj eller ogrupperade. För varje tillstånd listas antalet totala detekterade miRNA:mål-RNA-interaktioner där mål-RNA-interaktionen mappades till kategorin kodande sekvens (CDS), 5' otolkad region (5' UTR), intergen region, intron eller 3' otolkad region (3'UTR).

Potentiell förorening	Identifierad som	Orsakar	Potentiella lösningar
Primer dimerer	Interaktioner detekterade mellan miRNA vars sekvens matchar 5'-änden av en amplifieringsprimer och ett mål-RNA vars sekvens matchar resten av primern.	Felaktig storleksseparering (dvs. gelextraktion) av PCR-produkten efter amplifiering.	De flesta primerdimerer kommer att ignoreras av SKROT efter att adaptern tagits bort på grund av deras lilla längd. Om de kvarstår bör du överväga att lägga till primersekvenser i ett filter.
rRNA	Interaktioner mellan godtyckliga miRNA och kända rRNA eller lncRNA Gm26917 och Gm42418	Ineffektiv isolering (dvs. immunoprecipitering och gelseparation) av Argonaute-komplex.	rRNA-filtrering är ofta nödvändig när rRNA-kontaminering är riklig.
tRNA och pre-miRNA	Interaktioner mellan tRNA-fragment som är nedbrytningsprodukter av samma tRNA eller 5p- och 3p-miRNA producerade från samma pre-miRNA.	Låg förekomst av äkta sncRNA:mål-RNA-chimärer eller lågt vävnads-Argonaute-uttryck.	tRNA-filtrering och pre-miRNA-filtrering.

Tabell 2: Avläsningar och lösningar för sekvensering av potentiella föroreningar.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Detta protokoll om användningen av SCRAP-pipeline för analys av sncRNA:mål-RNA-interaktioner är utformat för att hjälpa utredare som går in i beräkningsanalys. Slutförandet av handledningen förväntas vägleda utredare med nybörjar- eller större beräkningserfarenhet genom de steg som krävs för installation och användning av denna pipeline och dess tillämpning för att analysera data som erhållits från chimära RNA-sekvenseringsbibliotek. Åtgärder som är avgörande för slutförandet av detta protokoll inkluderar korrekt referensinstallation och körning av SCRAP, vilket kan vara tidskrävande och kan vara källan till fel, särskilt om försiktighet inte iakttogs under installationen av beroenden med Anaconda eller inmatning av kommandoradsargument.

Här har särskilt fokus legat på tips och steg för praktisk användning av SCRAP-pipelinen för analys av chimära sncRNA:mål-RNA-sekvenseringsbibliotek. SCRAP har visat sig överträffa andra chimära RNA-analysplattformar när det gäller detektion av sncRNA:mål-RNA-interaktioner ^6,13. Detta kan bero på SCRAP:s toppanropsfunktion som utvecklades specifikt för att detektera de egenskaper (t.ex. 3'-skuldra) som observeras som ett resultat av biokemiska steg som är involverade i bildandet av de chimära RNA:erna. Andra toppanropsmetoder för distinkta biokemiska metoder, såsom nedströms av applikationer för kromatinimmunutfällningssekvensering (CHIP-seq), har utvecklats för att upptäcka toppar i data som är symmetriskt fördelade runt ett medelvärde och vanligtvis inte fungerar lika bra när det gäller att detektera toppegenskaperna hos chimära sncRNA:mål-RNA-bibliotek. Användare kanske dock vill testa användningen av andra beräkningspipelines som kan fungera bättre för deras behov, särskilt om deras data inte passar in på denna beskrivning.

SCRAP har minimala maskinvarukrav, men SCRAP-körningen skalas dåligt med datauppsättningens storlek. Utredare som är bortom nybörjarnivån, eller som har ett stort antal datauppsättningar eller datauppsättningar med hög sekvenseringstäckning, kanske vill använda SCRAP på ett sätt som kan påskynda analysstegen. Eftersom stora datamängder (vanligtvis > 1 miljard läsningar) kräver förbättrade fillagringsfunktioner och läs-/skrivhastigheter för data, kan det vara önskvärt att köra SCRAP på ett HPC-kluster (High-Performance Computing) för analys av större datamängder. En SCRAP-optimering, som bör ge parallellisering och bättre prestanda, kommer att göras tillgänglig på GitHub (https://github.com/Meffert-Lab/). Denna uppdaterade version av SCRAP (release 2.0) har också förbättrade filter för rRNA och andra föroreningar.

Som med alla gränssnitt kan användare oundvikligen stöta på svårigheter när de använder kommandoradsgränssnittet. De vanligaste av dessa är felstavningar, felaktiga sökvägar och paketinstallation/versionshantering. Utredare rekommenderas att vara försiktiga och undvika stavfel när de skriver kommandoradsargument och att återge sökvägar till filer eller mappar exakt (användning av en "tab" autokomplettering kan hjälpa till med detta). Beroenden för SCRAP hanteras via Anaconda så att utredare är mindre benägna att stöta på problem med paketinstallation eller versionsuppdateringar.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Vi tackar medlemmarna i Meffert-laboratoriet för givande diskussioner, inklusive BH Powell och WT Mills IV, för kritisk feedback om beskrivningen av installationen och implementeringen av rörledningen. Detta arbete stöddes av ett pris från Braude Foundation, Maryland Stem Cell Research Fund Launch Program, Blaustein Endowment for Pain Research and Education Award och NINDS RO1NS103974 och NIMH RO1MH129292 till M.K.M.

Materials

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Biology

Handledning för beräkningsanalys för chimära små icke-kodande RNA: Mål-RNA-sekvenseringsbibliotek

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.