在这里,我们提出了一个协议,展示了生物信息学管道的安装和使用,以分析用于研究 体内 RNA:RNA相互作用的嵌合RNA测序数据。
近年来,通过生化方法,通过使用交联和连接,通过形成嵌合 RNA 和随后的测序文库来捕获 sncRNA:靶标 RNA 相互作用,从而推进了对小非编码 RNA (sncRNA) 等小非编码 RNA (sncRNA) 与其靶 RNA 的 体内 基因调控相互作用的理解。虽然来自嵌合RNA测序的数据集提供了全基因组的输入,并且比miRNA预测软件的模糊性要少得多,但将这些数据提炼成有意义和可操作的信息需要额外的分析,并且可能会劝阻缺乏计算背景的研究人员。本报告提供了一个教程,以支持入门级计算生物学家安装和应用最新的开源软件工具:小嵌合 RNA 分析管道 (SCRAP)。提供了平台要求、更新以及管道步骤和关键用户输入变量操作的说明。减少生物学家从嵌合RNA测序方法中获得见解的障碍,有可能在多种生物学背景下对调节性sncRNA:靶RNA相互作用进行基于发现的研究。
小的非编码 RNA 因其在不同过程中协调基因套件表达(如分化和发育、信号处理和疾病)中的转录后作用而受到高度研究 1,2,3。准确测定基因调控小非编码 RNA (sncRNA) 的靶转录本(包括 microRNA (miRNA)的能力对于基础和翻译水平的 RNA 生物学研究都很重要。利用miRNA种子序列与其潜在靶标之间预期互补性的生物信息学算法已经常用于预测miRNA:靶标RNA相互作用。虽然这些生物信息学算法已经成功,但它们也可能同时存在假阳性和假阴性结果,正如在其他地方所回顾的那样 4,5,6。最近,已经设计并实施了几种生化方法,这些方法允许通过体内交联和随后的连接步骤掺入将 sncRNA 物理连接到其靶标以形成单个嵌合 RNA 4,5,7,8,9,10 .随后从嵌合RNA制备测序文库,可以通过对测序数据的计算处理来评估sncRNA:靶RNA的相互作用。本视频提供了安装和使用称为小型嵌合 RNA 分析流程 (SCRAP) 的计算管道的教程,该流程旨在对嵌合 RNA 测序文库6 中的 sncRNA:靶标 RNA 相互作用进行稳健且可重复的分析。
本教程的目标是通过降低分析通过提供 sncRNA:靶 RNA 相互作用的嵌合分子读数的生化方法生成的数据的障碍,帮助研究人员避免过度依赖纯粹的预测性生物信息学算法。本教程提供了实用步骤和技巧,以指导入门级计算科学家使用管道 SCRAP,该管道是为分析嵌合 RNA 测序数据而开发的,这些数据可以由几种现有的生化方案生成,包括交联、连接和杂交种测序 (CLASH) 和内源性 Argonaute 结合 RNA 的共价连接 – 交联和免疫沉淀 (CLEAR-CLIP)7,9。
与其他计算管道相比,使用 SCRAP 为嵌合 RNA 测序数据的分析提供了几个优势6.一个突出的优点是,与通常依赖自定义和/或不支持的脚本进行管道步骤的替代管道相比,它具有广泛的注释,并将标注纳入管道中支持良好且定期更新的生物信息学脚本。此功能为 SCRAP 提供了稳定性,使研究人员更值得熟悉管道并将其使用纳入他们的工作流程。SCRAP也被证明在调用sncRNA:靶RNA相互作用的峰方面优于替代管道,并具有跨平台功能,详见先前的出版物6。
在本教程结束时,用户将能够 (i) 了解 SCRAP 的平台要求并安装 SCRAP 管道,(ii) 安装参考基因组并设置 SCRAP 的命令行参数,以及 (iii) 了解峰值调用标准并执行峰值调用和峰值注释。
本视频将详细描述研究 RNA 生物学的研究人员如何安装并优化使用计算管道 SCRAP,以分析嵌合 RNA 测序数据中的 sncRNA 与靶 RNA(如信使 RNA)的相互作用,这些数据是通过讨论的测序文库制备生化方法之一获得的。
SCRAP 是一个命令行实用程序。通常,按照以下指南,用户需要 (i) 下载并安装 SCRAP (https://github.com/Meffert-Lab/SCRAP),(ii) 安装参考基因组并运行 SCRAP,以及 (iii) 执行峰值检出和注释。
有关此过程中计算步骤的更多详细信息,请参见 https://github.com/Meffert-Lab/SCRAP。本文将提供设置和背景信息,使具有入门级计算技能的研究人员能够在嵌合 RNA 测序文库数据集上安装、优化和使用 SCRAP。
本关于使用 SCRAP 管道分析 sncRNA:靶标 RNA 相互作用的协议旨在帮助正在进入计算分析的研究人员。本教程的完成预计将指导具有入门级或更高计算经验的研究人员完成安装和使用该管道及其应用以分析从嵌合 RNA 测序文库获得的数据所需的步骤。完成此协议的关键步骤包括正确的参考安装和运行 SCRAP,这可能非常耗时,并且可能是错误的根源,尤其是在使用 Anaconda 安装依赖项或键入命令行参数时…
The authors have nothing to disclose.
我们感谢 Meffert 实验室的成员进行有益的讨论,包括 BH Powell 和 WT Mills IV,感谢他们对描述管道安装和实施的重要反馈。这项工作得到了布劳德基金会奖、马里兰州干细胞研究基金启动计划、布劳斯坦疼痛研究与教育基金会以及 NINDS RO1NS103974 和 NIMH 对 MKM RO1MH129292的支持。
Genomes | UCSC Genome browser | N/A | https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/ |
Linux | Linux | Ubuntu 20.04 or 22.04 LTS recommended | |
Mac | Apple | Mac OSX (>11) | |
Platform setup | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] |
SCRAP pipeline | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP |
Unix shell | Unix operating system | bash >=5.0 | |
Unix shell | Unix operating system | zsh (5.9 recommended) | |
Windows | Windows | WSL Ubuntu 20.04 or 22.04 LTS |