Summary

mirMachine:植物miRNA注释的一站式商店

Published: May 01, 2021
doi:

Summary

在这里,我们提出了一种新的全自动miRNA管道mirMachine,它1)可以更准确地识别已知和新型的miRNA,2)是全自动且免费提供的。用户现在可以执行一个简短的提交脚本来运行全自动的 mirMachine 管道。

Abstract

在不同类型的非编码RNA中,microRNA(miRNA)可以说在过去十年中一直备受关注。作为基因表达的转录后调节因子,miRNA在各种细胞途径中起着关键作用,包括发育和对a/生物胁迫(如干旱和疾病)的反应。拥有高质量的参考基因组序列能够在几种植物物种中鉴定和注释miRNA,其中miRNA序列高度保守。由于计算miRNA鉴定和注释过程大多是容易出错的过程,因此基于同源的预测提高了预测的准确性。在过去的十年中,我们开发并改进了miRNA注释管道SUmir,从那时起,该管道已被用于多个植物基因组。

本研究提出了一种完全自动化的新型miRNA管道mirMachine(miRNA Machine),方法是(i)在二级结构预测上增加额外的过滤步骤,(ii)使其完全自动化,以及(iii)引入新的选项来预测基于同源性的已知miRNA或使用以前的管道基于小RNA测序读数的新型miRNA。新的miRNA管道mirMachine使用拟南芥信息资源TAIR10, 拟南芥 基因组的发布和国际小麦基因组测序联盟(IWGSC)小麦参考基因组v2进行了测试。

Introduction

下一代测序技术的进步拓宽了对RNA结构和调控元件的理解,揭示了功能上重要的非编码RNA(ncRNA)。在不同类型的ncRNA中,microRNA(miRNA)构成了植物中长度在19至24个核苷酸之间的小RNA的基本调节类别12。自从在线虫秀丽隐杆线虫3中发现第一个miRNA以来,miRNA的存在和功能已经在动植物基因组以及4,56中得到了广泛的研究。miRNA通过靶向mRNA进行切割或翻译抑制来发挥作用7。越来越多的证据还表明,miRNA参与植物的各种生物过程,包括生长和发育8,自我生物发生9以及几种生物和非生物胁迫反应10

在植物中,miRNA最初是从称为pri-miRNA11的长初级转录本加工而来的。这些由细胞核内的RNA聚合酶II产生的pri-miRNA是长转录物,形成不完美的折返结构12。pri-miRNA后来经历切割过程,产生miRNA的内源性单链(ss)发夹前体,称为pre-miRNA11。前miRNA形成发夹状结构,其中单链折叠成双链结构以切除miRNA双链(miRNA/miRNA*)13。Dicer样蛋白切割miRNA/miRNA*双链的两条链,留下2-核苷酸3′-突出部1415。miRNA 双链体在细胞核内甲基化,保护 miRNA 的 3′-末端免受降解和尿苷化活性1617。解旋酶在输出后解开甲基化的miRNA双链体,并将成熟的miRNA暴露于细胞质中RNA诱导的沉默复合物(RISC)18。双链的一条链是成熟的miRNA并入RISC,而另一条链miRNA*被降解。miRNA-RISC复合物与靶序列结合,导致mRNA在完全互补的情况下降解,或在部分互补的情况下导致翻译抑制13

基于表达和生物发生特征,已经描述了miRNA注释的指南1519。根据定义的指南,Lucas和Budak开发了SUmir管道,以在植物9中进行基于同源的计算机miRNA鉴定。SUmir 管道由两个脚本组成:SUmirFind 和 SUmirFold。SUmirFind 通过国家生物技术信息中心 (NCBI) 基本局部比对搜索工具 (BLAST) 筛选对已知的 miRNA 数据集进行相似性搜索,并使用修改后的参数来包括只有 2 个或更少不匹配的命中,并避免偏向较短的命中(blastn-short -unapped -punishment -1 -reward 1)。SUmirFold使用UNAfold 21评估BLAST20结果中推定miRNA序列的二级结构。SUmirFold通过鉴定发夹结构的特征来区分miRNA与小干扰RNA。此外,它通过参数、最小折叠能量指数> 0.67 和 GC 含量 24-71% 来区分 miRNA 与其他 ssRNA(如 tRNA 和 rRNA)。该管道最近进行了更新,增加了两个额外的步骤,以(i)提高灵敏度,(ii)提高注释准确性,以及(iii)提供预测miRNA基因的基因组分布22。鉴于植物miRNA序列23的高度保守性,该管道最初设计用于基于同源的miRNA预测。然而,这种生物信息学分析无法准确鉴定新型miRNA,因为它严重依赖于密切相关物种之间miRNA的序列保守。

本文提出了一种新的全自动miRNA管道mirMachine,它1)可以更准确地识别已知和新型miRNA(例如,该管道现在使用基于sRNA-seq的新型miRNA预测以及基于同源的miRNA鉴定)和2)完全自动化且免费提供。输出还包括预测miRNA的基因组分布。mirMachine在小麦和 拟南芥 基因组中测试了基于同源性和基于sRNA-seq的预测。虽然最初作为自由软件发布,但UNAfold在过去十年中成为商业软件。通过这次升级,二级结构预测工具从UNAfold切换到RNAfold,以便可以免费使用mirMachine。用户现在可以执行一个简短的提交脚本来运行全自动的 mirMachine 管道( 示例在 https://github.com/hbusra/mirMachine.git 中提供)。

Protocol

1. 软件依赖和安装 从其主站点或使用 conda 安装软件依赖项。下载并安装 Perl,如果尚未安装,请从其主站点 (https://www.perl.org/get.html)。注意:表示的结果是使用 Perl v5.32.0 预测的。 从其主站点(https://www.ncbi.nlm.nih.gov/books/NBK279671/)下载Blast+,一个对齐程序,作为可执行文件和源代码。注意:表示的结果是使用 BLAST 2.6.0+ 预测的。 从 https://www.tbi.univie.ac.at/RNA/ ?…

Representative Results

将上述miRNA管道mirMachine应用于测试数据,以快速评估管道的性能。仅对沉积在miRBase v22.1的高置信度植物miRNA进行了针对IWGSC小麦RefSeq基因组v224的染色体5A进行筛选。mirMachine_find为189个高置信度miRNA的非冗余列表返回了312次命中,最多允许1次错配(表1)。mirMachine_fold根据二级结构评估将其中49种归类为推定的miRNA。代表性最高的miRNA组是miR9666,共鉴定出18个miRNA(<strong c…

Discussion

我们的miRNA管线SUmir在过去十年中一直用于鉴定许多植物miRNA。在这里,我们开发了一种新的、全自动的、免费提供的miRNA鉴定和注释管道mirMachine。此外,许多miRNA鉴定管道,包括但不限于以前的管道,都依赖于UNAfold软件21,该软件随着时间的推移成为商业软件,尽管曾经免费提供。这种新的全自动 mirMachine 不再依赖于 UNAfold;相反,来自ViennaRNA包27 的免费RNAfold用?…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Referências

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/pt/62430?article_type=t

Play Video

Citar este artigo
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video