Summary

mirMachine: Универсальный магазин для аннотации miRNA растений

Published: May 01, 2021
doi:

Summary

Здесь мы представляем новый и полностью автоматизированный конвейер miRNA, mirMachine, который 1) может более точно идентифицировать известные и новые miRNAs и 2) полностью автоматизирован и находится в свободном доступе. Теперь пользователи могут выполнять короткий сценарий отправки для запуска полностью автоматизированного конвейера mirMachine.

Abstract

Из различных типов некодирующих РНК микроРНК (миРНК), возможно, были в центре внимания в течение последнего десятилетия. Как посттранскрипционные регуляторы экспрессии генов, миРНК играют ключевую роль в различных клеточных путях, включая как развитие, так и реакцию на а/биотический стресс, такой как засуха и болезни. Наличие высококачественных эталонных последовательностей генома позволило идентифицировать и аннотировать миРНК у нескольких видов растений, где последовательности миРНК сильно сохраняются. Поскольку вычислительная идентификация миРНК и процессы аннотации в основном подвержены ошибкам, прогнозы на основе гомологии повышают точность прогнозирования. За последнее десятилетие мы разработали и улучшили конвейер аннотаций miRNA, SUmir, который с тех пор использовался для нескольких геномов растений.

В этом исследовании представлен полностью автоматизированный новый конвейер миРНК, mirMachine (miRNA Machine), путем (i) добавления дополнительного этапа фильтрации для предсказаний вторичной структуры, (ii) обеспечения его полной автоматизации и (iii) введения новых вариантов прогнозирования либо известной миРНК на основе гомологии, либо новых миРНК на основе чтения секвенирования малых РНК с использованием предыдущего конвейера. Новый трубопровод miRNA, mirMachine, был протестирован с использованием информационного ресурса Arabidopsis, TAIR10, выпуска генома Arabidopsis и Эталонного генома пшеницы Международного консорциума по секвенированию генома пшеницы (IWGSC) v2.

Introduction

Достижения в технологиях секвенирования следующего поколения расширили понимание структур РНК и регуляторных элементов, выявив функционально важные некодирующие РНК (ncRNAs). Среди различных типов нРНК микроРНК (миРНК) составляют фундаментальный регуляторный класс малых РНК длиной от 19 до 24 нуклеотидов в растениях 1,2. С момента открытия первой миРНК у нематоды Caenorhabditis elegans3 наличие и функции миРНК были широко изучены в геномах животных и растений, а также 4,5,6. миРНК функционируют, нацеливаясь на мРНК для расщепления или трансляционного подавления7. Накопленные данные также показали, что миРНК участвуют в широком спектре биологических процессов у растений, включая рост и развитие8, самобиогенез9 и несколько биотических и абиотических стрессовых реакций10.

В растениях миРНК первоначально обрабатываются из длинных первичных транскриптов, называемых примиРНК11. Эти примиРНК, генерируемые РНК-полимеразой II внутри ядра, представляют собой длинные транскрипты, образующие несовершенную складчатую структуру12. При-миРНК позже подвергаются процессу расщепления с целью получения эндогенных одноцепочечных (ss) шпильк-предшественников миРНК, называемых премиРНК11. ПремиРНК образует шпилькообразную структуру, в которой одна прядь складывается в двухцепочечную структуру для иссечения дуплекса миРНК (миРНК/миРНК*)13. Дицероподобный белок разрезает обе нити дуплекса миРНК/миРНК*, оставляя 2-нуклеотидные 3′-навесы14,15. Дуплекс миРНК метилируется внутри ядра, что защищает 3′-конец миРНК от деградации и активности уридилирования16,17. Геликаза раскручивает дуплекс метилированной миРНК после экспорта и подвергает зрелую миРНК воздействию РНК-индуцированного комплекса глушения (RISC) в цитозоле18. Одна нить дуплекса представляет собой зрелую миРНК, включенную в RISC, тогда как другая цепь, miRNA*, деградирует. Комплекс miRNA-RISC связывается с целевой последовательностью, что приводит либо к деградации мРНК в случае полной комплементарности, либо к трансляционному подавлению в случае частичной комплементарности13.

Основываясь на особенностях экспрессии и биогенеза, были описаны рекомендации по аннотации миРНК15,19. С определенными руководящими принципами Лукас и Будак разработали конвейер SUmir для выполнения идентификации гомологии in silico miRNA в растениях9. Конвейер SUmir состоял из двух сценариев: SUmirFind и SUmirFold. SUmirFind выполняет поиск по сходству с известными наборами данных miRNA с помощью базового инструмента поиска локального выравнивания (BLAST) Национального центра биотехнологической информации (NCBI) с измененными параметрами, чтобы включить попадания только с 2 или менее несоответствиями и избежать смещения в сторону более коротких попаданий (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold оценивает вторичную структуру предполагаемых последовательностей миРНК из результатов BLAST20 с использованием UNAfold21. SUmirFold дифференцирует микроРНК от малых интерферирующих РНК путем идентификации характеристик структуры шпильки. Более того, он дифференцирует миРНК от других ssRNAs, таких как тРНК и рРНК, по параметрам, минимальному энергетическому индексу складки > 0,67 и содержанию ГК 24-71%. Этот конвейер был недавно обновлен путем добавления двух дополнительных шагов для (i) повышения чувствительности, (ii) повышения точности аннотаций и (iii) обеспечения геномного распределения прогнозируемых генов miRNA22. Учитывая высокую сохранность последовательностей миРНК растений23, этот конвейер был первоначально разработан для прогнозирования миРНК на основе гомологии. Новые микроРНК, однако, не могут быть точно идентифицированы с помощью этого биоинформатического анализа, поскольку он в значительной степени зависит от сохранения последовательности микроРНК между близкородственными видами.

В этой статье представлен новый и полностью автоматизированный конвейер миРНК, mirMachine, который 1) может более точно идентифицировать известные и новые миРНК (например, конвейер теперь использует новые прогнозы миРНК на основе sRNA-seq, а также идентификацию miRNA на основе гомологии) и 2) полностью автоматизирован и находится в свободном доступе. Результаты также включали геномные распределения прогнозируемых миРНК. mirMachine был протестирован как на основе гомологии, так и на основе sRNA-seq предсказаний в геномах пшеницы и арабидопсиса . Хотя первоначально UNAfold был выпущен как свободное программное обеспечение, в последнее десятилетие он стал коммерческим программным обеспечением. С этим обновлением инструмент прогнозирования вторичной структуры был переключен с UNAfold на RNAfold, так что mirMachine может быть в свободном доступе. Теперь пользователи могут выполнять короткий сценарий отправки для запуска полностью автоматизированного конвейера mirMachine (примеры приведены в https://github.com/hbusra/mirMachine.git).

Protocol

1. Программные зависимости и установка Установите программные зависимости со своего домашнего сайта или с помощью conda.Загрузите и установите Perl, если он еще не установлен, с его домашнего сайта (https://www.perl.org/get.html).ПРИМЕЧАНИЕ: Представленные результаты были предсказаны с испол?…

Representative Results

Трубопровод miRNA, mirMachine, описанный выше, был применен к тестовым данным для быстрой оценки производительности конвейера. Только высоконадежные растительные миРНК, депонированные в miRBase v22.1, были проверены на хромосому 5A генома IWGSC пшеницы RefSeq v224. mirMachine_find вернул 312 попаданий в…

Discussion

Наш конвейер миРНК, SUmir, использовался для идентификации многих растительных миРНК в течение последнего десятилетия. Здесь мы разработали новый, полностью автоматизированный и свободно доступный конвейер идентификации и аннотации miRNA, mirMachine. Кроме того, ряд конвейеров идентификации miR…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/kr/62430?article_type=t

Play Video

Cite This Article
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video