Summary

mirMachine: En one-stop-shop för växt-miRNA-anteckning

Published: May 01, 2021
doi:

Summary

Häri presenterar vi en ny och helautomatisk miRNA-pipeline, mirMachine som 1) kan identifiera kända och nya miRNA mer exakt och 2) är helt automatiserad och fritt tillgänglig. Användare kan nu köra ett kort överföringsskript för att köra den helautomatiska mirMachine-pipelinen.

Abstract

Av olika typer av icke-kodande RNA har mikroRNA (miRNA) utan tvekan varit i rampljuset under det senaste decenniet. Som post-transkriptionella regulatorer av genuttryck spelar miRNA nyckelroller i olika cellulära vägar, inklusive både utveckling och svar på a / biotisk stress, såsom torka och sjukdomar. Att ha högkvalitativa referensgenomsekvenser möjliggjorde identifiering och annotering av miRNA i flera växtarter, där miRNA-sekvenser är mycket bevarade. Eftersom beräknings-miRNA-identifierings- och annoteringsprocesser mestadels är felbenägna processer, ökar homologibaserade förutsägelser förutsägelsenoggrannheten. Vi utvecklade och har förbättrat miRNA-annoteringspipelinen, SUmir, under det senaste decenniet, som har använts för flera växtgenom sedan dess.

Denna studie presenterar en helt automatiserad, ny miRNA-pipeline, mirMachine (miRNA Machine), genom att (i) lägga till ytterligare ett filtreringssteg på de sekundära strukturförutsägelserna, (ii) göra den helt automatiserad och (iii) introducera nya alternativ för att förutsäga antingen känt miRNA baserat på homologi eller nya miRNA baserat på små RNA-sekvenseringsläsningar med den tidigare pipelinen. Den nya miRNA-pipelinen, mirMachine, testades med hjälp av Arabidopsis Information Resource, TAIR10, frisättning av Arabidopsis-genomet och International Wheat Genome Sequencing Consortium (IWGSC) vetereferensgenom v2.

Introduction

Framsteg inom nästa generations sekvenseringsteknik har breddat förståelsen för RNA-strukturer och reglerande element och avslöjat funktionellt viktiga icke-kodande RNA (ncRNA). Bland olika typer av ncRNA utgör mikroRNA (miRNA) en grundläggande regleringsklass av små RNA med en längd mellan 19 och 24 nukleotider i växter 1,2. Sedan upptäckten av det första miRNA i nematoden Caenorhabditis elegans3 har närvaron och funktionerna hos miRNA studerats omfattande i djur- och växtgenom samt 4,5,6. miRNA fungerar genom att rikta in sig på mRNA för klyvning eller translationellt förtryck7. Ackumulerande bevis har också visat att miRNA är involverade i ett brett spektrum av biologiska processer i växter inklusive tillväxt och utveckling8, självbiogenes9 och flera biotiska och abiotiska stressreaktioner10.

I växter bearbetas miRNA initialt från långa primära transkript som kallas pri-miRNA11. Dessa pri-miRNA som genereras av RNA-polymeras II inuti kärnan är långa transkript som bildar en ofullkomlig vikningsstruktur12. Pri-miRNA genomgår senare en klyvningsprocess för att producera endogena enkelsträngade (ss) hårnålsprekursorer av miRNA som kallas pre-miRNA11. Pre-miRNA bildar en hårnålsliknande struktur där en enda sträng viks in i en dubbelsträngad struktur för att skära ut en miRNA-duplex (miRNA / miRNA *)13. Dicer-liknande protein skär båda strängarna i miRNA / miRNA * duplex och lämnar 2-nukleotid 3′-överhäng14,15. MiRNA-duplexen metyleras inuti kärnan, vilket skyddar 3′-änden av miRNA från nedbrytning och uridyleringsaktivitet16,17. Ett helicase varvar ner den metylerade miRNA-duplexen efter export och utsätter det mogna miRNA för det RNA-inducerade tystnadskomplexet (RISC) i cytosolen18. En sträng i duplexen är moget miRNA införlivat i RISC , medan den andra strängen, miRNA *, bryts ned. MiRNA-RISC-komplexet binder till målsekvensen vilket leder till antingen mRNA-nedbrytning vid full komplementaritet eller translationell repression vid partiell komplementaritet13.

Baserat på uttrycks- och biogenesfunktionerna har riktlinjer för miRNA-annotering beskrivits15,19. Med de definierade riktlinjerna utvecklade Lucas och Budak SUmir-rörledningen för att utföra en homologibaserad in silico miRNA-identifiering i växter9. SUmir-pipelinen bestod av två skript: SUmirFind och SUmirFold. SUmirFind utför likhetssökningar mot kända miRNA-dataset genom National Center for Biotechnology Information (NCBI) Basic Local Alignment Search tool (BLAST) screening med modifierade parametrar för att inkludera träffar med endast 2 eller färre felmatchningar och för att undvika partiskhet mot kortare träffar (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold utvärderar den sekundära strukturen för de förmodade miRNA-sekvenserna från BLAST20-resultat med hjälp av UNAfold21. SUmirFold skiljer miRNA från små störande RNA genom identifiering av egenskaperna hos hårnålsstrukturen. Dessutom skiljer det miRNA från andra ssRNA såsom tRNA och rRNA med parametrarna, minsta viktenergiindex > 0,67 och GC-innehåll på 24-71%. Denna pipeline har nyligen uppdaterats genom att lägga till ytterligare två steg för att (i) öka känsligheten, (ii) öka annoteringsnoggrannheten och (iii) tillhandahålla genomisk fördelning av de förutsagda miRNA-generna22. Med tanke på det höga bevarandet av växt-miRNA-sekvenser23 var denna pipeline ursprungligen utformad för homologibaserad miRNA-förutsägelse. Nya miRNA kunde dock inte identifieras exakt med denna bioinformatiska analys eftersom den starkt förlitade sig på sekvensbevarande av miRNA mellan närbesläktade arter.

Detta dokument presenterar en ny och helautomatisk miRNA-pipeline, mirMachine som 1) kan identifiera kända och nya miRNA mer exakt (till exempel använder rörledningen nu sRNA-seq-baserade nya miRNA-förutsägelser samt homologibaserad miRNA-identifiering) och 2) är helt automatiserad och fritt tillgänglig. Resultaten har också inkluderat de genomiska fördelningarna av de förutsagda miRNA: erna. mirMachine testades för både homologibaserade och sRNA-seq-baserade förutsägelser i vete- och Arabidopsis-genom . Även om UNAfold ursprungligen släpptes som fri programvara, blev UNAfold en kommersiell programvara under det senaste decenniet. Med denna uppgradering byttes det sekundära strukturförutsägelseverktyget från UNAfold till RNAfold så att mirMachine kan vara fritt tillgängligt. Användare kan nu köra ett kort överföringsskript för att köra den helautomatiska mirMachine-pipelinen (exempel finns på https://github.com/hbusra/mirMachine.git).

Protocol

1. Programvaruberoenden och installation Installera programvaruberoenden från deras hemsida eller med conda.Ladda ner och installera Perl, om det inte redan är installerat, från dess hemsida (https://www.perl.org/get.html).Representerade resultat förutspåddes med Perl v5.32.0. Ladda ner Blast+, ett justeringsprogram, från dess hemsida (https://www.ncbi.nlm.nih.gov/books/NBK279671/) som körbar och som källkod.OBS: Representerade resultat förutspåddes med BLAST 2.6.0+. …

Representative Results

MiRNA-rörledningen, mirMachine, som beskrivs ovan applicerades på testdata för snabb utvärdering av rörledningens prestanda. Endast de högkonfidensväxt-miRNA som deponerades vid miRBase v22.1 screenades mot kromosomen 5A av IWGSC-vete RefSeq-genomet v224. mirMachine_find returnerade 312 träffar för den icke-redundanta listan med 189 miRNA med hög konfidens med högst 1 felaktig matchning tillåten (tabell 1). mirMachine_fold klassificerade 49 av dem som förmodade miRNA …

Discussion

Vår miRNA-pipeline, SUmir, har använts för identifiering av många växt-miRNA under det senaste decenniet. Här utvecklade vi en ny, helt automatiserad och fritt tillgänglig miRNA-identifierings- och annoteringspipeline, mirMachine. Dessutom var ett antal miRNA-identifieringsrörledningar inklusive, men inte begränsat till den tidigare rörledningen, beroende av UNAfold-programvara21, som med tiden blev en kommersiell programvara, även om den en gång var fritt tillgänglig. Denna nya och h…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/62430?article_type=t

Play Video

Cite This Article
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video