Summary

mirMachine: een one-stop-shop voor miRNA-annotatie van planten

Published: May 01, 2021
doi:

Summary

Hierin presenteren we een nieuwe en volledig geautomatiseerde miRNA-pijplijn, mirMachine die 1) bekende en nieuwe miRNA’s nauwkeuriger kan identificeren en 2) volledig geautomatiseerd en vrij beschikbaar is. Gebruikers kunnen nu een kort indieningsscript uitvoeren om de volledig geautomatiseerde mirMachine-pijplijn uit te voeren.

Abstract

Van verschillende soorten niet-coderende RNA’s zijn microRNA’s (miRNA’s) het afgelopen decennium aantoonbaar in de schijnwerpers geweest. Als post-transcriptionele regulatoren van genexpressie spelen miRNA’s een sleutelrol in verschillende cellulaire routes, waaronder zowel ontwikkeling als reactie op a / biotische stress, zoals droogte en ziekten. Het hebben van hoogwaardige referentiegenoomsequenties maakte identificatie en annotatie van miRNA’s in verschillende plantensoorten mogelijk, waar miRNA-sequenties sterk geconserveerd zijn. Aangezien computationele miRNA-identificatie- en annotatieprocessen meestal foutgevoelige processen zijn, verhogen op homologie gebaseerde voorspellingen de voorspellingsnauwkeurigheid. We hebben de miRNA-annotatiepijplijn, SUmir, in het afgelopen decennium ontwikkeld en verbeterd, die sindsdien voor verschillende plantengenomen is gebruikt.

Deze studie presenteert een volledig geautomatiseerde, nieuwe miRNA-pijplijn, mirMachine (miRNA Machine), door (i) een extra filterstap toe te voegen aan de secundaire structuurvoorspellingen, (ii) deze volledig geautomatiseerd te maken en (iii) nieuwe opties te introduceren om bekend miRNA te voorspellen op basis van homologie of nieuwe miRNA’s op basis van kleine RNA-sequencing-reads met behulp van de vorige pijplijn. De nieuwe miRNA-pijplijn, mirMachine, werd getest met behulp van The Arabidopsis Information Resource, TAIR10, release van het Arabidopsis-genoom en het International Wheat Genome Sequencing Consortium (IWGSC) tarwereferentiegenoom v2.

Introduction

Vooruitgang in sequencingtechnologieën van de volgende generatie heeft het begrip van RNA-structuren en regulerende elementen verbreed, waardoor functioneel belangrijke niet-coderende RNA’s (ncRNA’s) zijn onthuld. Onder verschillende soorten ncRNA’s vormen microRNA’s (miRNA’s) een fundamentele regelgevende klasse van kleine RNA’s met een lengte tussen 19 en 24 nucleotiden in planten 1,2. Sinds de ontdekking van het eerste miRNA in de nematode Caenorhabditis elegans3 zijn de aanwezigheid en de functies van miRNA’s uitgebreid bestudeerd in dierlijke en plantaardige genomen en 4,5,6. miRNA’s functioneren door mRNA’s te richten op splitsing of translationele repressie7. Accumulerend bewijs heeft ook aangetoond dat miRNA’s betrokken zijn bij een breed scala aan biologische processen in planten, waaronder groei en ontwikkeling8, zelfbiogenese9 en verschillende biotische en abiotische stressreacties10.

In fabrieken worden miRNA’s in eerste instantie verwerkt uit lange primaire transcripties die pri-miRNA’s11 worden genoemd. Deze pri-miRNA’s gegenereerd door RNA polymerase II in de kern zijn lange transcripten die een onvolmaakte terugvouwstructuur vormen12. De pri-miRNA’s ondergaan later een splitsingsproces om endogene enkelstrengs (ss) haarspeldbochtenvoorlopers van miRNA’s te produceren die pre-miRNA’s11 worden genoemd. Het pre-miRNA vormt een haarspeldachtige structuur waarin een enkele streng zich vouwt tot een dubbelstrengsstructuur om een miRNA-duplex (miRNA/miRNA*)13 te verwijderen. Dicer-achtig eiwit snijdt beide strengen van de miRNA/miRNA* duplex, waardoor 2-nucleotide 3′-overhangen14,15 overblijft. De miRNA-duplex wordt gemethyleerd in de kern, wat het 3′-uiteinde van het miRNA beschermt tegen afbraak en uridyleringsactiviteit16,17. Een helicase lost de gemethyleerde miRNA-duplex na export af en stelt het volwassen miRNA bloot aan het RNA-geïnduceerde silencing complex (RISC) in het cytosol18. Eén streng van de duplex is volwassen miRNA opgenomen in RISC, terwijl de andere streng, miRNA*, wordt afgebroken. Het miRNA-RISC-complex bindt aan de doelsequentie, wat leidt tot mRNA-afbraak in geval van volledige complementariteit of translationele repressie in geval van gedeeltelijke complementariteit13.

Op basis van de expressie- en biogenesekenmerken zijn richtlijnen voor miRNA-annotatie beschreven15,19. Met de gedefinieerde richtlijnen ontwikkelden Lucas en Budak de SUmir-pijplijn om een homologie uit te voeren op basis van silico miRNA-identificatie in planten9. De SUmir-pijplijn bestond uit twee scripts: SUmirFind en SUmirFold. SUmirFind voert gelijkeniszoekopdrachten uit met bekende miRNA-datasets via national center for biotechnology information (NCBI) Basic Local Alignment Search tool (BLAST) screening met aangepaste parameters om hits met slechts 2 of minder mismatches op te nemen en om bias naar kortere hits (blastn-short -ungapped -penalty -1 -reward 1) te voorkomen. SUmirFold evalueert de secundaire structuur van de vermeende miRNA-sequenties van BLAST20-resultaten met behulp van UNAfold21. SUmirFold onderscheidt miRNA’s van kleine storende RNA’s door de identificatie van de kenmerken van de haarspeldstructuur. Bovendien onderscheidt het miRNA’s van andere ssRNA’s zoals tRNA en rRNA door de parameters, de minimale energie-index > 0,67 en het GC-gehalte van 24-71%. Deze pijplijn is onlangs bijgewerkt door twee extra stappen toe te voegen om (i) de gevoeligheid te verhogen, (ii) de annotatienauwkeurigheid te verhogen en (iii) de genomische verdeling van de voorspelde miRNA-genente bieden 22. Gezien de hoge conservering van plant miRNA-sequenties23, was deze pijplijn oorspronkelijk ontworpen voor homologie-gebaseerde miRNA-voorspelling. Nieuwe miRNA’s konden echter niet nauwkeurig worden geïdentificeerd met deze bioinformatica-analyse, omdat het sterk afhankelijk was van sequentiebehoud van miRNA’s tussen nauw verwante soorten.

Dit artikel presenteert een nieuwe en volledig geautomatiseerde miRNA-pijplijn, mirMachine die 1) bekende en nieuwe miRNA’s nauwkeuriger kan identificeren (de pijplijn maakt nu bijvoorbeeld gebruik van op sRNA-seq gebaseerde nieuwe miRNA-voorspellingen en op homologie gebaseerde miRNA-identificatie) en 2) is volledig geautomatiseerd en vrij beschikbaar. De outputs omvatten ook de genomische verdelingen van de voorspelde miRNA’s. mirMachine werd getest op zowel homologie-gebaseerde als sRNA-seq-gebaseerde voorspellingen in tarwe en Arabidopsis genomen. Hoewel unafold in eerste instantie werd uitgebracht als vrije software, werd het in het laatste decennium een commerciële software. Met deze upgrade is de secundaire structuurvoorspellingstool overgeschakeld van UNAfold naar RNAfold, zodat mirMachine vrij beschikbaar kan zijn. Gebruikers kunnen nu een kort indieningsscript uitvoeren om de volledig geautomatiseerde mirMachine-pijplijn uit te voeren (voorbeelden worden gegeven op https://github.com/hbusra/mirMachine.git).

Protocol

1. Software afhankelijkheden en installatie Installeer softwareafhankelijkheden vanaf hun thuissite of met behulp van conda.Download en installeer Perl, als het nog niet is geïnstalleerd, vanaf de thuissite (https://www.perl.org/get.html).OPMERKING: De weergegeven resultaten werden voorspeld met Perl v5.32.0. Download Blast+, een uitlijningsprogramma, van de thuissite (https://www.ncbi.nlm.nih.gov/books/NBK279671/) als uitvoerbaar bestand en als broncode.OPMERKING: De weergegeven res…

Representative Results

De hierboven beschreven miRNA-pijplijn, mirMachine, werd toegepast op de testgegevens voor de snelle evaluatie van de prestaties van de pijplijn. Alleen de zeer betrouwbare plant-miRNA’s afgezet bij miRBase v22.1 werden gescreend op het chromosoom 5A van IWGSC tarwe RefSeq genoom v224. mirMachine_find leverde 312 hits op voor de niet-overgrote lijst van 189 high-confidence miRNA’s met een maximum van 1 toegestane mismatch (tabel 1). mirMachine_fold 49 van hen geclassificeerd als v…

Discussion

Onze miRNA-pijplijn, SUmir, is het afgelopen decennium gebruikt voor de identificatie van veel miRNA’s van planten. Hier ontwikkelden we een nieuwe, volledig geautomatiseerde en vrij beschikbare miRNA-identificatie- en annotatiepijplijn, mirMachine. Bovendien waren een aantal miRNA-identificatiepijplijnen, waaronder, maar niet beperkt tot de vorige pijplijn, afhankelijk van UNAfold-software21, die in de loop van de tijd een commerciële software werd, hoewel deze ooit vrij beschikbaar was. Deze ni…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Riferimenti

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/it/62430?article_type=t

Play Video

Citazione di questo articolo
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video