Summary

mirMachine: Ein One-Stop-Shop für pflanzliche miRNA-Annotation

Published: May 01, 2021
doi:

Summary

Hier stellen wir eine neue und vollautomatische miRNA-Pipeline vor, mirMachine, die 1) bekannte und neuartige miRNAs genauer identifizieren kann und 2) vollautomatisch und frei verfügbar ist. Benutzer können nun ein kurzes Einreichungsskript ausführen, um die vollautomatische mirMachine-Pipeline auszuführen.

Abstract

Von verschiedenen Arten von nicht-kodierenden RNAs standen microRNAs (miRNAs) in den letzten zehn Jahren wohl im Rampenlicht. Als posttranskriptionelle Regulatoren der Genexpression spielen miRNAs eine Schlüsselrolle in verschiedenen zellulären Signalwegen, einschließlich der Entwicklung und Reaktion auf a/biotischen Stress wie Dürre und Krankheiten. Qualitativ hochwertige Referenzgenomsequenzen ermöglichten die Identifizierung und Annotation von miRNAs in mehreren Pflanzenarten, bei denen miRNA-Sequenzen hochkonserviert sind. Da computergestützte miRNA-Identifikations- und Annotationsprozesse meist fehleranfällige Prozesse sind, erhöhen homologiebasierte Vorhersagen die Vorhersagegenauigkeit. Wir haben in den letzten zehn Jahren die miRNA-Annotationspipeline SUmir entwickelt und verbessert, die seitdem für mehrere Pflanzengenome verwendet wurde.

Diese Studie stellt eine vollautomatische, neue miRNA-Pipeline, mirMachine (miRNA Machine), vor, indem (i) ein zusätzlicher Filterschritt zu den Sekundärstrukturvorhersagen hinzugefügt wird, (ii) sie vollständig automatisiert wird und (iii) neue Optionen eingeführt werden, um entweder bekannte miRNA basierend auf Homologie oder neuartige miRNAs basierend auf kleinen RNA-Sequenzierungslesevorgängen unter Verwendung der vorherigen Pipeline vorherzusagen. Die neue miRNA-Pipeline, mirMachine, wurde mit The Arabidopsis Information Resource, TAIR10, der Veröffentlichung des Arabidopsis-Genoms und dem Weizenreferenzgenom v2 des International Wheat Genome Sequencing Consortium (IWGSC) getestet.

Introduction

Fortschritte bei Sequenzierungstechnologien der nächsten Generation haben das Verständnis von RNA-Strukturen und regulatorischen Elementen erweitert und funktionell wichtige nicht-kodierende RNAs (ncRNAs) aufgedeckt. Unter den verschiedenen Arten von ncRNAs stellen microRNAs (miRNAs) eine grundlegende regulatorische Klasse kleiner RNAs mit einer Länge zwischen 19 und 24 Nukleotiden in Pflanzendar 1,2. Seit der Entdeckung der ersten miRNA im Fadenwurm Caenorhabditis elegans3 wurden das Vorhandensein und die Funktionen von miRNAs auch in tierischen und pflanzlichen Genomen umfassend untersucht 4,5,6. miRNAs funktionieren, indem sie mRNAs zur Spaltung oder translationalen Repression anvisieren7. Zunehmende Beweise haben auch gezeigt, dass miRNAs an einer Vielzahl biologischer Prozesse in Pflanzen beteiligt sind, einschließlich Wachstum und Entwicklung8, Selbstbiogenese9 und mehrere biotische und abiotische Stressreaktionen10.

In Pflanzen werden miRNAs zunächst aus langen primären Transkripten, sogenannten pri-miRNAs11, verarbeitet. Diese pri-miRNAs, die durch RNA-Polymerase II im Zellkern erzeugt werden, sind lange Transkripte, die eine unvollkommene Foldback-Strukturbilden 12. Die pri-miRNAs durchlaufen später einen Spaltungsprozess, um endogene einzelsträngige (ss) Haarnadelvorläufer von miRNAs, sogenannte prä-miRNAs11, herzustellen. Die prä-miRNA bildet eine Haarnadel-ähnliche Struktur, in der sich ein einzelner Strang zu einer doppelsträngigen Struktur faltet, um einen miRNA-Duplex (miRNA/miRNA*)13 herauszuschneiden. Dicer-ähnliches Protein schneidet beide Stränge des miRNA/miRNA*-Duplex, so dass 2-Nukleotid-3′-Überhänge14,15 übrig bleiben. Der miRNA-Duplex ist innerhalb des Zellkerns methyliert, was das 3′-Ende der miRNA vor Abbau und Uridylierungsaktivitätschützt 16,17. Eine Helikase wickelt den methylierten miRNA-Duplex nach dem Export ab und setzt die reife miRNA dem RNA-induzierten Silencing-Komplex (RISC) im Zytosol18 aus. Ein Strang des Duplex ist reife miRNA, die in RISC eingebaut ist, während der andere Strang, miRNA*, abgebaut wird. Der miRNA-RISC-Komplex bindet an die Zielsequenz, was entweder zum mRNA-Abbau bei vollständiger Komplementarität oder zur translationalen Repression bei partieller Komplementarität führt13.

Basierend auf den Expressions- und Biogenesemerkmalen wurden Richtlinien für die miRNA-Annotation beschrieben15,19. Mit den definierten Richtlinien entwickelten Lucas und Budak die SUmir-Pipeline, um eine homologiebasierte in silico miRNA-Identifizierung in Pflanzendurchzuführen 9. Die SUmir-Pipeline bestand aus zwei Skripten: SUmirFind und SUmirFold. SUmirFind führt Ähnlichkeitssuchen mit bekannten miRNA-Datensätzen durch das Basic Local Alignment Search Tool (BLAST) des National Center for Biotechnology Information (NCBI) mit modifizierten Parametern durch, um Treffer mit nur 2 oder weniger Diskrepanzen einzubeziehen und Verzerrungen in Richtung kürzerer Treffer zu vermeiden (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold wertet die Sekundärstruktur der mutmaßlichen miRNA-Sequenzen aus BLAST20-Ergebnissen mit UNAfold21 aus. SUmirFold unterscheidet miRNAs von kleinen interferierenden RNAs durch die Identifizierung der Eigenschaften der Haarnadelstruktur. Darüber hinaus unterscheidet es miRNAs von anderen ssRNAs wie tRNA und rRNA durch die Parameter, minimalen Faltenenergieindex > 0,67 und GC-Gehalt von 24-71%. Diese Pipeline wurde kürzlich aktualisiert, indem zwei zusätzliche Schritte hinzugefügt wurden, um (i) die Sensitivität zu erhöhen, (ii) die Annotationsgenauigkeit zu erhöhen und (iii) die genomische Verteilung der vorhergesagten miRNA-Genebereitzustellen 22. Angesichts der hohen Erhaltung pflanzlicher miRNA-Sequenzen23 wurde diese Pipeline ursprünglich für die homologiebasierte miRNA-Vorhersage entwickelt. Neuartige miRNAs konnten jedoch mit dieser bioinformatischen Analyse nicht genau identifiziert werden, da sie stark auf der Sequenzkonservierung von miRNAs zwischen eng verwandten Spezies beruhte.

Dieser Artikel stellt eine neue und vollautomatische miRNA-Pipeline vor, mirMachine, die 1) bekannte und neuartige miRNAs genauer identifizieren kann (zum Beispiel verwendet die Pipeline jetzt sRNA-seq-basierte neuartige miRNA-Vorhersagen sowie homologiebasierte miRNA-Identifizierung) und 2) vollständig automatisiert und frei verfügbar ist. Die Ergebnisse umfassten auch die genomischen Verteilungen der vorhergesagten miRNAs. mirMachine wurde sowohl für homologiebasierte als auch für sRNA-seq-basierte Vorhersagen in Weizen- und Arabidopsis-Genomen getestet. Obwohl ursprünglich als freie Software veröffentlicht, wurde UNAfold in den letzten zehn Jahren zu einer kommerziellen Software. Mit diesem Upgrade wurde das Sekundärstrukturvorhersagetool von UNAfold auf RNAfold umgestellt, so dass mirMachine frei verfügbar sein kann. Benutzer können nun ein kurzes Einreichungsskript ausführen, um die vollautomatische mirMachine-Pipeline auszuführen (Beispiele finden Sie unter https://github.com/hbusra/mirMachine.git).

Protocol

1. Softwareabhängigkeiten und Installation Installieren Sie Softwareabhängigkeiten von ihrer Home-Site oder mit conda.Laden Sie Perl herunter und installieren Sie es, falls es nicht bereits installiert ist, von seiner Homepage (https://www.perl.org/get.html).HINWEIS: Die dargestellten Ergebnisse wurden mit Perl v5.32.0 vorhergesagt. Laden Sie Blast+, ein Ausrichtungsprogramm, von seiner Homepage (https://www.ncbi.nlm.nih.gov/books/NBK279671/) als ausführbare Datei und als Quellcode her…

Representative Results

Die oben beschriebene miRNA-Pipeline mirMachine wurde zur schnellen Bewertung der Leistungsfähigkeit der Pipeline auf die Testdaten angewendet. Nur die an miRBase v22.1 deponierten hochzuverlässigen pflanzlichen miRNAs wurden gegen das Chromosom 5A des IWGSC-Weizen-RefSeq-Genoms v224 gescreent. mirMachine_find ergab 312 Treffer für die nicht redundante Liste von 189 hochzuverlässigen miRNAs mit maximal 1 zulässigen Mismatch (Tabelle 1). mirMachine_fold klassifizierten 49 von …

Discussion

Unsere miRNA-Pipeline SUmir wurde in den letzten zehn Jahren für die Identifizierung vieler pflanzlicher miRNAs verwendet. Hier haben wir eine neue, vollautomatische und frei verfügbare miRNA-Identifikations- und Annotationspipeline entwickelt, mirMachine. Darüber hinaus war eine Reihe von miRNA-Identifikationspipelines, einschließlich, aber nicht beschränkt auf die vorherige Pipeline, von der UNAfold-Software21 abhängig, die im Laufe der Zeit zu einer kommerziellen Software wurde, obwohl si…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Riferimenti

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/it/62430?article_type=t

Play Video

Citazione di questo articolo
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video