Summary

mirMachine:植物miRNAアノテーションのワンストップショップ

Published: May 01, 2021
doi:

Summary

ここでは、1)既知および新規のmiRNAをより正確に同定でき、2)完全に自動化され、自由に利用できる新しい完全に自動化されたmiRNAパイプラインmirMachineを紹介します。ユーザーは、短い送信スクリプトを実行して、完全に自動化された mirMachine パイプラインを実行できるようになりました。

Abstract

さまざまな種類のノンコーディングRNAの中で、マイクロRNA(miRNA)は間違いなく過去10年間で脚光を浴びてきました。遺伝子発現の転写後調節因子として、miRNAは、干ばつや病気などの発生と生物的ストレスへの応答の両方を含む、さまざまな細胞経路で重要な役割を果たします。高品質のリファレンスゲノム配列を持つことで、miRNA配列が高度に保存されているいくつかの植物種におけるmiRNAの同定とアノテーションが可能になりました。計算miRNAの同定とアノテーションのプロセスはほとんどエラーを起こしやすいプロセスであるため、相同性に基づく予測は予測精度を高めます。私たちは、過去10年間でmiRNAアノテーションパイプラインSUmirを開発および改良し、それ以来、いくつかの植物ゲノムに使用されてきました。

この研究では、(i)二次構造予測に追加のフィルタリングステップを追加し、(ii)完全に自動化し、(iii)以前のパイプラインを使用して、相同性に基づく既知のmiRNAまたは低分子RNAシーケンシングリードに基づく新規miRNAのいずれかを予測するための新しいオプションを導入することにより、完全に自動化された新しいmiRNAパイプラインmirMachine(miRNA Machine)を提示します。新しいmiRNAパイプラインmirMachineは、シロイヌナズナ情報リソースTAIR10、 シロイヌナ ズナゲノムのリリース、および国際小麦ゲノムシーケンスコンソーシアム(IWGSC)小麦リファレンスゲノムv2を使用してテストされました。

Introduction

次世代シーケンシング技術の進歩により、RNAの構造と調節要素の理解が広がり、機能的に重要なノンコーディングRNA(ncRNA)が明らかになりました。さまざまな種類のncRNAの中で、マイクロRNA(miRNA)は、植物において19〜24ヌクレオチドの長さの低分子RNAの基本的な調節クラスを構成します1,2。線虫Caenorhabditis elegans3で最初のmiRNAが発見されて以来、miRNAの存在と機能は動植物ゲノムでも広く研究されてきました4,5,6。miRNAは、切断または翻訳抑制のためにmRNAを標的とすることによって機能します7。証拠の蓄積は、miRNAが成長と発生8、自己生生物発生9、およびいくつかの生物的および非生物的ストレス応答10を含む植物の幅広い生物学的プロセスに関与していることも示しています。

植物では、miRNAは最初にpri-miRNA11と呼ばれる長い一次転写物からプロセシングされます。核内のRNAポリメラーゼIIによって生成されたこれらのpri-miRNAは、不完全なフォールドバック構造を形成する長い転写物である12。pri-miRNAは後に切断プロセスを経て、pre-miRNA11と呼ばれるmiRNAの内因性一本鎖(ss)ヘアピン前駆体を生成します。プレmiRNAはヘアピン様構造を形成し、一本鎖が二本鎖構造に折りたたまれてmiRNA二重鎖(miRNA/miRNA*)を切除します13。ダイサー様タンパク質は、miRNA/miRNA*二重鎖の両鎖を切断し、2ヌクレオチド3′-オーバーハング14,15を残します。miRNA二重鎖は核内でメチル化され、miRNAの3’末端を分解およびウリジル化活性から保護する16,17。ヘリカーゼは、輸出後にメチル化miRNA二重鎖を巻き戻し、成熟miRNAをサイトゾル18中のRNA誘導サイレンシング複合体(RISC)に曝露する。二重鎖の一方の鎖はRISCに取り込まれた成熟miRNAですが、もう一方の鎖であるmiRNA*は分解されます。miRNA-RISC複合体は標的配列に結合し、完全な相補性の場合はmRNA分解、部分相補性の場合は翻訳抑制のいずれかを引き起こします13

発現および生合成の特徴に基づいて、miRNAアノテーションのためのガイドラインが記載されている1519。定義されたガイドラインを使用して、LucasとBudakは、植物9で相同性に基づくインシリコmiRNA同定を実行するためのSUmirパイプラインを開発しました。SUmir パイプラインは、SUmirFind と SUmirFold の 2 つのスクリプトで構成されていました。SUmirFindは、国立バイオテクノロジー情報センター(NCBI)の基本ローカルアライメント検索ツール(BLAST)スクリーニングを通じて既知のmiRNAデータセットに対して類似性検索を実行し、2つ以下のミスマッチのみのヒットを含め、より短いヒットへのバイアスを回避します(blastn-short-unapped-penalty-1-reward1)。SUmirFoldは、UNAfold21を用いて、BLAST20の結果から推定miRNA配列の二次構造を評価する。スミルフォールドは、ヘアピン構造の特徴を同定することにより、miRNAと小さな干渉RNAを区別します。さらに、パラメータ、最小倍率エネルギー指数>0.67、GC含量24〜71%によって、miRNAをtRNAやrRNAなどの他のssRNAと区別します。このパイプラインは、(i)感度を高める、(ii)アノテーション精度を高める、および(iii)予測されたmiRNA遺伝子のゲノム分布を提供するための2つのステップを追加することによって最近更新されました22。植物のmiRNA配列23の保存性が高いことを考えると、このパイプラインはもともと相同性に基づくmiRNA予測のために設計されました。しかし、新規miRNAは、近縁種間のmiRNAの配列保存に大きく依存していたため、このバイオインフォマティクス解析では正確に同定できませんでした。

この論文では、1)既知および新規のmiRNAをより正確に同定できる(たとえば、パイプラインは現在、sRNA-seqベースの新規miRNA予測と相同性ベースのmiRNA同定を使用する)、2)完全に自動化され、自由に利用できる、完全に自動化された新しいmiRNAパイプラインmirMachineを紹介します。出力には、予測されたmiRNAのゲノム分布も含まれています。mirMachineは、コムギおよび シロイヌナ ズナのゲノムにおける相同性ベースの予測とsRNA-seqベースの予測の両方についてテストされました。当初はフリーソフトウェアとしてリリースされましたが、UNAfoldは過去10年間で商用ソフトウェアになりました。今回のバージョンアップに伴い、二次構造予測ツールをUNAfoldからRNAfoldに切り替え、mirMachineを自由に利用できるようになりました。ユーザーは、短い送信スクリプトを実行して、完全に自動化された mirMachine パイプラインを実行できるようになりました (例は https://github.com/hbusra/mirMachine.git で提供されています)。

Protocol

1.ソフトウェアの依存関係とインストール ホームサイトから、またはcondaを使用してソフトウェアの依存関係をインストールします。Perl がまだインストールされていない場合は、ホーム サイト (https://www.perl.org/get.html) からダウンロードしてインストールします。注: 表された結果は、Perl v5.32.0 を使用して予測されました。 アライメントプログラムであるBlast+をホー?…

Representative Results

上記のmiRNAパイプラインmirMachineを、パイプラインの性能を迅速に評価するための試験データに適用した。miRBase v22.1に寄託された高信頼植物miRNAのみを、IWGSCコムギRefSeqゲノムv224の染色体5Aに対してスクリーニングした。mirMachine_find、189個の高信頼miRNAの非冗長リストに対して312ヒットを返し、最大1個のミスマッチが許容されます(表1)。mirMachine_fold、二次構造評価…

Discussion

当社のmiRNAパイプラインSUmirは、過去10年間、多くの植物miRNAの同定に使用されてきました。ここでは、完全に自動化された、自由に利用できる新しいmiRNA同定およびアノテーションパイプラインmirMachineを開発しました。さらに、以前のパイプラインを含むがこれに限定されない多くのmiRNA同定パイプラインは、UNAfoldソフトウェア21に依存しており、UNAfoldソフトウェア21は、か…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Referências

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/pt/62430?article_type=t

Play Video

Citar este artigo
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video