Summary

मीरमशीन: प्लांट मिआरएनए एनोटेशन के लिए एक वन-स्टॉप शॉप

Published: May 01, 2021
doi:

Summary

यहां, हम एक नई और पूरी तरह से स्वचालित माइआरएनए पाइपलाइन प्रस्तुत करते हैं, mirMachine कि 1) ज्ञात और उपन्यास MIRNA को अधिक सटीक रूप से पहचान सकता है और 2) पूरी तरह से स्वचालित और स्वतंत्र रूप से उपलब्ध है। उपयोगकर्ता अब पूरी तरह से स्वचालित mirMachine पाइपलाइन चलाने के लिए एक छोटी सबमिशन स्क्रिप्ट निष्पादित कर सकते हैं।

Abstract

विभिन्न प्रकार के नॉनकोडिंग आरएनए में से, माइक्रोआरएनए (एमआईआरएनए) यकीनन पिछले एक दशक में सुर्खियों में रहे हैं। जीन अभिव्यक्ति के पोस्ट-ट्रांसक्रिप्शनल नियामकों के रूप में, एमआईआरएनए विभिन्न सेलुलर मार्गों में महत्वपूर्ण भूमिका निभाते हैं, जिसमें विकास और जैविक तनाव के लिए प्रतिक्रिया दोनों शामिल हैं, जैसे कि सूखा और बीमारियां। उच्च गुणवत्ता वाले संदर्भ जीनोम अनुक्रमों के होने से कई पौधों की प्रजातियों में एमआईआरएनए की पहचान और एनोटेशन सक्षम होता है, जहां एमआईआरएनए अनुक्रम अत्यधिक संरक्षित होते हैं। चूंकि कम्प्यूटेशनल एमआरएनए पहचान और एनोटेशन प्रक्रियाएं ज्यादातर त्रुटि-प्रवण प्रक्रियाएं हैं, होमोलॉजी-आधारित भविष्यवाणियां भविष्यवाणी सटीकता को बढ़ाती हैं। हमने पिछले दशक में एमआईआरएनए एनोटेशन पाइपलाइन, सुमीर को विकसित और बेहतर बनाया है, जिसका उपयोग तब से कई पौधों के जीनोम के लिए किया गया है।

यह अध्ययन एक पूरी तरह से स्वचालित, नई मिआरएनए पाइपलाइन, mirMachine (mirNA मशीन) प्रस्तुत करता है, (i) द्वितीयक संरचना भविष्यवाणियों पर एक अतिरिक्त फ़िल्टरिंग चरण जोड़कर, (ii) इसे पूरी तरह से स्वचालित बनाना, और (iii) पिछली पाइपलाइन का उपयोग करके छोटे आरएनए अनुक्रमण के आधार पर होमोलोगोलॉजी या उपन्यास एमआईआरएनए के आधार पर ज्ञात माइआरएनए की भविष्यवाणी करने के लिए नए विकल्प पेश करना। नई एमआईआरएनए पाइपलाइन, मीरमशीन का परीक्षण एराबिडोप्सिस सूचना संसाधन, टीएआईआर 10, एराबिडोप्सिस जीनोम की रिहाई और अंतर्राष्ट्रीय गेहूं जीनोम अनुक्रमण कंसोर्टियम (आईडब्ल्यूजीएससी) गेहूं संदर्भ जीनोम वी 2 का उपयोग करके किया गया था।

Introduction

अगली पीढ़ी की अनुक्रमण प्रौद्योगिकियों में प्रगति ने आरएनए संरचनाओं और नियामक तत्वों की समझ को व्यापक बनाया है, कार्यात्मक रूप से महत्वपूर्ण गैर-कोडिंग आरएनए (एनसीआरएनए) का खुलासा किया है। विभिन्न प्रकार के एनसीआरएनए में, माइक्रोआरएनए (एमआईआरएनए) पौधों 1,2 में 19 और 24 न्यूक्लियोटाइड के बीच लंबाई के साथ छोटे आरएनए का एक मौलिक नियामक वर्ग बनाते हैं। नेमाटोड केनोरहाब्डिस एलिगेंस3 में पहले माइआरएनए की खोज के बाद से, माइआरएनए की उपस्थिति और कार्यों का जानवरों और पौधों के जीनोम के साथ-साथ 4,5,6 में बड़े पैमाने पर अध्ययन किया गया है। माइआरएनए दरार या ट्रांसलेशनल दमन के लिए एमआरएनए को लक्षित करके कार्यकरते हैं। साक्ष्य जमा करने से यह भी पता चला है कि एमआईआरएनए पौधों में जैविक प्रक्रियाओं की एक विस्तृत श्रृंखला में शामिल हैं जिनमें विकास और विकास8, स्व-बायोजेनेसिस9, और कई जैविक और अजैविक तनाव प्रतिक्रियाएंशामिल हैं।

पौधों में, एमआईआरएनए को शुरू में लंबे प्राथमिक प्रतिलेख से संसाधित किया जाता है जिसे प्री-एमआईआरएनए11 कहा जाता है। नाभिक के अंदर आरएनए पोलीमरेज़ II द्वारा उत्पन्न ये प्री-एमआईआरएनए एक अपूर्ण फोल्ड-बैक संरचना12 बनाने वाले लंबे प्रतिलेख हैं। प्री-एमआईआरएनए बाद में प्री-एमआईआरएनए11 नामक एमआईआरएनए के अंतर्जात एकल-फंसे (एसएस) हेयरपिन अग्रदूतों का उत्पादन करने के लिए एक दरार प्रक्रिया से गुजरते हैं। प्री-माइआरएनए एक हेयरपिन जैसी संरचना बनाता है जिसमें एक एकल स्ट्रैंड एक डबल-स्ट्रैंड संरचना में फोल्ड होता है ताकि एक एमआईआरएनए डुप्लेक्स (एमआईआरएनए / एमआईआरएनए *) 13 का उत्पादन किया जा सके। डाइसर जैसा प्रोटीन एमआईआरएनए / एमआईआरएनए * डुप्लेक्स के दोनों किस्में काटता है, जिससे 2-न्यूक्लियोटाइड 3′-ओवरहैंग14,15 रह जाते हैं। मिआरएनए डुप्लेक्स नाभिक के अंदर मिथाइलेटेड होता है, जो माइआरएनए के 3′-अंत को क्षरण और यूरिनाइलेशन गतिविधि16,17 से बचाता है। एक हेलिकेस निर्यात के बाद मिथाइलेटेड मिआरएनए डुप्लेक्स को खोल देता है और परिपक्व एमआईआरएनए को साइटोसोल18 में आरएनए-प्रेरित साइलेंसिंग कॉम्प्लेक्स (आरआईएससी) में उजागर करता है। डुप्लेक्स का एक स्ट्रैंड परिपक्व मिआरएनए है जिसे आरआईएससी में शामिल किया गया है, जबकि दूसरा स्ट्रैंड, एमआईआरएनए *, अवक्रमित है। MIRNA-RISC कॉम्प्लेक्स लक्ष्य अनुक्रम को बांधता है जिससे पूर्ण पूरकता के मामले में या तो एमआरएनए क्षरण होता है या आंशिक पूरकताके मामले में ट्रांसलेशनल दमन होता है।

अभिव्यक्ति और बायोजेनेसिस विशेषताओं के आधार पर, एमआईआरएनए एनोटेशन के लिए दिशानिर्देश15,19 वर्णित किए गए हैं। परिभाषित दिशानिर्देशों के साथ, लुकास और बुदक ने पौधों 9 में सिलिको मिआरएनए पहचान में होमोलॉजी-आधारित होमोलॉजी करने के लिए सुमीर पाइपलाइन विकसितकी। सुमीर पाइपलाइन दो लिपियों से बनी थी: सुमीरफाइंड और सुमीरफोल्ड। एसयूमिरफाइंड नेशनल सेंटर फॉर बायोटेक्नोलॉजी इंफॉर्मेशन (एनसीबीआई) बेसिक लोकल एलाइनमेंट सर्च टूल (ब्लास्ट) स्क्रीनिंग के माध्यम से ज्ञात एमआईआरएनए डेटासेट के खिलाफ समानता खोज करता है, जिसमें केवल 2 या उससे कम बेमेल वाले हिट शामिल होते हैं और छोटे हिट (ब्लास्टन-शॉर्ट-अनकैप्ड-पेनल्टी -1-रिवॉर्ड 1) के प्रति पूर्वाग्रह से बचने के लिए। एसयूमिरफोल्ड यूएनएफोल्ड21 का उपयोग करके ब्लास्ट20 परिणामों से कथित मिआरएनए अनुक्रमों की द्वितीयक संरचना का मूल्यांकन करता है। एसयूमिरफोल्ड हेयरपिन संरचना की विशेषताओं की पहचान करके छोटे हस्तक्षेप करने वाले आरएनए से एमआईआरएनए को अलग करता है। इसके अलावा, यह मापदंडों द्वारा टीआरएनए और आरआरएनए जैसे अन्य एसएसआरएनए से एमआईआरएनए को अलग करता है, न्यूनतम गुना ऊर्जा सूचकांक > 0.67 और जीसी सामग्री 24-71% है। इस पाइपलाइन को हाल ही में दो अतिरिक्त चरणों को जोड़कर अपडेट किया गया है (i) संवेदनशीलता में वृद्धि, (ii) एनोटेशन सटीकता में वृद्धि, और (iii) अनुमानित MIRNA जीन22 का जीनोमिक वितरण प्रदान करना। प्लांट मिआरएनएअनुक्रम23 के उच्च संरक्षण को देखते हुए, इस पाइपलाइन को मूल रूप से होमोलॉजी-आधारित मिआरएनए भविष्यवाणी के लिए डिज़ाइन किया गया था। हालांकि, इस जैव सूचना विज्ञान विश्लेषण के साथ नोवेल एमआईआरएनए को सटीक रूप से पहचाना नहीं जा सका क्योंकि यह निकटता से संबंधित प्रजातियों के बीच एमआईआरएनए के अनुक्रम संरक्षण पर बहुत अधिक निर्भर था।

यह पेपर एक नई और पूरी तरह से स्वचालित माइआरएनए पाइपलाइन प्रस्तुत करता है, mirMachine कि 1) ज्ञात और उपन्यास MIRNA को अधिक सटीक रूप से पहचान सकता है (उदाहरण के लिए, पाइपलाइन अब sRNA-seq-आधारित उपन्यास MIRNA भविष्यवाणियों के साथ-साथ होमोलॉजी-आधारित MIRNA पहचान का उपयोग करती है) और 2) पूरी तरह से स्वचालित और स्वतंत्र रूप से उपलब्ध है। आउटपुट में अनुमानित एमआईआरएनए के जीनोमिक वितरण भी शामिल हैं। गेहूं और एराबिडोप्सिस जीनोम में होमोलॉजी-आधारित और एसआरएनए-सेक-आधारित भविष्यवाणियों दोनों के लिए मीरमशीन का परीक्षण किया गया था। हालांकि शुरू में मुफ्त सॉफ्टवेयर के रूप में जारी किया गया था, यूएनएफोल्ड पिछले दशक में एक वाणिज्यिक सॉफ्टवेयर बन गया। इस उन्नयन के साथ, द्वितीयक संरचना पूर्वानुमान उपकरण को UNAfold से RNAfold में बदल दिया गया था ताकि mirMachine स्वतंत्र रूप से उपलब्ध हो सके। उपयोगकर्ता अब पूरी तरह से स्वचालित mirMachine पाइपलाइन को चलाने के लिए एक छोटी सबमिशन स्क्रिप्ट निष्पादित कर सकते हैं (उदाहरण https://github.com/hbusra/mirMachine.git पर प्रदान किए जाते हैं)।

Protocol

1. सॉफ्टवेयर निर्भरता और स्थापना अपनी होम साइट से या कोंडा का उपयोग करके सॉफ़्टवेयर निर्भरता स्थापित करें।Perl डाउनलोड और स्थापित करें, यदि यह पहले से स्थापित नहीं है, तो इसकी होम साइट से (https://www.perl.org/get.ht…

Representative Results

ऊपर वर्णित एमआईआरएनए पाइपलाइन, मीरमशीन को पाइपलाइन के प्रदर्शन के तेजी से मूल्यांकन के लिए परीक्षण डेटा पर लागू किया गया था। एमआईआरबेस वी 22.1 पर जमा केवल उच्च आत्मविश्वास वाले पौधे एमआईआरएनए को आईडब्ल?…

Discussion

हमारी एमआईआरएनए पाइपलाइन, सुमीर, का उपयोग पिछले दशक से कई संयंत्र एमआईआरएनए की पहचान के लिए किया गया है। यहां, हमने एक नया, पूरी तरह से स्वचालित, और स्वतंत्र रूप से उपलब्ध एमआईआरएनए पहचान और एनोटेशन पाइ?…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/fr/62430?article_type=t

Play Video

Citer Cet Article
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video