هنا ، نقدم خط أنابيب miRNA جديدا ومؤتمتا بالكامل ، mirMachine يمكنه 1) تحديد miRNAs المعروفة والجديدة بشكل أكثر دقة و 2) مؤتمت بالكامل ومتاح مجانا. يمكن للمستخدمين الآن تنفيذ برنامج نصي قصير للإرسال لتشغيل خط أنابيب mirMachine المؤتمت بالكامل.
من بين أنواع مختلفة من الحمض النووي الريبي غير المشفر ، يمكن القول إن الحمض النووي الريبي الصغير (miRNAs) كان في دائرة الضوء على مدار العقد الماضي. بصفتها منظمات ما بعد النسخ للتعبير الجيني ، تلعب miRNAs أدوارا رئيسية في المسارات الخلوية المختلفة ، بما في ذلك التطور والاستجابة للإجهاد الحيوي ، مثل الجفاف والأمراض. مكن وجود تسلسلات جينوم مرجعية عالية الجودة من تحديد وشرح miRNAs في العديد من الأنواع النباتية ، حيث يتم حفظ تسلسلات miRNA بشكل كبير. نظرا لأن عمليات تحديد miRNA الحسابية والتعليقات التوضيحية هي في الغالب عمليات معرضة للخطأ ، فإن التنبؤات القائمة على التماثل تزيد من دقة التنبؤ. لقد طورنا وقمنا بتحسين خط أنابيب التعليقات التوضيحية miRNA ، SUmir ، في العقد الماضي ، والذي تم استخدامه للعديد من جينومات النبات منذ ذلك الحين.
تقدم هذه الدراسة خط أنابيب miRNA جديد مؤتمت بالكامل ، mirMachine (miRNA Machine) ، من خلال (i) إضافة خطوة تصفية إضافية على تنبؤات الهيكل الثانوي ، (ii) جعله مؤتمتا بالكامل ، و (iii) تقديم خيارات جديدة للتنبؤ إما miRNA المعروف بناء على التماثل أو miRNAs الجديدة بناء على قراءات تسلسل الحمض النووي الريبي الصغيرة باستخدام خط الأنابيب السابق. تم اختبار خط أنابيب miRNA الجديد ، mirMachine ، باستخدام مورد معلومات Arabidopsis ، TAIR10 ، وإصدار جينوم Arabidopsis و International Wheat Genom Genocium (IWGSC) الجينوم المرجعي للقمح v2.
أدى التقدم في تقنيات تسلسل الجيل التالي إلى توسيع فهم هياكل الحمض النووي الريبي والعناصر التنظيمية ، مما كشف عن الحمض النووي الريبي غير المشفر (ncRNAs) المهم وظيفيا. من بين الأنواع المختلفة من الحمض النووي الريبوزي الناقل ، تشكل الحمض النووي الريبي الصغير (miRNAs) فئة تنظيمية أساسية من الحمض النووي الريبي الصغير بطول يتراوح بين 19 و 24 نيوكليوتيدات في النباتات 1,2. منذ اكتشاف أول miRNA في الديدان الخيطية Caenorhabditis elegans3 ، تمت دراسة وجود ووظائف miRNAs على نطاق واسع في الجينوم الحيواني والنباتي وكذلك4،5،6. تعمل miRNAs عن طريق استهداف mRNAs للانقسام أو القمع الانتقالي7. أظهرت الأدلة المتراكمة أيضا أن miRNAs تشارك في مجموعة واسعة من العمليات البيولوجية في النباتات بما في ذلك النمو والتطور8 ، والتكوين الحيوي الذاتي9 ، والعديد من استجابات الإجهاد الحيوي وغير الحيوي10.
في النباتات ، تتم معالجة miRNAs في البداية من نصوص أولية طويلة تسمى pri-miRNAs11. هذه pri-miRNAs الناتجة عن RNA polymerase II داخل النواة هي نسخ طويلة تشكل بنية طي خلفي غير كاملة12. تخضع pri-miRNAs لاحقا لعملية انشقاق لإنتاج سلائف دبوس شعر داخلية مفردة (ss) من miRNAs تسمى pre-miRNAs11. يشكل ما قبل miRNA بنية تشبه دبوس الشعر حيث يتم طي حبلا واحد في هيكل مزدوج تقطعت به السبل لاستئصال miRNA مزدوج (miRNA / miRNA *)13. يقطع البروتين الشبيه ب Dicer كلا شريطي miRNA / miRNA * على الوجهين ، تاركا 2-nucleotide 3′-overlands14,15. يتم ميثيل miRNA المزدوج داخل النواة ، مما يحمي الطرف 3′-من miRNA من التدهور ونشاط اليوريديل16,17. تقوم طائرة هليكوبتر بفك دوبلكس miRNA الميثيلي بعد التصدير وتعرض miRNA الناضج لمجمع الإسكات الناجم عن الحمض النووي الريبي (RISC) في السيتوسول18. أحد حبلا الوجهين هو miRNA ناضج مدمج في RISC ، في حين أن الشريط الآخر ، miRNA * ، متحلل. يرتبط مركب miRNA-RISC بالتسلسل المستهدف مما يؤدي إما إلى تدهور mRNA في حالة التكامل الكامل أو القمع الانتقالي في حالة التكامل الجزئي13.
استنادا إلى ميزات التعبير والتكوين الحيوي ، تم وصف إرشادات التعليق التوضيحي miRNA15,19. مع المبادئ التوجيهية المحددة ، طور لوكاس وبوداك خط أنابيب SUmir لإجراء تماثل قائم على تحديد السيليكو ميرنا في النباتات9. يتكون خط أنابيب SUmir من نصين: SUmirFind و SUmirFold. تقوم SUmirFind بإجراء عمليات بحث عن التشابه مقابل مجموعات بيانات miRNA المعروفة من خلال فحص أداة بحث المحاذاة المحلية الأساسية (BLAST) التابعة للمركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) مع المعلمات المعدلة لتضمين النتائج التي تحتوي على 2 فقط أو أقل من حالات عدم التطابق ولتجنب التحيز نحو النتائج الأقصر (blastn-short -unapped -penalty -1 -reward 1). يقوم SUmirFold بتقييم البنية الثانوية لتسلسلات miRNA المفترضة من نتائج BLAST20 باستخدام UNAfold21. يميز SUmirFold miRNAs عن الحمض النووي الريبي الصغير المتداخل من خلال تحديد خصائص بنية دبوس الشعر. علاوة على ذلك ، فإنه يميز miRNAs عن ssRNAs الأخرى مثل tRNA و rRNA من خلال المعلمات ، والحد الأدنى لمؤشر طاقة الطي > 0.67 ومحتوى GC من 24-71٪. تم تحديث خط الأنابيب هذا مؤخرا بإضافة خطوتين إضافيتين إلى (i) زيادة الحساسية ، (ii) زيادة دقة التعليقات التوضيحية ، و (iii) توفير التوزيع الجيني لجينات miRNA المتوقعة22. نظرا للحفظ العالي لتسلسل miRNA النباتي23 ، تم تصميم خط الأنابيب هذا في الأصل للتنبؤ ب miRNA القائم على التماثل. ومع ذلك ، لا يمكن تحديد miRNAs الجديدة بدقة من خلال تحليل المعلوماتية الحيوية هذا لأنه يعتمد بشكل كبير على الحفاظ على تسلسل miRNAs بين الأنواع ذات الصلة الوثيقة.
تقدم هذه الورقة خط أنابيب miRNA جديدا ومؤتمتا بالكامل ، mirMachine يمكنه 1) تحديد miRNAs المعروفة والجديدة بشكل أكثر دقة (على سبيل المثال ، يستخدم خط الأنابيب الآن تنبؤات miRNA الجديدة المستندة إلى sRNA-seq بالإضافة إلى تحديد miRNA القائم على التماثل) و 2) مؤتمت بالكامل ومتاح مجانا. تضمنت المخرجات أيضا التوزيعات الجينومية ل miRNAs المتوقعة. تم اختبار mirMachine لكل من التنبؤات القائمة على التماثل والتنبؤات القائمة على sRNA-seq في جينومات القمح والأرابيدوبسيس . على الرغم من إصداره في البداية كبرنامج حر ، إلا أن UNAfold أصبح برنامجا تجاريا في العقد الماضي. مع هذه الترقية ، تم تحويل أداة التنبؤ بالهيكل الثانوي من UNAfold إلى RNAfold بحيث يمكن أن تكون mirMachine متاحة مجانا. يمكن للمستخدمين الآن تنفيذ برنامج نصي قصير للإرسال لتشغيل خط أنابيب mirMachine المؤتمت بالكامل (يتم توفير أمثلة في https://github.com/hbusra/mirMachine.git).
تم استخدام خط أنابيب miRNA الخاص بنا ، SUmir ، لتحديد العديد من miRNAs النباتية على مدار العقد الماضي. هنا ، قمنا بتطوير خط أنابيب جديد ومؤتمت بالكامل ومتاح مجانا لتحديد miRNA والتعليق التوضيحي ، mirMachine. وعلاوة على ذلك، كان عدد من خطوط أنابيب تحديد هوية الحمض النووي الريبوزي المرسال، بما في ذلك، على س?…
https://www.ncbi.nlm.nih.gov/books/NBK279671/ | Blast+ | ||
https://github.com/hbusra/mirMachine.git | mirMachine submission script | ||
https://www.perl.org/get.html | Perl | ||
https://www.tbi.univie.ac.at/RNA/ | RNAfold | ||
Arabidopsis TAIR10 | |||
Triticum aestivum (wheat, IWGSC RefSeq v2) |