כאן אנו מציגים צינור miRNA חדש ואוטומטי לחלוטין, mirMachine ש-1) יכול לזהות miRNAs ידועים וחדשניים בצורה מדויקת יותר ו-2) הוא אוטומטי לחלוטין וזמין באופן חופשי. משתמשים יכולים כעת לבצע סקריפט הגשה קצר כדי להפעיל את צינור mirMachine האוטומטי לחלוטין.
מבין סוגים שונים של רנ”א שאינם מקודדים, מיקרו-רנ”א (miRNAs) היו ללא ספק באור הזרקורים בעשור האחרון. כמווסתים לאחר שעתוק של ביטוי גנים, miRNAs ממלאים תפקידי מפתח במסלולים תאיים שונים, כולל התפתחות ותגובה ללחץ a/ביוטי, כגון בצורת ומחלות. רצפי גנום ייחוס איכותיים אפשרו זיהוי וביאור של miRNAs במספר מיני צמחים, שבהם רצפי miRNA נשמרים מאוד. מכיוון שתהליכי זיהוי וביאור miRNA חישוביים הם בעיקר תהליכים מועדים לשגיאות, תחזיות מבוססות הומולוגיה מגבירות את דיוק החיזוי. פיתחנו ושיפרנו את צינור ביאור miRNA, SUmir, בעשור האחרון, המשמש למספר גנומים של צמחים מאז.
מחקר זה מציג צינור miRNA חדש ואוטומטי לחלוטין, mirMachine (miRNA Machine), על ידי (i) הוספת שלב סינון נוסף על תחזיות המבנה המשני, (ii) הפיכתו לאוטומטי לחלוטין, ו-(iii) הצגת אפשרויות חדשות לחיזוי miRNA ידוע המבוסס על הומולוגיה או miRNAs חדשים המבוססים על קריאות ריצוף RNA קטנות באמצעות הצינור הקודם. צינור miRNA החדש, mirMachine, נבדק באמצעות משאב המידע Arabidopsis, TAIR10, שחרור הגנום של Arabidopsis וקונסורציום ריצוף החיטה הבינלאומי (IWGSC) גנום ייחוס חיטה v2.
ההתקדמות בטכנולוגיות ריצוף הדור הבא הרחיבה את ההבנה של מבני RNA ואלמנטים רגולטוריים, וחשפה רנ”א חשובים מבחינה פונקציונלית שאינם מקודדים (ncRNAs). מבין סוגים שונים של ncRNAs, מיקרו-רנ”א (miRNAs) מהווים סוג ויסות בסיסי של רנ”א קטנים באורך שבין 19 ל-24 נוקלאוטידים בצמחים 1,2. מאז גילוי ה-miRNA הראשון בנמטודה Caenorhabditis elegans3, נוכחותם ותפקודם של miRNAs נחקרו בהרחבה גם בגנומים של בעלי חיים וצמחים, כמו גםב-4,5,6. miRNAs פועלים על ידי מיקוד mRNA עבור ביקוע או דיכוי תרגום7. עדויות מצטברות הראו גם כי miRNAs מעורבים במגוון רחב של תהליכים ביולוגיים בצמחים, כולל גדילה והתפתחות8, ביוגנזה עצמית9, ומספר תגובות עקה ביוטיות וא-ביוטיות10.
בצמחים, miRNAs מעובדים בתחילה מתעתיקים ראשוניים ארוכים הנקראים pri-miRNAs11. פרי-miRNAs אלה הנוצרים על ידי RNA פולימראז II בתוך הגרעין הם תעתיקים ארוכים היוצרים מבנה אחורי מתקפל לא מושלם12. הפרי-miRNAs עוברים מאוחר יותר תהליך ביקוע כדי לייצר מבשרי סיכות ראש חד-גדיליות אנדוגניות (ss) של miRNAs הנקראים pre-miRNAs11. הקדם-miRNA יוצר מבנה דמוי סיכת שיער שבו גדיל יחיד מתקפל למבנה דו-גדילי כדי לכרות דופלקס miRNA (miRNA/miRNA*)13. חלבון דמוי דיקר חותך את שני הגדילים של הדופלקס miRNA/miRNA*, ומשאיר 2-נוקלאוטיד 3′-overhangs14,15. דופלקס miRNA הוא מתילציה בתוך הגרעין, אשר מגן על 3′-קצה של miRNA מפני השפלה ופעילות uridylation16,17. הליקאז משחרר את דופלקס ה-miRNA שעבר מתילציה לאחר הייצוא וחושף את ה-miRNA הבוגר לקומפלקס ההשתקה המושרה על-ידי רנ”א (RISC) בציטוזול18. גדיל אחד של הדופלקס הוא miRNA בוגר המשולב ב-RISC , ואילו הגדיל השני, miRNA*, מתפרק. קומפלקס miRNA-RISC נקשר לרצף המטרה המוביל להתפרקות mRNA במקרה של השלמה מלאה או דיכוי תרגומי במקרה של השלמה חלקית13.
בהתבסס על תכונות הביטוי והביוגנזה, תוארו קווים מנחים לביאור miRNA15,19. עם ההנחיות שהוגדרו, לוקאס ובודאק פיתחו את צינור SUmir לביצוע הומולוגיה מבוססת זיהוי miRNA סיליקו בצמחים9. צינור SUmir הורכב משני תסריטים: SUmirFind ו- SUmirFold. SUmirFind מבצעת חיפושי דמיון מול מערכי נתונים ידועים של miRNA באמצעות המרכז הלאומי למידע ביוטכנולוגי (NCBI) סריקת כלי חיפוש יישור מקומי בסיסי (BLAST) עם פרמטרים ששונו כדי לכלול להיטים עם רק 2 או פחות אי התאמות וכדי למנוע הטיה לכיוון פגיעות קצרות יותר (blastn-short -unapped -עונש -1 -פרס 1). SUmirFold מעריך את המבנה המשני של רצפי miRNA פוטטיביים מתוצאות BLAST20 באמצעות UNAfold21. SUmirFold מבדיל בין miRNAs לבין רנ”א מפריעים קטנים על ידי זיהוי המאפיינים של מבנה סיכות הראש. יתר על כן, הוא מבדיל miRNAs מ ssRNAs אחרים כגון tRNA ו rRNA על ידי הפרמטרים, מדד אנרגיה קיפול מינימלי > 0.67 ותכולת GC של 24-71%. צינור זה עודכן לאחרונה על ידי הוספת שני שלבים נוספים כדי (i) להגביר את הרגישות, (ii) להגדיל את דיוק הביאור, ו-(iii) לספק הפצה גנומית של הגנים miRNA חזוי22. בהתחשב בשימור הגבוה של רצפי miRNA צמחיים23, צינור זה תוכנן במקור לחיזוי miRNA מבוסס הומולוגיה. עם זאת, לא ניתן היה לזהות במדויק את ה-miRNAs החדשים עם ניתוח ביואינפורמטיקה זה, שכן הוא הסתמך במידה רבה על שימור רצפים של miRNAs בין מינים קרובים.
מאמר זה מציג צינור miRNA חדש ואוטומטי לחלוטין, mirMachine כי 1) יכול לזהות miRNAs ידועים וחדשים בצורה מדויקת יותר (לדוגמה, הצינור משתמש כעת בתחזיות miRNA חדשניות מבוססות sRNA-seq כמו גם זיהוי miRNA מבוסס הומולוגיה) ו-2) הוא אוטומטי לחלוטין וזמין באופן חופשי. התפוקות כללו גם את ההתפלגויות הגנומיות של ה-miRNAs החזויים. mirMachine נבדקה הן לתחזיות מבוססות הומולוגיה והן לתחזיות מבוססות sRNA-seq בגנומים של חיטה וערבידופסיס . למרות ששוחררה בתחילה כתוכנה חופשית, UNAfold הפכה לתוכנה מסחרית בעשור האחרון. עם שדרוג זה, כלי חיזוי המבנה המשני הועבר מ- UNAfold ל- RNAfold כך ש- mirMachine יכול להיות זמין באופן חופשי. משתמשים יכולים כעת לבצע סקריפט הגשה קצר כדי להפעיל את צינור mirMachine האוטומטי לחלוטין (דוגמאות מסופקות ב- https://github.com/hbusra/mirMachine.git).
צינור ה-miRNA שלנו, SUmir, שימש לזיהוי של miRNAs צמחיים רבים בעשור האחרון. כאן, פיתחנו צינור זיהוי וביאור miRNA חדש, אוטומטי לחלוטין וזמין באופן חופשי, mirMachine. יתר על כן, מספר צינורות זיהוי miRNA כולל, אך לא מוגבל לצינור הקודם, היו תלויים בתוכנת UNAfold21, שהפכה עם הזמן לתוכנה מסחרית, אם כי בעבר היית…
https://www.ncbi.nlm.nih.gov/books/NBK279671/ | Blast+ | ||
https://github.com/hbusra/mirMachine.git | mirMachine submission script | ||
https://www.perl.org/get.html | Perl | ||
https://www.tbi.univie.ac.at/RNA/ | RNAfold | ||
Arabidopsis TAIR10 | |||
Triticum aestivum (wheat, IWGSC RefSeq v2) |