Summary

دي نوفو تحديد إطارات القراءة المفتوحة المترجمة بنشاط باستخدام بيانات التنميط الريبوسومي

Published: February 18, 2022
doi:

Summary

ترجمة الريبوسومات فك تشفير ثلاثة نيوكليوتيدات لكل كودون إلى الببتيدات. حركتها على طول الحمض النووي الريبوزي المرسال ، التي تم التقاطها بواسطة التنميط الريبوسومي ، تنتج آثار أقدام تظهر دورية ثلاثية مميزة. يصف هذا البروتوكول كيفية استخدام RiboCode لفك شفرة هذه الميزة البارزة من بيانات التنميط الريبوسومي لتحديد إطارات القراءة المفتوحة المترجمة بنشاط على مستوى النسخ الكامل.

Abstract

يعد تحديد إطارات القراءة المفتوحة (ORFs) ، وخاصة تلك التي تشفر الببتيدات الصغيرة ويتم ترجمتها بنشاط في سياقات فسيولوجية محددة ، أمرا بالغ الأهمية للتعليقات التوضيحية الشاملة للتراتيمات المعتمدة على السياق. يوفر التنميط الريبوسومي، وهو تقنية للكشف عن مواقع الارتباط وكثافات ترجمة الريبوسومات على الحمض النووي الريبوسومي، وسيلة لاكتشاف مكان حدوث الترجمة بسرعة على نطاق الجينوم الواسع. ومع ذلك ، فليست مهمة تافهة في المعلوماتية الحيوية تحديد ترجمة ORFs بكفاءة وشمولية لتنميط الريبوسوم. الموضح هنا هو حزمة سهلة الاستخدام ، تسمى RiboCode ، مصممة للبحث عن ترجمة نشطة ل ORFs من أي حجم من الإشارات المشوهة والغامضة في بيانات التنميط الريبوسومي. إذا أخذنا مجموعة البيانات المنشورة مسبقا كمثال، توفر هذه المقالة إرشادات خطوة بخطوة لخط أنابيب RiboCode بأكمله، بدءا من المعالجة المسبقة للبيانات الخام إلى تفسير ملفات نتائج الإخراج النهائي. وعلاوة على ذلك، ومن أجل تقييم معدلات ترجمة الموارد المفتوحة، يرد أيضا وصف مفصل لإجراءات تصور وتقدير كمي لكثافات الريبوسوم في كل إطار من أطر عمل الريبوسوم. باختصار ، هذه المقالة هي تعليمات مفيدة وفي الوقت المناسب لمجالات البحث المتعلقة بالترجمة ، و ORFs الصغيرة ، والببتيدات.

Introduction

في الآونة الأخيرة ، كشفت مجموعة متزايدة من الدراسات عن إنتاج واسع النطاق للببتيدات المترجمة من ORFs من جينات الترميز والجينات المشروحة سابقا على أنها غير مشفرة ، مثل الحمض النووي الريبي الطويل غير المشفر (lncRNAs) 1،2،3،4،5،6،7،8. يتم تنظيم أو تحفيز هذه ORFs المترجمة بواسطة الخلايا للاستجابة للتغيرات البيئية والإجهاد وتمايز الخلايا1،8،9،10،11،12،13. وقد ثبت أن منتجات الترجمة لبعض الموارد المالية المفتوحة تلعب أدوارا تنظيمية هامة في العمليات البيولوجية المتنوعة في التنمية وعلم وظائف الأعضاء. على سبيل المثال ، اكتشف Chng et al.14 هرمون الببتيد المسمى Elabela (Ela ، المعروف أيضا باسم Abela / Ende / Toddler) ، وهو أمر بالغ الأهمية لتطور القلب والأوعية الدموية. اقترح باولي وآخرون أن إيلا يعمل أيضا كميتوجين يعزز هجرة الخلايا في جنين الأسماك المبكر15. أبلغ Magny et al. عن اثنين من الببتيدات الدقيقة التي تحتوي على أقل من 30 حمضا أمينيا تنظم نقل الكالسيوم وتؤثر على تقلص العضلات المنتظم في قلب ذبابة الفاكهة 10.

ولا يزال من غير الواضح عدد هذه الببتيدات التي يشفرها الجينوم وما إذا كانت ذات صلة بيولوجية. لذلك ، فإن التحديد المنهجي لهذه ORFs التي يحتمل أن تكون مشفرة أمر مرغوب فيه للغاية. ومع ذلك ، فإن التحديد المباشر لمنتجات هذه ORFs (أي البروتين أو الببتيد) باستخدام النهج التقليدية مثل الحفظ التطوري 16،17 وقياس الطيف الكتلي 18،19 يمثل تحديا لأن كفاءة الكشف عن كلا النهجين تعتمد على طول ووفرة وتكوين الأحماض الأمينية للبروتينات أو الببتيدات المنتجة. وقد وفر ظهور تنميط الريبوسوم، وهو تقنية لتحديد شغل الريبوسوم على الحمض النووي الريبوزي المرسال بدقة النوكليوتيدات، طريقة دقيقة لتقييم إمكانات الترميز للنسخ المختلفة3،20،21، بغض النظر عن طولها وتكوينها. ميزة مهمة وشائعة الاستخدام لتحديد ترجمة ORFs بنشاط باستخدام تنميط الريبوسوم هي دورية النيوكليوتيدات الثلاثة (3-nt) لآثار أقدام الريبوسوم على mRNA من كودون البداية إلى كودون التوقف. ومع ذلك ، غالبا ما تواجه بيانات التنميط الريبوسومي العديد من المشكلات ، بما في ذلك قراءات التسلسل المنخفضة والمتناثرة على طول ORFs ، وضوضاء التسلسل العالية ، وتلوث الحمض النووي الريبوسومي (rRNA). وبالتالي ، فإن الإشارات المشوهة والغامضة الناتجة عن هذه البيانات تضعف أنماط الدورية 3-nt لآثار أقدام الريبوسومات على الحمض النووي الريبوزي المرسال ، مما يجعل في نهاية المطاف تحديد ORFs المترجمة عالية الثقة أمرا صعبا.

قامت حزمة تسمى “RiboCode” بتكييف اختبار الرتبة المعدل الموقع من Wilcoxon واستراتيجية تكامل القيمة P لفحص ما إذا كان ORF يحتوي على شظايا محمية بالريبوسوم داخل الإطار (RPFs) أكثر بكثير من RPFs22 خارج الإطار. وقد ثبت أنه عالي الكفاءة وحساس ودقيق للتعليق التوضيحي الجديد للترانسلاتوم في بيانات التنميط الريبوسومي المحاكية والحقيقية. وهنا، نصف كيفية استخدام هذه الأداة للكشف عن عمليات ORFs المحتملة للترجمة من مجموعات بيانات تسلسل توصيف الريبوسوم الخام التي تم إنشاؤها بواسطة الدراسة السابقة23. وقد استخدمت مجموعات البيانات هذه لاستكشاف وظيفة الوحدة الفرعية EIF3 “E” (EIF3E) في الترجمة من خلال مقارنة ملامح إشغال الريبوسوم لخلايا MCF-10A المنقولة مع التحكم (si-Ctrl) و EIF3E (si-eIF3e) الحمض النووي الريبي الصغير التداخل (siRNAs). من خلال تطبيق RiboCode على مجموعات البيانات النموذجية هذه ، اكتشفنا 5,633 ORFs جديدة يحتمل أن تشفر الببتيدات الصغيرة أو البروتينات. تم تصنيف هذه ORFs إلى أنواع مختلفة بناء على مواقعها بالنسبة لمناطق الترميز ، بما في ذلك ORFs المنبع (uORFs) ، و ORFs في المصب (dORFs) ، و ORFs المتداخلة ، و ORFs من جينات ترميز البروتين الجديدة (PCGs الجديدة) ، و ORFs من الجينات الجديدة غير المشفرة للبروتين (NonPCGs الجديدة). زادت كثافات قراءة RPF على uORFs بشكل كبير في الخلايا التي تعاني من نقص EIF3E مقارنة بخلايا التحكم ، والتي قد تكون ناجمة جزئيا على الأقل عن إثراء الريبوسومات التي تترجم بنشاط. وأشار تراكم الريبوسوم الموضعي في المنطقة من الكودون 25 إلى 75 من الخلايا الناقصة EIF3E إلى وجود انسداد في استطالة الترجمة في المرحلة المبكرة. يوضح هذا البروتوكول أيضا كيفية تصور كثافة RPF للمنطقة المطلوبة لفحص أنماط الدورية 3-nt لآثار أقدام الريبوسوم على ORFs المحددة. تظهر هذه التحليلات الدور القوي ل RiboCode في تحديد ترجمة ORFs ودراسة تنظيم الترجمة.

Protocol

1. إعداد البيئة وتثبيت RiboCode افتح نافذة محطة Linux الطرفية وقم بإنشاء بيئة conda:كوندا إنشاء -n ريبوكود بيثون = 3.8 التبديل إلى البيئة التي تم إنشاؤها وتثبيت RiboCode والتبعيات:conda تنشيط RiboCodeكوندا تثبيت -c بيوكوندا ريبوكود ريبومينر sra-tools fastx_toolkit cutadapt القوس نجمة samtools <…

Representative Results

وقد أودع مثال مجموعات بيانات التنميط الريبوسومي في قاعدة بيانات توقعات البيئة العالمية تحت رقم الانضمام GSE131074. تتوفر جميع الملفات والرموز المستخدمة في هذا البروتوكول من الملفات التكميلية 1-4. من خلال تطبيق RiboCode على مجموعة من مجموعات بيانات التنميط الريبوسومي <su…

Discussion

يوفر تنميط الريبوسوم فرصة غير مسبوقة لدراسة عمل الريبوسومات في الخلايا على نطاق الجينوم. يمكن أن يوفر فك رموز المعلومات التي تحملها بيانات التنميط الريبوسومي بدقة نظرة ثاقبة حول مناطق الجينات أو النصوص التي تترجم بنشاط. يوفر هذا البروتوكول خطوة بخطوة إرشادات حول كيفية استخدام RiboCode لتحلي…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

يود المؤلفون أن ينوه بالدعم المقدم من الموارد الحسابية التي توفرها منصة HPCC بجامعة شيان جياوتونغ. Z.X. بامتنان خطة دعم المواهب الشابة من الدرجة الأولى من جامعة شيان جياوتونغ.

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

Riferimenti

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/it/63366?article_type=t

Play Video

Citazione di questo articolo
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video