Summary

ग्लाइकन-मध्यस्थता प्रोटीन इंटरैक्शन के अध्ययन के लिए जैव सूचना विज्ञान संसाधन

Published: January 20, 2022
doi:

Summary

यह प्रोटोकॉल दिखाता है कि ऑनलाइन संसाधनों के साथ मानव प्रोटीन ग्लाइकोम का पता लगाने, तुलना करने और व्याख्या करने का तरीका क्या है।

Abstract

Glyco@Expasy पहल को अन्योन्याश्रित डेटाबेस और उपकरणों के संग्रह के रूप में लॉन्च किया गया था जो ग्लाइकोबायोलॉजी में ज्ञान के कई पहलुओं को फैलाते हैं। विशेष रूप से, इसका उद्देश्य ग्लाइकोप्रोटीन (जैसे सेल सतह रिसेप्टर्स) और ग्लाइकन द्वारा मध्यस्थता किए गए कार्बोहाइड्रेट-बाध्यकारी प्रोटीन के बीच बातचीत को उजागर करना है। यहां, संग्रह के प्रमुख संसाधनों को मानव प्रोस्टेट विशिष्ट एंटीजन (पीएसए) के एन-ग्लाइकोम और मानव सीरम प्रोटीन के ओ-ग्लाइकोम पर केंद्रित दो उदाहरणों के माध्यम से पेश किया जाता है। विभिन्न डेटाबेस क्वेरीज़ के माध्यम से और विज़ुअलाइज़ेशन टूल की मदद से, यह आलेख दिखाता है कि जानकारी के अन्यथा बिखरे हुए टुकड़ों को इकट्ठा करने और सहसंबंधित करने के लिए एक निरंतरता में सामग्री का पता लगाने और तुलना करने का तरीका क्या है। एकत्रित डेटा ग्लाइकन फ़ंक्शन के अधिक विस्तृत परिदृश्यों को खिलाने के लिए नियत हैं। इसलिए, यहां पेश किए गए ग्लाइकोइन्फॉर्मेटिक्स को किसी दिए गए संदर्भ में प्रोटीन ग्लाइकोम की विशिष्टता पर मान्यताओं को मजबूत करने, आकार देने या खंडन करने के साधन के रूप में प्रस्तावित किया गया है।

Introduction

ग्लाइकन, प्रोटीन जिससे वे जुड़े होते हैं (ग्लाइकोप्रोटीन) और प्रोटीन जिनसे वे बांधते हैं (लेक्टिन या कार्बोहाइड्रेट-बाइंडिंग प्रोटीन) सेल सतह पर मुख्य आणविक अभिनेता हैं सेल-सेल संचार में इस केंद्रीय भूमिका के बावजूद, ग्लाइकोमिक्स, ग्लाइकोप्रोटिओमिक्स, या ग्लाइकन-इंटरैक्टोमिक्स डेटा सहित बड़े पैमाने पर अध्ययन अभी भी जीनोमिक्स और प्रोटिओमिक्स में अपने समकक्ष की तुलना में दुर्लभ हैं।

हाल ही में, जटिल कार्बोहाइड्रेट की ब्रांचिंग संरचनाओं की विशेषता के लिए तरीके, जबकि अभी भी वाहक प्रोटीन के लिए संयुग्मित किया जा रहा है विकसित नहीं किया गया था। ग्लाइकोप्रोटीन का जैवसंश्लेषण एक गैर-टेम्पलेट-संचालित प्रक्रिया है जिसमें मोनोसेकेराइड दाता, स्वीकार करने वाले ग्लाइकोप्रोटीन सब्सट्रेट, और ग्लाइकोसिलट्रांसफरेज़ और ग्लाइकोसिडेस एक इंटरैक्टिव भूमिका निभाते हैं। परिणामी ग्लाइकोप्रोटीन कई ब्रांचिंग बिंदुओं के साथ जटिल संरचनाओं को सहन कर सकते हैं जहां प्रत्येक मोनोसेकेराइड घटक प्रकृति में मौजूद कई प्रकारों में से एक हो सकता है। गैर-टेम्पलेट-संचालित प्रक्रिया ओलिगोसेकेराइड संरचनात्मक डेटा उत्पन्न करने के लिए एकमात्र विकल्प के रूप में जैव रासायनिक विश्लेषण लागू करती है। एक देशी प्रोटीन से जुड़ी ग्लाइकन संरचनाओं की विश्लेषणात्मक प्रक्रिया अक्सर चुनौतीपूर्ण होती है क्योंकि इसे मोनोसेकेराइड संरचना, लिंकेज और ब्रांचिंग अनुक्रम2 निर्धारित करने के लिए संवेदनशील, मात्रात्मक और मजबूत प्रौद्योगिकियों की आवश्यकता होती है।

इस संदर्भ में, मास स्पेक्ट्रोमेट्री (एमएस) ग्लाइकोमिक्स और ग्लाइकोप्रोटिओमिक्स प्रयोगों में सबसे व्यापक रूप से उपयोग की जाने वाली तकनीक है। जैसे-जैसे समय बीतता है, ये उच्च थ्रूपुट सेटिंग्स में किए जाते हैं और डेटा अब डेटाबेस में जमा हो रहा है। विभिन्न प्रारूपों में ग्लाइकन संरचनाएं 3, GlyTouCan4 को पॉप्युलेट करती हैं, सार्वभौमिक ग्लाइकन डेटा रिपॉजिटरी जहां प्रत्येक संरचना एक स्थिर पहचानकर्ता के साथ जुड़ी होती है, भले ही परिशुद्धता के स्तर के बावजूद जिसके साथ ग्लाइकन को परिभाषित किया गया है (उदाहरण के लिए, संभवतः लापता लिंकेज प्रकार या अस्पष्ट संरचना)। बहुत समान संरचनाएं एकत्र की जाती हैं लेकिन उनके मामूली अंतर स्पष्ट रूप से रिपोर्ट किए जाते हैं। ग्लाइकोप्रोटीन का वर्णन किया गया है और GlyConnect5 और GlyGen6 में क्यूरेट किया गया है, दो डेटाबेस एक-दूसरे को क्रॉस-संदर्भित करते हैं। सबूत के संरचनात्मक टुकड़ों का समर्थन करने वाले एमएस डेटा तेजी से ग्लाइकोपोस्ट 7 में संग्रहीत किए जाते हैं। ऑनलाइन संसाधनों के व्यापक कवरेज के लिए, संदर्भ मैनुअल के अध्याय 52, ग्लाइकोबायोलॉजी की अनिवार्यता, ग्लाइकोइन्फॉर्मेटिक्स 8 के लिए समर्पित है। दिलचस्प बात यह है कि ग्लाइकोपेप्टाइड पहचान सॉफ्टवेयर हाल के वर्षों में 9,10 में फैल गया है, हालांकि पुनरुत्पादन के लाभ के लिए नहीं। बाद की चिंता ने एचयूपीओ ग्लाइकोप्रोटिओमिक्स इनिशिएटिव (एचजीआई) के नेताओं को 2019 में एक सॉफ्टवेयर चुनौती निर्धारित करने के लिए प्रेरित किया। सीआईडी, ईटीडी और ईटीएचडी विखंडन मोड में एन- और ओ-ग्लाइकोसिलेटेड मानव सीरम प्रोटीन के जटिल मिश्रणों को संसाधित करने से प्राप्त एमएस डेटा, प्रतियोगियों को उपलब्ध कराया गया था चाहे वह सॉफ्टवेयर उपयोगकर्ता या डेवलपर्स हो। इस challenge11 के परिणामों पर पूरी रिपोर्ट केवल यहाँ उल्लिखित है। शुरू करने के लिए, पहचान का एक प्रसार देखा गया था। यह मुख्य रूप से खोज इंजन में लागू तरीकों की विविधता के कारण के रूप में व्याख्या की गई थी, उनकी सेटिंग्स की, और आउटपुट को कैसे फ़िल्टर किया गया था, और पेप्टाइड “गिना” गया था। प्रयोगात्मक डिजाइन ने कुछ सॉफ़्टवेयर और दृष्टिकोणों को (dis) लाभ पर भी रखा हो सकता है। महत्वपूर्ण रूप से, एक ही सॉफ़्टवेयर का उपयोग करने वाले प्रतिभागियों ने असंगत परिणामों की सूचना दी, जिससे गंभीर पुनरुत्पादन के मुद्दों को उजागर किया गया। यह विभिन्न प्रस्तुतियों की तुलना करके निष्कर्ष निकाला गया था कि कुछ सॉफ़्टवेयर समाधान दूसरों की तुलना में बेहतर प्रदर्शन करते हैं और कुछ खोज रणनीतियां बेहतर परिणाम देती हैं। यह प्रतिक्रिया स्वचालित ग्लाइकोपेप्टाइड डेटा विश्लेषण विधियों के सुधार का मार्गदर्शन करने की संभावना है और बदले में, डेटाबेस सामग्री को प्रभावित करेगी।

ग्लाइकोइन्फॉर्मेटिक्स के विस्तार ने वेब पोर्टल बनाने के लिए नेतृत्व किया जो कई समान या पूरक संसाधनों तक जानकारी और पहुंच प्रदान करते हैं। सबसे हाल ही में और अप-टू-डेट को व्यापक ग्लाइकोसाइंस पुस्तक श्रृंखला 12 के एक अध्याय में वर्णित किया गया है और सहयोग के माध्यम से, डेटा साझा करने और सूचना आदान-प्रदान का समाधान एक खुली पहुंच मोड में पेश किया जाता है। ऐसा ही एक पोर्टल विकसित किया गया था जिसे मूल रूप से Glycomics@ExPASy 13 कहा जाता था और Glyco@Expasy नाम दिया गया था, एक्सपैसी प्लेटफॉर्म 14 के प्रमुख ओवरहाल के बाद, जिसने दशकों से कई -ओमिक्स में उपयोग किए जाने वाले उपकरणों और डेटाबेस के एक बड़े संग्रह की मेजबानी की है, सबसे लोकप्रिय आइटम UniProt15-सार्वभौमिक प्रोटीन नॉलेजबेस है। Glyco@Expasy एक दृश्य वर्गीकरण और उनके interdependences के प्रदर्शन के आधार पर डेटाबेस और उपकरणों के उद्देश्य और उपयोग की एक उपदेशात्मक खोज प्रदान करता है। निम्नलिखित प्रोटोकॉल इस पोर्टल से संसाधनों के चयन के साथ ग्लाइकोमिक्स और ग्लाइकोप्रोटिओमिक्स डेटा का पता लगाने के लिए प्रक्रियाओं को दर्शाता है जो ग्लाइकोप्रोटिओमिक्स और ग्लाइकन-इंटरैक्टोमिक्स के बीच संबंध को ग्लाइकोमिक्स के माध्यम से स्पष्ट करता है। जैसा कि यह है, ग्लाइकोमिक्स प्रयोग संरचनाओं का उत्पादन करते हैं जहां मोनोसेकेराइड पूरी तरह से परिभाषित होते हैं और लिंकेज आंशिक रूप से या पूरी तरह से निर्धारित होते हैं, लेकिन उनका प्रोटीन साइट लगाव खराब है, यदि बिल्कुल भी, विशेषता है। इसके विपरीत, ग्लाइकोप्रोटिओमिक्स प्रयोग सटीक साइट अनुलग्नक जानकारी उत्पन्न करते हैं, लेकिन ग्लाइकन संरचनाओं के खराब रिज़ॉल्यूशन के साथ, अक्सर मोनोसेकेराइड रचनाओं तक सीमित होते हैं। यह जानकारी GlyConnect डेटाबेस में एक साथ टुकड़ा है। इसके अलावा, GlyConnect में खोज उपकरण का उपयोग संभावित ग्लाइकन लिगेंड का पता लगाने के लिए किया जा सकता है जो UniLectin16 में उन्हें पहचानने वाले प्रोटीन के साथ वर्णित हैं, जो ग्लाइकन के माध्यम से GlyConnect से जुड़े हैं। यहां प्रस्तुत प्रोटोकॉल को एन-लिंक्ड और ओ-लिंक्ड ग्लाइकन और ग्लाइकोप्रोटीन के लिए विशिष्ट प्रश्नों को कवर करने के लिए दो वर्गों में विभाजित किया गया है।

Protocol

नोट:: एक इंटरनेट कनेक्शन (बड़ी स्क्रीन पसंदीदा) और Chrome या Firefox जैसे एक अप-टू-डेट वेब ब्राउज़र के साथ एक डिवाइस की आवश्यकता है। सफारी या एज का उपयोग करना उतना विश्वसनीय नहीं हो सकता है। 1. GlyConnect में ए…

Representative Results

प्रोटोकॉल (अनुभाग 1) के पहले भाग से पता चला है कि ग्लाइकनेक्ट प्लेटफ़ॉर्म का उपयोग करके मानव प्रोस्टेट विशिष्ट एंटीजन (पीएसए) के एएसएन -69 पर संलग्न एन-ग्लाइकन की विशिष्टता या समानता की जांच कैसे करें। ऊत?…

Discussion

GlyConnect ऑक्टोपस अप्रत्याशित सहसंबंधों को प्रकट करने के लिए एक उपकरण के रूप में
GlyConnect ऑक्टोपस मूल रूप से ग्लाइकन की एक ढीली परिभाषा के साथ डेटाबेस को क्वेरी करने के लिए डिज़ाइन किया गया था। दरअसल, साह?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

लेखक गर्मजोशी से इस ट्यूटोरियल में उपयोग किए जाने वाले संसाधनों को विकसित करने में शामिल प्रोटिओम इंफॉर्मेटिक्स ग्रुप के पिछले और वर्तमान सदस्यों को स्वीकार करता है, विशेष रूप से, ग्लाइकनेक्ट के लिए जूलियन मैरिथोज़ और कैथरीन हेस, यूनिलेक्टिन के लिए फ्रैंकोइस बोनार्डेल, डेविड अलोक्सी, और ऑक्टोपस के लिए फ्रेडरिक निकिटिन, और ऑक्टोपस पर कॉम्पोज़िटर और अंतिम स्पर्श के लिए थिबाल्ट रॉबिन।

glyco@Expasy परियोजना का विकास शिक्षा, अनुसंधान और नवाचार (SERI) के लिए राज्य सचिवालय के माध्यम से स्विस संघीय सरकार द्वारा समर्थित है और वर्तमान में स्विस नेशनल साइंस फाउंडेशन (SNSF: 31003A_179249) द्वारा पूरक है। ExPASy स्विस इंस्टीट्यूट ऑफ बायोइन्फॉर्मेटिक्स द्वारा बनाए रखा जाता है और वाइटल-आईटी योग्यता केंद्र में होस्ट किया जाता है। लेखक ने एएनआर पीआईए Glyco@Alps (एएनआर -15-आईडीईएक्स -02), एलायंस कैंपस रोडानियन को-फंड (http://campusrhodanien.unige-cofunds.ch) लैबेक्स आर्केन / सीबीएच-यूरो-जीएस (एएनआर -17-यूरो-0003) द्वारा संयुक्त रूप से समर्थित यूनिलेक्टिन प्लेटफॉर्म पर उत्कृष्ट सहयोग के लिए ऐनी इम्बर्टी को भी स्वीकार किया है।

Materials

internet connection user's choice
recent version of web browser user's choice

References

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/kr/63356?article_type=t

Play Video

Cite This Article
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video