يوضح هذا البروتوكول كيفية استكشاف ومقارنة وتفسير البروتين البشري glycome مع الموارد عبر الإنترنت.
تم إطلاق مبادرة Glyco@Expasy كمجموعة من قواعد البيانات والأدوات المترابطة التي تغطي عدة جوانب من المعرفة في علم الأحياء السكري. على وجه الخصوص ، يهدف إلى تسليط الضوء على التفاعلات بين البروتينات السكرية (مثل مستقبلات سطح الخلية) والبروتينات المرتبطة بالكربوهيدرات بوساطة الجلايكان. هنا ، يتم تقديم الموارد الرئيسية للمجموعة من خلال مثالين توضيحيين يتمركزان على N-glycome لمستضد البروستاتا البشري المحدد (PSA) و O-glycome لبروتينات المصل البشري. من خلال استعلامات قاعدة البيانات المختلفة وبمساعدة أدوات التصور ، توضح هذه المقالة كيفية استكشاف المحتوى ومقارنته في سلسلة متصلة لجمع وربط أجزاء المعلومات المتناثرة بخلاف ذلك. البيانات التي تم جمعها موجهة لتغذية سيناريوهات أكثر تفصيلا لوظيفة الجليكان. لذلك ، يتم اقتراح المعلوماتية الجليكونية المقدمة هنا كوسيلة إما لتعزيز أو تشكيل أو دحض الافتراضات حول خصوصية غليكوم البروتين في سياق معين.
الجليكان والبروتينات التي ترتبط بها (البروتينات السكرية) والبروتينات التي ترتبط بها (الليكتين أو البروتينات المرتبطة بالكربوهيدرات) هي الجهات الفاعلة الجزيئية الرئيسية على سطح الخلية1. على الرغم من هذا الدور المركزي في التواصل بين الخلايا الخلوية، إلا أن الدراسات واسعة النطاق، بما في ذلك الغليكوميكس، أو الجليكوبروتيوميك، أو بيانات الجليكوبروتينات البينية لا تزال نادرة مقارنة بنظيرتها في علم الجينوم والبروتيوميات.
حتى وقت قريب ، لم يتم تطوير طرق لتوصيف الهياكل المتفرعة للكربوهيدرات المعقدة بينما لا تزال مقترنة بالبروتين الناقل. التخليق الحيوي للبروتينات السكرية هو عملية غير مدفوعة بالقوالب يلعب فيها المتبرعون بالسكريات الأحادية ، وركائز البروتين السكري المقبولة ، والجليكوزيل ترانسفيراز والجليكوزيداز دورا تفاعليا. يمكن أن تحمل البروتينات السكرية الناتجة هياكل معقدة مع نقاط تفرع متعددة حيث يمكن أن يكون كل مكون من مكونات السكاريد الأحادي أحد الأنواع العديدة الموجودة في الطبيعة1. تفرض العملية غير القائمة على القوالب التحليل الكيميائي الحيوي كخيار وحيد لتوليد البيانات الهيكلية قليلة السكاريد. غالبا ما تكون العملية التحليلية لهياكل الجليكان المرتبطة بالبروتين الأصلي صعبة لأنها تتطلب تقنيات حساسة وكمية وقوية لتحديد تكوين السكاريد الأحادي والروابط والتسلسلات المتفرعة2.
في هذا السياق ، يعد قياس الطيف الكتلي (MS) هو التقنية الأكثر استخداما على نطاق واسع في تجارب glycomics و glycoproteomics. مع مرور الوقت ، يتم تنفيذ هذه في إعدادات إنتاجية أعلى وتتراكم البيانات الآن في قواعد البيانات. هياكل غليكان بتنسيقات مختلفة3 ، تملأ GlyTouCan4 ، مستودع بيانات غليكان العالمي حيث ترتبط كل بنية بمعرف مستقر بغض النظر عن مستوى الدقة الذي يتم به تعريف الجليكان (على سبيل المثال ، ربما نوع الارتباط المفقود أو التركيب الغامض). يتم جمع هياكل متشابهة جدا ولكن يتم الإبلاغ بوضوح عن اختلافاتها الطفيفة. يتم وصف البروتينات السكرية وتنسيقها في GlyConnect5 و GlyGen6 ، وهما قاعدتا بيانات مرجعيتان لبعضهما البعض. يتم تخزين بيانات MS التي تدعم الأجزاء الهيكلية من الأدلة بشكل متزايد في GlycoPOST7. وللحصول على تغطية أوسع للموارد على الإنترنت، فإن الفصل 52 من الدليل المرجعي، أساسيات علم الأحياء السكرية، مكرس للمعلوماتية السكرية8. ومن المثير للاهتمام ، أن برامج تحديد الجليكوببتيد قد انتشرت في السنوات الأخيرة9,10 ولكن ليس لصالح التكاثر. دفع القلق الأخير قادة مبادرة HUPO GlycoProteomics (HGI) إلى وضع تحد للبرمجيات في عام 2019. تم توفير بيانات MS التي تم الحصول عليها من معالجة المخاليط المعقدة من بروتينات المصل البشري N- و O-glycosylated في أوضاع تجزئة CID و ETD و EThcD للمنافسين سواء مستخدمي البرامج أو المطورين. ولا يرد هنا سوى التقرير الكامل عن نتائج هذا التحدي(11). بادئ ذي بدء ، لوحظ انتشار عمليات تحديد الهوية. تم تفسيره بشكل رئيسي على أنه ناجم عن تنوع الأساليب المنفذة في محركات البحث ، وإعداداتها ، وكيفية تصفية المخرجات ، و “حساب” الببتيد. قد يكون التصميم التجريبي قد وضع أيضا بعض البرامج والأساليب في ميزة (غير واضحة). والأهم من ذلك، أن المشاركين الذين يستخدمون نفس البرنامج أبلغوا عن نتائج غير متناسقة، مما يسلط الضوء على قضايا خطيرة تتعلق بقابلية التكرار. واختتم بمقارنة التقديمات المختلفة بأن بعض الحلول البرمجية تؤدي أداء أفضل من غيرها وأن بعض استراتيجيات البحث تسفر عن نتائج أفضل. ومن المرجح أن توجه هذه التغذية المرتدة تحسين أساليب تحليل بيانات غليكوببتيد الآلية، وستؤثر بدورها على محتوى قاعدة البيانات.
أدى التوسع في المعلوماتية السكرية إلى إنشاء بوابات ويب توفر المعلومات والوصول إلى العديد من الموارد المماثلة أو المكملة. ويرد وصف لأحدث وأحدث هذه الأحدث في فصل من سلسلة كتب علم الجليكوساينس الشاملة(12)، ومن خلال التعاون، يتم تقديم حل لتقاسم البيانات وتبادل المعلومات في وضع الوصول المفتوح. تم تطوير إحدى هذه البوابات التي كانت تسمى في الأصل Glycomics@ExPASy 13 وأعيدت تسميتها Glyco@Expasy ، بعد الإصلاح الرئيسي لمنصة Expasy 14 التي استضافت مجموعة كبيرة من الأدوات وقواعد البيانات المستخدمة عبر العديد من -omics لعقود ، العنصر الأكثر شعبية هو UniProt15 – قاعدة معارف البروتين العالمية. تقدم Glyco@Expasy اكتشافا تعليميا للغرض من قواعد البيانات والأدوات واستخدامها ، استنادا إلى تصنيف مرئي وعرض لأوجه ترابطها. يوضح البروتوكول التالي إجراءات استكشاف بيانات الجليكوميكس و glycoproteomics مع مجموعة مختارة من الموارد من هذه البوابة التي تجعل العلاقة بين glycoproteomics و glycan-interactomics واضحة عبر glycomics. كما هو الحال ، تنتج تجارب glycomics هياكل حيث يتم تعريف السكريات الأحادية بشكل كامل وتحديد الروابط جزئيا أو كليا ، ولكن ارتباطها بموقع البروتين يكون ضعيفا ، إن وجد. في المقابل ، تولد تجارب glycoproteomics معلومات دقيقة عن مرفق الموقع ولكن مع دقة ضعيفة لهياكل الجليكان ، وغالبا ما تقتصر على تركيبات السكاريد الأحادي. يتم تجميع هذه المعلومات معا في قاعدة بيانات GlyConnect. علاوة على ذلك ، يمكن استخدام أدوات البحث في GlyConnect للكشف عن روابط الجليكان المحتملة التي يتم وصفها جنبا إلى جنب مع البروتينات التي تتعرف عليها في UniLectin16 ، المرتبطة ب GlyConnect عبر glycans. ينقسم البروتوكول المعروض هنا إلى قسمين لتغطية الأسئلة الخاصة بالجليكان المرتبط ب N والمرتبط ب O والبروتينات السكرية.
GlyConnect الأخطبوط كأداة للكشف عن الارتباطات غير المتوقعة
تم تصميم GlyConnect Octopus في الأصل للاستعلام عن قاعدة البيانات مع تعريف فضفاض للجليكان. في الواقع ، غالبا ما تشير الأدبيات إلى الخصائص الرئيسية للجليكان في الغليكوم مثل كونها فوكوسيلات أو سياليل ، كونها مصنوعة من هوائين أو أكثر ، …
The authors have nothing to disclose.
يعترف المؤلف بحرارة بالأعضاء السابقين والحاليين في مجموعة Proteome Informatics Group المشاركين في تطوير الموارد المستخدمة في هذا البرنامج التعليمي ، وعلى وجه التحديد ، جوليان ماريثوز وكاثرين هايز ل GlyConnect ، وفرانسوا بونارديل ل UniLectin ، و Davide Alocci ، و Frederic Nikitin للأخطبوط ، و Thibault Robin ل Compozitor واللمسة الأخيرة على الأخطبوط.
وتدعم الحكومة الاتحادية السويسرية تطوير مشروع glyco@Expasy من خلال أمانة الدولة للتعليم والبحث والابتكار، وتكمله حاليا المؤسسة الوطنية السويسرية للعلوم (SNSF: 31003A_179249). يتم الحفاظ على ExPASy من قبل المعهد السويسري للمعلوماتية الحيوية واستضافته في مركز كفاءة تكنولوجيا المعلومات الحيوية. كما يعترف المؤلف بآن إمبرتي لتعاونها المتميز على منصة UniLectin المدعومة بشكل مشترك من قبل ANR PIA Glyco@Alps (ANR-15-IDEX-02) ، والصناديق المشتركة ل Alliance Campus Rhodanien (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003).
internet connection | user's choice | ||
recent version of web browser | user's choice |