Summary

Glikan Aracılı Protein Etkileşimlerinin İncelenmesi için Biyoinformatik Kaynakları

Published: January 20, 2022
doi:

Summary

Bu protokol, insan protein glislerinin çevrimiçi kaynaklarla nasıl keşfedileceğini, karşılaştırılacağını ve yorumlanacağını göstermektedir.

Abstract

Glyco@Expasy girişimi, glikobiyolojideki bilginin çeşitli yönlerini kapsayan birbirine bağlı veritabanları ve araçların bir koleksiyonu olarak başlatıldı. Özellikle, glikoproteinler (hücre yüzey reseptörleri gibi) ve glikanların aracılık ettiği karbonhidrat bağlayıcı proteinler arasındaki etkileşimleri vurgulamayı amaçlamaktadır. Burada, koleksiyonun ana kaynakları, insan Prostat Spesifik Antijeninin (PSA) N-glifili ve insan serum proteinlerinin O-glibrimi üzerine odaklanan iki açıklayıcı örnekle tanıtılmaktadır. Farklı veritabanı sorguları aracılığıyla ve görselleştirme araçlarının yardımıyla, bu makalede, dağınık bilgi parçalarını toplamak ve ilişkilendirmek için bir süreklilikteki içeriğin nasıl keşfedileceği ve karşılaştırılacağı gösterilmektedir. Toplanan veriler, glikan fonksiyonunun daha ayrıntılı senaryolarını beslemeye yöneliktir. Bu nedenle, burada tanıtılan glicoinformatikler, belirli bir bağlamda bir protein glibrifinin özgüllüğü hakkındaki varsayımları güçlendirmek, şekillendirmek veya çürütmek için bir araç olarak önerilmektedir.

Introduction

Glikanlar, bağlı oldukları proteinler (glikoproteinler) ve bağlandıkları proteinler (lektinler veya karbonhidrat bağlayıcı proteinler) hücre yüzeyindeki ana moleküler aktörlerdir1. Hücre-hücre iletişimindeki bu merkezi role rağmen, glikomik, glikoproteomik veya glikan-interaktomik veriler de dahil olmak üzere büyük ölçekli çalışmalar, genomik ve proteomikteki muadillerine kıyasla hala azdır.

Yakın zamana kadar, hala taşıyıcı proteine konjuge edilirken karmaşık karbonhidratların dallanma yapılarını karakterize etmek için yöntemler geliştirilmemişti. Glikoproteinlerin biyosentezi, monosakkarit donörlerinin, kabul eden glikoprotein substratlarının ve glikoziltransferazların ve glikozidazların etkileşimli bir rol oynadığı şablon güdümlü olmayan bir süreçtir. Ortaya çıkan glikoproteinler, her bir monosakkarit bileşeninin doğada bulunan çeşitli tiplerden biri olabileceği çoklu dallanma noktalarına sahip karmaşık yapılar taşıyabilir1. Şablon güdümlü olmayan süreç, oligosakkarit yapısal verileri üretmek için tek seçenek olarak biyokimyasal analizi empoze eder. Doğal bir proteine bağlı glikan yapılarının analitik süreci, monosakkarit bileşimini, bağlantılarını ve dallanma dizilerini2 belirlemek için hassas, kantitatif ve sağlam teknolojiler gerektirdiğinden genellikle zordur.

Bu bağlamda kütle spektrometresi (MS) glikomik ve glikoproteomik deneylerde en yaygın kullanılan tekniktir. Zaman geçtikçe, bunlar daha yüksek aktarım hızı ayarlarında gerçekleştirilir ve veriler artık veritabanlarında birikmektedir. Çeşitli formatlardaki glikan yapıları3, glikan’ın tanımlandığı hassasiyet düzeyine bakılmaksızın her yapının kararlı bir tanımlayıcı ile ilişkilendirildiği evrensel glikan veri deposu GlyTouCan4’ü doldurur (örneğin, muhtemelen eksik bağlantı tipi veya belirsiz bileşim). Çok benzer yapılar toplanmış, ancak küçük farklılıkları açıkça bildirilmiştir. Glikoproteinler, birbirine çapraz referans veren iki veritabanı olan GlyConnect5 ve GlyGen6’da tanımlanmakta ve küratörlüğünü yapmaktadır. Yapısal kanıt parçalarını destekleyen MS verileri, GlycoPOST7’de giderek daha fazla depolanmaktadır. Çevrimiçi kaynakların daha geniş bir kapsamı için, referans el kitabının 52. bölümü, Glikobiyolojinin Temelleri, glikoinformatik8’e adanmıştır. İlginçtir ki, glikopeptid tanımlama yazılımı son yıllarda çoğalmıştır9,10 ancak tekrarlanabilirliğin yararına değildir. İkinci endişe, HUPO GlycoProteomics Initiative’in (HGI) liderlerini 2019’da bir yazılım mücadelesi oluşturmaya itti. N- ve O-glikozile insan serum proteinlerinin karmaşık karışımlarının CID, ETD ve EThcD parçalanma modlarında işlenmesinden elde edilen MS verileri, yazılım kullanıcıları veya geliştiriciler olsun, rakiplerin kullanımına sunulmuştur. Bu meydan okumanın sonuçlarıyla ilgili raporun tamamı11 yalnızca burada özetlenmiştir. Başlangıç olarak, tanımlamaların yayılması gözlendi. Temel olarak, arama motorlarında uygulanan yöntemlerin, ayarlarının çeşitliliğinden ve çıktıların nasıl filtrelendiğinden ve peptidin “sayıldığından” kaynaklandığı şeklinde yorumlandı. Deneysel tasarım ayrıca bazı yazılım ve yaklaşımları bir dezavantaja (dezavantaj) koymuş olabilir. Daha da önemlisi, aynı yazılımı kullanan katılımcılar tutarsız sonuçlar bildirdiler ve böylece ciddi tekrarlanabilirlik sorunlarını vurguladılar. Farklı gönderimler karşılaştırılarak bazı yazılım çözümlerinin diğerlerinden daha iyi performans gösterdiği ve bazı arama stratejilerinin daha iyi sonuçlar verdiği sonucuna varılmıştır. Bu geri bildirimin otomatik glikopeptid veri analizi yöntemlerinin geliştirilmesine rehberlik etmesi ve dolayısıyla veritabanı içeriğini etkilemesi muhtemeldir.

Glikoinformatiğin genişlemesi, bilgi sağlayan ve birden fazla benzer veya tamamlayıcı kaynağa erişim sağlayan web portalları oluşturmaya yol açtı. En yeni ve güncel olanlar, Kapsamlı Glikobilim kitap serisinin bir bölümünde açıklanmıştır12 ve işbirliği yoluyla, açık erişim modunda veri paylaşımı ve bilgi alışverişine bir çözüm sunulmaktadır. Başlangıçta Glycomics@ExPASy 13 olarak adlandırılan ve Glyco@Expasy olarak yeniden adlandırılan böyle bir portal geliştirildi, Expasy platformunun14 büyük revizyonunu takiben, onlarca yıldır çeşitli -omiklerde kullanılan geniş bir araç ve veritabanı koleksiyonuna ev sahipliği yaptı, en popüler öğe UniProt15-evrensel protein bilgi bankası. Glyco@Expasy, görsel bir kategorizasyona ve karşılıklı bağımlılıklarının görüntülenmesine dayanarak, veritabanlarının ve araçların amacının ve kullanımının didaktik bir keşfini sunar. Aşağıdaki protokol, glikoproteomik ve glikan-interaktomik arasındaki bağlantıyı glikomikler yoluyla açıkça ortaya koyan bu portaldan bir dizi kaynakla glikomik ve glikoproteomik verileri keşfetme prosedürlerini göstermektedir. Olduğu gibi, glikomik deneyler, monosakaritlerin tam olarak tanımlandığı ve bağlantıların kısmen veya tamamen belirlendiği yapılar üretir, ancak protein bölgesi bağlanmaları, eğer varsa, zayıf bir şekilde karakterize edilir. Buna karşılık, glikoproteomik deneyler kesin bölge bağlanma bilgisi üretir, ancak genellikle monosakkarit bileşimleriyle sınırlı glikan yapılarının zayıf çözünürlüğü ile. Bu bilgiler GlyConnect veritabanında bir araya getirilir. Ayrıca, GlyConnect’teki arama araçları, glikanlar aracılığıyla GlyConnect’e bağlanan UniLectin16’da onları tanıyan proteinlerle birlikte tanımlanan potansiyel glikan ligandlarını tespit etmek için kullanılabilir. Burada sunulan protokol, N’ye bağlı ve O’ya bağlı glikanlara ve glikoproteinlere özgü soruları kapsayacak şekilde iki bölüme ayrılmıştır.

Protocol

NOT: İnternet bağlantısı olan bir cihaz (daha büyük ekran tercih edilir) ve Chrome veya Firefox gibi güncel bir Web tarayıcısı gereklidir. Safari veya Edge’i kullanmak o kadar güvenilir olmayabilir. 1. GlyConnect’teki bir protein N-glicome’den UniLectin’in bir lektinine Glyco@Expasy’dan kaynaklara erişmeNOT: Burada açıklanan prosedür GlyConnect’e erişmektir, ancak platformda kayıtlı herhangi bir kaynağa erişmek için uygulanab…

Representative Results

Protokolün ilk bölümü (bölüm 1), GlyConnect platformunu kullanarak insan Prostat Spesifik Antijeninin (PSA) Asn-69’una bağlı N-glikanların özgüllüğünün veya ortaklığının nasıl araştırılacağını gösterdi. Dokuya bağımlı (idrar ve seminal sıvı) ve glikan ekspresyonundaki izoforma bağımlı (normal ve yüksek pI) varyasyonlar, iki görselleştirme aracı kullanılarak vurgulanmıştır (Şekil 4 ve Şekil 5). <p …

Discussion

Beklenmedik korelasyonları ortaya çıkarmak için bir araç olarak GlyConnect Octopus
GlyConnect Octopus başlangıçta veritabanını gevşek bir glikan tanımıyla sorgulamak için tasarlanmıştır. Gerçekten de, literatür genellikle glikanların fukozile edilmiş veya sialile edilmiş, iki veya daha fazla antenden yapılmış olması gibi bir glifardaki temel özelliklerini bildirmektedir. Ayrıca, N- veya O-bağlantılı glikanlar, yayınlanmış makalelerde de sıklıkla atıfta bulunulan Gl…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Yazar, bu eğitimde kullanılan kaynakların geliştirilmesinde yer alan Proteome Bilişim Grubu’nun geçmiş ve şimdiki üyelerini, özellikle GlyConnect için Julien Mariethoz ve Catherine Hayes, UniLectin için François Bonnardel, Ahtapot için Davide Alocci ve Frederic Nikitin ve Compozitor için Thibault Robin ve Ahtapot’a son dokunuşu sıcak bir şekilde kabul ediyor.

glyco@Expasy projesinin geliştirilmesi, İsviçre Federal Hükümeti tarafından Eğitim, Araştırma ve İnovasyon Devlet Sekreterliği (SERI) aracılığıyla desteklenmektedir ve şu anda İsviçre Ulusal Bilim Vakfı (SNSF: 31003A_179249) tarafından tamamlanmaktadır. ExPASy, İsviçre Biyoinformatik Enstitüsü tarafından sürdürülmekte ve Vital-IT Yetkinlik Merkezi’nde barındırılmaktadır. Yazar ayrıca Anne Imberty’ye ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003) tarafından ortaklaşa desteklenen UniLectin platformunda olağanüstü işbirliği için teşekkür ediyor.

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video