इस प्रोटोकॉल का लक्ष्य एक समूह है कि नामकरण और वर्गीकरण के लिए सुसंगत मानदंडों का अभाव में अलग प्रोटीन के लिए एक संदर्भ विकसित करना है । इस संदर्भ में एक पूरे के रूप में समूह के विश्लेषण और चर्चा की सुविधा होगी और स्थापित नामों के अलावा इस्तेमाल किया जा सकता है ।
अलग जीवों का उपयोग कर विभिन्न प्रयोगशालाओं में अध्ययन किया गया है कि संबंधित प्रोटीन नामकरण और वर्गीकरण की एक समान प्रणाली की कमी हो सकती है, यह मुश्किल एक पूरे के रूप में समूह पर चर्चा करने के लिए और उपयुक्त संदर्भ में नए दृश्यों जगह करने के लिए बना. संरचना और/या गतिविधि से संबंधित महत्वपूर्ण अनुक्रम सुविधाओं को प्राथमिकता देने वाले एक संदर्भ का विकास करने के लिए स्थापित नामों के अलावा इस्तेमाल किया जा सकता है प्रोटीन के एक विविध समूह के लिए कुछ अनुकूल जोड़ें । इस पेपर का उपयोग करता है cysteine-अल्फा स्थिर-कुंडलित (CS-αβ) superfamily एक उदाहरण के रूप में दिखाने के लिए कैसे एक स्प्रेडशीट सॉफ्टवेयर में उत्पंन संदर्भ superfamily में मौजूदा प्रोटीन के बीच संबंधों को स्पष्ट कर सकते हैं, साथ ही साथ नए के अलावा की सुविधा जुगाड़. यह भी दिखाता है कि कैसे संदर्भ सामांय रूप से इस्तेमाल किया सॉफ्टवेयर, जो वंशावली विश्लेषण की वैधता प्रभावों में उत्पंन अनुक्रम संरेखण को परिष्कृत करने में मदद कर सकते हैं । एक संदर्भ के उपयोग की संभावना प्रोटीन समूहों है कि taxa की एक व्यापक स्पेक्ट्रम से अत्यधिक अलग अनुक्रम शामिल हैं, सुविधाओं है कि पर्याप्त रूप से आणविक विश्लेषण द्वारा कब्जा नहीं कर रहे है के साथ के लिए सबसे उपयोगी होगा ।
एक प्रोटीन का नाम दर्शाना चाहिए विशेषताओं और अंय प्रोटीन के संबंध है । दुर्भाग्य से, नाम आम तौर पर खोज के समय में सौंपा जाता है और, के रूप में अनुसंधान जारी है, बड़े संदर्भ की समझ बदल सकते हैं । यह कई नामों के लिए नेतृत्व कर सकते हैं अगर एक प्रोटीन स्वतंत्र रूप से एक से अधिक प्रयोगशाला द्वारा पहचान की गई थी, नामकरण में या विशेषताओं में परिवर्तन करने के लिए निश्चित है जब नाम निर्दिष्ट करने के लिए सोचा, और नाम के लिए पर्याप्त प्रोटीन अंतर नहीं रह दूसरों से ।
Invertebrate defensins नामकरण और वर्गीकरण में अध-पतन का एक अच्छा उदाहरण प्रदान करते हैं । पहले invertebrate defensins कीड़ों से सूचित किया गया था, और नाम “कीट defensin” स्तनधारी defensins1,2के लिए कथित समरूपता के आधार पर प्रस्तावित किया गया था । शब्द defensin अभी भी प्रयोग किया जाता है, हालांकि अब यह स्पष्ट है कि invertebrate और स्तनधारी defensins एक आम पूर्वज3,4हिस्सा नहीं है । प्रजातियों के आधार पर, एक invertebrate “defensin” छह या आठ cysteines (है कि तीन या चार डाइसल्फ़ाइड बांड फार्म) और रोगाणुरोधी गतिविधियों की एक किस्म हो सकता है । इस स्थिति को जटिल करने के लिए, defensins के रूप में एक ही विशेषताओं के साथ प्रोटीन हमेशा “defensins,” जैसे कि हाल ही में पहचान cremycins से Caenorhabditis remanei5के रूप में नहीं कहा जाता है । इसके अलावा, invertebrate बड़े defensins हड्डीवाला β-defensins के लिए अन्य invertebrate defensins6से संबंधित evolutionarily होने की संभावना है । इस के बावजूद, शोधकर्ताओं ने कई बार नाम “defensin” जब निर्धारण जो जुगाड़ में विश्लेषण में शामिल किया जाना चाहिए पर भरोसा करते हैं ।
संरचनात्मक अध्ययन कीट defensins और बिच्छू विषाक्त पदार्थों के बीच समानता से पता चला7, और सीएस-αβ गुना बाद में कीट defensins की परिभाषित संरचनात्मक विशेषता के रूप में स्थापित किया गया था8. इस गुना बिच्छू विष की तरह (CS-αβ) superfamily प्रोटीन के संरचनात्मक वर्गीकरण में परिभाषित करता है (SCOP) डेटाबेस9, जो वर्तमान में पांच परिवारों में शामिल हैं: कीट defensins, लघु श्रृंखला बिच्छू विषाक्त पदार्थों, लंबी श्रृंखला बिच्छू विषाक्त पदार्थों, MGD-1 (एक मोलस्क से), और संयंत्र defensins । यह superfamily हाल ही में वर्णित सीआईएस-defensins4 और superfamily 3.30.30.10 में कैथ/जीन 3d डाटाबेस10,11के साथ पर्याय है । invertebrate taxa, पौधों की एक किस्म से अध्ययन, और कवक बताते है कि प्रोटीन है कि इस गुना शामिल के नाम स्पष्ट रूप से cysteine संख्या या बांडिंग पैटर्न, रोगाणुरोधी गतिविधि, या विकासवादी इतिहास से संबंधित नहीं है12।
निरंतरता और स्पष्ट मानदंडों का अभाव यह नाम और इस superfamily में नव पहचान दृश्यों वर्गीकृत करने के लिए चुनौतीपूर्ण बनाते हैं । इस superfamily में प्रोटीन की तुलना करने के लिए एक प्रमुख बाधा यह है कि cysteines प्रत्येक व्यक्ति अनुक्रम (प्रत्येक अनुक्रम में पहली cysteine C1 है) के संबंध में गिने जाते हैं, संरचनात्मक भूमिका के लिए खाते में कोई रास्ता नहीं है । इसका मतलब यह है कि केवल cysteines की संख्या के साथ दृश्यों की तुलना की जा सकती है । वहां थोड़ा अनुक्रम सीएस-αβ गुना है, जो बनाता है cysteines और वंशावली विश्लेषण मुश्किल के गठन के अलावा अंय संरक्षण है । एक नंबर प्रणाली है कि संरचनात्मक सुविधाओं को प्राथमिकता के विकास के द्वारा, superfamily दृश्यों और अधिक आसानी से की तुलना में और गठबंधन किया जा सकता है । संरक्षित सुविधाओं, साथ ही उन उपसमूह को परिभाषित करने, जल्दी से visualized किया जा सकता है, और नए दृश्यों और अधिक आसानी से उपयुक्त संदर्भ में रखा जा सकता है ।
यह काग़ज़ किसी स्प्रेडशीट सॉफ़्टवेयर (उदा., Excel) का उपयोग CS-αβ superfamily के लिए एक संदर्भ क्रमांकन सिस्टम जनरेट करने के लिए करता है । यह दिखाता है कि यह कैसे अनुक्रम के बीच तुलना स्पष्ट और नए सीएस-αβ tardigrades से पहचाना दृश्यों पर लागू होता है । एक उदाहरण के रूप में सीएस-αβ superfamily का उपयोग करना, प्रोटोकॉल जब ब्याज के अनुक्रम का उपयोग कर मार्गदर्शन प्रदान करने के लिए लिखा गया था; हालांकि, यह इस superfamily करने के लिए या cysteine-रिच अनुक्रम के लिए विशिष्ट होना करने के लिए लक्षित नहीं है । इस विधि की संभावना सबसे अधिक प्रोटीन है कि अलग taxa में स्वतंत्र रूप से शोध किया गया है के समूहों के लिए उपयोगी हो जाएगा और/या थोड़ा समग्र अनुक्रम समरूपता है, असतत विशेषताओं है कि आसानी से आणविक विश्लेषण सॉफ्टवेयर द्वारा मांयता प्राप्त नहीं हो सकता है के साथ । इस विधि में महत्वपूर्ण सुविधाओं के संबंध में कुछ एक प्राथमिकताओं निर्णय की आवश्यकता है, तो यह सीमित उपयोगिता का होगा यदि कोई महत्वपूर्ण सुविधाओं की पहचान की गई है । प्राथमिक लक्ष्य दिखाने के लिए कैसे अनुक्रम संबंधों का एक सरल दृश्य प्राप्त किया जा सकता है । यह तो अनुक्रम संरेखण और विश्लेषण को सूचित करने के लिए इस्तेमाल किया जा सकता है, लेकिन यदि संरेखण और विश्लेषण प्राथमिक लक्ष्य हैं, एक बारकोड विधि एक उपयुक्त विकल्प है कि13स्वचालन के लिए और अधिक क्षमता है होगा । वर्तमान विधि एक रैखिक रूप में प्रत्येक पेप्टाइड की सुविधाओं को प्रदर्शित करता है, तो यह 3d संरचना के प्रत्यक्ष दृश्य के लिए उपयोगी नहीं होगा.
1. ब्याज के प्रोटीन समूह की परिभाषित सुविधाओं को निर्धारित करें पिछले प्रकाशनों से परामर्श करने के लिए निर्धारित अगर वहां सुविधाओं है कि समूह का हिस्सा माना जा करने के लिए आवश्यक है के बारे में आ?…
एक समूह के भीतर एक प्रोटीन के नामकरण के लिए मानदंड स्पष्ट होना चाहिए, लेकिन यह हमेशा मामला नहीं है । अनुक्रम है कि सीएस-αβ गुना है कई प्रयोगशालाओं में अध्ययन किया गया है जीवों की एक किस्म का उपयोग, नामकरण ?…
The authors have nothing to disclose.
चल tardigrade रोगाणुरोधी पेप्टाइड अनुसंधान अनुसंधान और प्रायोजित कार्यक्रम (ORSP) के Midwestern विश्वविद्यालय कार्यालय से अंदर धन द्वारा समर्थित है । ORSP अध्ययन डिजाइन, डेटा संग्रह, विश्लेषण, व्याख्या, या पांडुलिपि तैयारी में कोई भूमिका नहीं थी ।
BLAST webpage | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
EditSeq (Lasergene suite) | DNASTAR | https://www.dnastar.com/t-allproducts.aspx | |
Excel 2013 | Microsoft | ||
FigTree | http://tree.bio.ed.ac.uk/software/figtree/ | ||
MEGA | www.megasoftware.net | ||
MrBayes | http://mrbayes.sourceforge.net/ | ||
SCOP database | http://scop.mrc-lmb.cam.ac.uk/scop/ |