gP2S क्रायोईएम प्रयोगों की ट्रैकिंग के लिए एक वेब एप्लिकेशन है। इसकी मुख्य विशेषताओं का वर्णन किया गया है, जैसा कि एप्लिकेशन को स्थापित करने और कॉन्फ़िगर करने के लिए आवश्यक कदम हैं। एक बार कॉन्फ़िगर किए जाने के बाद, एप्लिकेशन किसी को नकारात्मक दाग और क्रायोईएम प्रयोगों से जुड़े मेटाडेटा को सटीक रूप से रिकॉर्ड करने की अनुमति देता है।
क्रायोजेनिक इलेक्ट्रॉन माइक्रोस्कोपी (क्रायोईएम) कई दवा-खोज परियोजनाओं का एक अभिन्न हिस्सा बन गया है क्योंकि प्रोटीन लक्ष्य की क्रिस्टलोग्राफी हमेशा प्राप्त नहीं होती है और क्रायोईएम संरचना आधारित लिगांड डिजाइन का समर्थन करने के लिए एक वैकल्पिक साधन प्रदान करता है। बड़ी संख्या में अलग-अलग परियोजनाओं से निपटते समय, और प्रत्येक परियोजना के भीतर संभावित रूप से बड़ी संख्या में लिगांड-प्रोटीन सह-संरचनाएं, सटीक रिकॉर्ड रखते हुए तेजी से चुनौतीपूर्ण हो जाता है। नमूना तैयार करने, ग्रिड तैयार करने और माइक्रोस्कोपी चरणों सहित प्रत्येक लक्ष्य के लिए कई प्रयोगात्मक पैरामीटर देखते हैं। इसलिए, दीर्घकालिक प्रजनन क्षमता को सक्षम करने और कुशल टीम वर्क को सुविधाजनक बनाने के लिए सटीक रिकॉर्ड कीपिंग महत्वपूर्ण रूप से महत्वपूर्ण हो सकती है, खासकर जब विभिन्न ऑपरेटरों द्वारा क्रायोईएम वर्कफ्लो के कदम किए जाते हैं। इस चुनौती से निपटने में मदद करने के लिए, हमने क्रायोईएम के लिए एक वेब-आधारित सूचना प्रबंधन प्रणाली विकसित की, जिसे gP2S कहा जाता है।
आवेदन प्रत्येक प्रयोग का ट्रैक रखता है, नमूना से अंतिम परमाणु मॉडल के लिए, परियोजनाओं के संदर्भ में, जिनमें से एक सूची आवेदन में बनाए रखा है, या बाहरी रूप से एक अलग प्रणाली में । उपभोग्य सामग्री, उपकरण, प्रोटोकॉल और सॉफ्टवेयर की उपयोगकर्ता-परिभाषित नियंत्रित शब्दावली एक संरचित तरीके से क्रायोईएम वर्कफ्लो के प्रत्येक चरण का वर्णन करने में मदद करती है। gP2S व्यापक रूप से विन्यास योग्य है और, टीम की जरूरतों के आधार पर, एक स्टैंडअलोन उत्पाद के रूप में मौजूद हो सकता है या वैज्ञानिक अनुप्रयोगों के व्यापक पारिस्थितिकी तंत्र का हिस्सा हो सकता है, परियोजना प्रबंधन उपकरणों के साथ रेस्ट एपीआई के माध्यम से एकीकृत हो सकता है, प्रोटीन के उत्पादन या छोटे अणुओं लिगामेंट्स, या डेटा संग्रह और भंडारण को स्वचालित करने वाले अनुप्रयोगों के साथ एकीकृत हो सकता है। उपयोगकर्ता प्रत्येक ग्रिड और माइक्रोस्कोपी सत्र का विवरण दर्ज कर सकते हैं जिसमें प्रमुख प्रयोगात्मक मेटाडेटा और पैरामीटर मूल्य शामिल हैं, और प्रत्येक प्रयोगात्मक विरूपण साक्ष्य (नमूना, ग्रिड, माइक्रोस्कोपी सत्र, मानचित्र, आदि) की वंशावली दर्ज की गई है। gP2S एक क्रायोईएम प्रयोगात्मक कार्यप्रवाह आयोजक के रूप में कार्य करता है जो टीमों के लिए सटीक रिकॉर्ड रखने में सक्षम बनाता है, और एक ओपन-सोर्स लाइसेंस के तहत उपलब्ध है।
क्रायोईएम सुविधाओं पर सूचना प्रबंधन
2014 में शुरू लगभग, क्रायोजेनिक इलेक्ट्रॉन माइक्रोस्कोपी (क्रायोईएम)1 सुविधाओं की संख्या विस्फोटक रूप से बढ़ी है, जिसमें दुनिया भर में कम से कम 300 उच्च अंत प्रणालियां स्थापित की गईहैं,जिनमें दवा कंपनियों में एक संख्या शामिल है, जो दवा खोज 3 में क्रायोम के लिए बढ़ती भूमिका कोदर्शातीहै। इन सुविधाओं के मिशन, और डेटा ट्रैकिंग और प्रबंधन के लिए उनकी आवश्यकताओं4अलग है । कुछ, उदाहरण के लिए राष्ट्रीय क्रायोईएम केंद्रों पर ईएम ग्रिड प्राप्त करने, डेटासेट एकत्र करने और संरचना निर्धारण के लिए उपयोगकर्ताओं को डेटा लौटाने, शायद कुछ स्वचालित छवि प्रसंस्करण के बाद आरोप लगाया जाता है। ऐसी सुविधाओं में, ग्रिड के उद्गम पर नज़र रखने, एक उपयोगकर्ता प्रस्ताव या अनुदान के साथ अपने सहयोग, और ग्रिड से डेटासेट के लिए वंश महत्वपूर्ण है, लेकिन इस तरह के प्रोटीन नमूना या अंतिम संरचना निर्धारण प्रक्रिया के शुद्धिकरण की विधि के रूप में अंय कारकों, कम कर रहे हैं, या बिल्कुल नहीं, प्रासंगिक । स्थानीय अकादमिक सुविधाओं जैसी अन्य सुविधाओं में, प्रत्येक अंतिम उपयोगकर्ता अपने स्वयं के नमूने और ग्रिड तैयार करने, माइक्रोस्कोपी का संचालन करने, कच्चे डेटा और इसके प्रसंस्करण का प्रबंधन करने और परिणामों को प्रकाशित करने के लिए जिम्मेदार है। ऐसी सुविधा की ओर से मेटाडेटा ट्रैकिंग की कोई सख्त आवश्यकता नहीं है क्योंकि यह भूमिका अंतिम उपयोगकर्ता या उनके प्रमुख अन्वेषक द्वारा पूरी की जाती है।
हमारी क्रायोईएम सुविधा में, नमूनों, ग्रिड, डेटा संग्रह और प्रसंस्करण प्रोटोकॉल, और परिणामों (नक्शे, मॉडल) की हैंडलिंग और अनुकूलन चिकित्सकों के एक छोटे समूह पर कई परियोजनाओं में केंद्रीकृत है। यह प्रायोगिक (मेटा) डेटा प्रबंधन में चुनौतियां प्रस्तुत करता है। संरचनाओं के प्रयोगात्मक वंश, परमाणु मॉडल से सभी तरह वापस प्रोटीन और ligands की सटीक पहचान के लिए, ग्रिड तैयारी मापदंडों और डेटा संग्रह प्रोटोकॉल के माध्यम से, सही कब्जा कर लिया और संरक्षित किया जाना चाहिए । इन मेटाडेटा को कई मानव ऑपरेटरों को उपलब्ध कराया जाना चाहिए । उदाहरण के लिए, छवि प्रसंस्करण करने वाले व्यक्ति को यह जानने की आवश्यकता हो सकती है कि प्रोटीन का निर्माण किस प्रकार किया गया था और इमेजिंग पैरामीटर क्या थे, भले ही उन्होंने न तो प्रोटीन को शुद्ध किया और न ही क्रायोम डेटा एकत्र किया; स्वचालित डेटा प्रबंधन डेमंस जैसे सूचना प्रणालियों को उस परियोजना की पहचान करने की आवश्यकता है जिसके लिए एक माइक्रोस्कोप वर्तमान में निर्देशिका नामों को सही ढंग से और व्यवस्थित रूप से आवंटित करने के लिए डेटा एकत्र कर रहा है।
क्रायोईएम सुविधाओं का समर्थन करने के लिए कई सूचना प्रबंधन प्रणालियां उपलब्ध हैं। शायद उनमें से सबसे पूरा EMEN25है, जो एक इलेक्ट्रॉनिक लैब नोटबुक, एक सूचना प्रबंधन प्रणाली, और एक व्यापार प्रक्रिया प्रबंधन उपकरण के कुछ तत्वों की सुविधाओं को जोड़ती है । क्रिस्टलोग्राफी के लिए एक्स-रे बीमलाइन का समर्थन करने के लिए मूल रूप से निर्मित कई सिंक्रोट्रॉन, आईएसपीबी6में उपयोग किया जाता है, अब क्रायोम डेटा संग्रह का भी समर्थन करता है। स्किपियन7 इमेज प्रोसेसिंग पैकेज के चारों ओर एक समृद्ध और शक्तिशाली रैपर है, जो उपयोगकर्ताओं को छवि प्रसंस्करण कार्यप्रवाह रिकॉर्ड करने और उन्हें साझा करने की अनुमति देता है, उदाहरण के लिए सार्वजनिक भंडार EMPIAR8, 9के माध्यम से, और ऑन-द-फ्लाई क्रायोईएम डेटा प्रोसेसिंग को सक्षम करने के लिए आईएसपीबी के साथ भी एकीकृत किया गया है।
यहां हम gP2S (Genentech प्रोटीन से संरचना के लिए) का वर्णन करते हैं, एक आधुनिक और हल्के क्रायोम सूचना प्रबंधन प्रणाली जो शुद्ध प्रोटीन और छोटे अणु लिगामेंट से अंतिम परमाणु मॉडल के माध्यम से कार्यप्रवाह का समर्थन करने के लिए बनाई गई है।
gP2S का अवलोकन
gP2S एक उपयोगकर्ता के अनुकूल वेब-आधारित क्रायोम सूचना प्रबंधन प्रणाली है जो क्रायोईएम प्रयोगशालाओं और बहु-उपयोगकर्ता, बहु-परियोजना सुविधाओं के लिए सटीक रिकॉर्ड रखने की सुविधा प्रदान करती है। निम्नलिखित संस्थाओं, उनके संबंधों और संबद्ध मेटाडेटा को ट्रैक किया जाता है: परियोजनाएं, उपकरण, उपभोग्य सामग्री, प्रोटोकॉल, नमूने, ग्रिड, माइक्रोस्कोपी सत्र, छवि प्रसंस्करण सत्र, नक्शे और परमाणु मॉडल। उपयोगकर्ता वैकल्पिक रूप से फ़ाइल अटैचमेंट सहित मुफ्त-टेक्स्ट टिप्पणियां भी जोड़ सकते हैं, जिससे gP2S में पंजीकृत किसी भी इकाई के समृद्ध एनोटेशन की अनुमति मिल सकती है। फ्रंट-एंड को टचस्क्रीन उपकरणों के साथ उपयोग की सुविधा प्रदान करने के लिए डिज़ाइन किया गया है और 12.9 “आईपैड पेशेवरों पर बड़े पैमाने पर परीक्षण किया गया है, जिससे नमूने और ग्रिड(चित्रा 1)तैयार करते समय प्रयोगशाला बेंच पर gP2S का उपयोग करना संभव हो गया है, साथ ही माइक्रोस्कोप, प्रसंस्करण छवियों या जमा मॉडलों को संचालित करते समय कंप्यूटर पर भी। फ्रंट एंड में प्रत्येक पृष्ठ का उद्देश्य संभव होने पर समझदार डिफ़ॉल्ट मूल्यों के लिए मापदंडों को पूर्व-सेट करके मैनुअल डेटा प्रविष्टि को कम करना है।
GP2S के बैकएंड में कई रेस्ट एपीआई (आरईपीरेमेंटल स्टेट ट्रांसफर एप्लीकेशन प्रोग्रामिंग इंटरफ़ेस) एंडपॉइंट्स हैं, जिससे मौजूदा वर्कफ्लो और स्क्रिप्ट में gP2S को एकीकृत करना संभव हो जाता है। डेटा मॉडल को नकारात्मक दाग और क्रायोम वर्कफ्लो के सटीक कैप्चर की अनुमति देने के लिए डिज़ाइन किया गया था, जिसमें ब्रांचिंग शामिल है, उदाहरण के लिए कई ग्रिडों पर उपयोग किए जाने वाले एक नमूने के साथ, कई माइक्रोस्कोपी सत्रों से डेटा को एक ही डेटा प्रोसेसिंग सत्र में मिलाया जा रहा है, या एक डेटा प्रोसेसिंग सत्र कई नक्शे उपज।
सिस्टम आर्किटेक्चर
gP2S एक क्लासिक तीन स्तरीय आवेदन(चित्रा 2)है । इस मॉड्यूलर वास्तुकला में, सिस्टम को तीन अलग-अलग परतों में तोड़ दिया गया है, प्रत्येक अलग-अलग कर्तव्यों के निर्वहन के लिए जिम्मेदार है, और प्रत्येक दूसरों से स्वतंत्र रूप से बदली या संशोधित है। (1) प्रस्तुति परत (या फ्रंटएंड) वेब ब्राउज़र (क्रोम और सफारी के साथ बड़े पैमाने पर परीक्षण) के माध्यम से उपयोगकर्ता का उपयोग प्रदान करती है, वर्कफ़्लो तत्वों (डेटा सत्यापन सहित) बनाने और संशोधित करने की अनुमति देती है, और प्रयोगात्मक डेटा को व्यक्तिगत संस्थाओं, परियोजना-आधारित सूचियों और पूर्ण कार्यप्रवाह रिपोर्ट के रूप में प्रदर्शित करती है। (2) सेवा परत (या बैकएंड) यूजर इंटरफेस और स्टोरेज सिस्टम के बीच एक मध्यस्थ परत के रूप में कार्य करती है – यह मुख्य व्यवसाय तर्क रखती है, फ्रंटएंड द्वारा उपयोग की जाने वाली सेवा एपीआई को उजागर करती है, उपयोगकर्ता प्रमाणीकरण के लिए डेटा स्टोरेज और एलडीएपी (लाइटवेट डायरेक्टरी एक्सेस प्रोटोकॉल) प्रणाली के साथ एकीकृत होती है, और बाहरी प्रणालियों के साथ अतिरिक्त एकीकरण का आधार प्रदान करती है। (3) दृढ़ता परत (डेटा एक्सेस) प्रायोगिक डेटा, उपयोगकर्ता टिप्पणियों और फ़ाइल अनुलग्नकों के भंडारण के लिए जिम्मेदार है।
प्रमुख प्रौद्योगिकियां और चौखटे
जीपी 2एस आवेदन के विकास, भवन और रखरखाव को सुगम बनाने के लिए परियोजना में कई प्रौद्योगिकियों और ढांचे का उपयोग किया गया था। सबसे महत्वपूर्ण हैं: Vue.js 2.4.210 फ्रंटएंड के लिए और स्प्रिंगबूट1.3 11 बैकएंड के लिए एम्बेडेड टॉमकैट 8 सर्वर के साथ। आवेदन MySQL 5.7 और मोंगोडीबी 4.0.6 डेटाबेस भंडारण के लिए और LDAP12 प्रमाणीकरण के लिए उपयोग करता है। डिफ़ॉल्ट रूप से, इन सभी घटक भागों को एक आवेदन के रूप में भेज दिया जाता है और तैनात किया जाता है।
कुल मिलाकर आवेदन प्रत्यक्ष या अप्रत्यक्ष रूप से सैकड़ों विभिन्न पुस्तकालयों का उपयोग करता है। सबसे प्रमुख तालिका 1में सूचीबद्ध हैं।
डेटा मॉडल
तीन प्रकार की संस्थाओं को जीपी 2एस डेटा मॉडल(चित्रा 3):प्रयोगों के दौरान एकत्र किए गए डेटा से संबंधित कार्यप्रवाह संस्थाओं (जैसे, नमूने या माइक्रोस्कोपी सत्र) में प्रतिष्ठित किया जा सकता है; उपकरण और प्रोटोकॉल संस्थाएं जो उन डेटा का वर्णन करती हैं जो सभी परियोजनाओं में आम हैं (उदाहरण के लिए, माइक्रोस्कोप या विट्रीफिकेशन प्रोटोकॉल); अन्य संस्थाएं जो सिस्टम में सहायक या तकनीकी भूमिकाएं निभाती हैं (उदाहरण के लिए, टिप्पणियां या डिफ़ॉल्ट मूल्य)।
वर्कफ़्लो डेटा ट्री की जड़ परियोजना इकाई है। प्रत्येक परियोजना में कई प्रोटीन और/या लिगांड होते हैं जो नमूना संस्थाओं को बनाने के लिए ब्लॉक बना रहे हैं । प्रत्येक नमूने का उपयोग कई ग्रिड बनाने के लिए किया जा सकता है जिसका उपयोग माइक्रोस्कोपी सत्र (एक ग्रिड प्रति माइक्रोस्कोपी सत्र) में किया जाता है। उत्तरार्द्ध को प्रोसेसिंग सत्रों को सौंपा जाता है जो एक या अधिक नक्शे प्राप्त कर सकते हैं। पेड़ में अंतिम इकाई परमाणु मॉडल है, जो एक या कई मानचित्रों का उपयोग करके बनाया गया है। परिणाम में हर कार्यप्रवाह से संबंधित इकाई, प्रोटीन से मॉडल के लिए, हमेशा अपने पूर्वजों के माध्यम से एक विशेष परियोजना के लिए बाध्य है । इस तरह के डिजाइन डेटा समुच्चय बनाता है जो या तो फ्रंटएंड मॉड्यूल द्वारा या एपीआई का उपयोग करके बाहरी प्रणालियों द्वारा संसाधित करना आसान है।
वर्कफ़्लो डेटा के अलावा ऐसी संस्थाएं हैं जो ग्रिड तैयार करते समय अपनाई जाने वाली प्रयोगों या प्रोटोकॉल में उपयोग किए जाने वाले उपकरणों का वर्णन करती हैं। इन संस्थाओं को परिभाषित करना ग्रिड, माइक्रोस्कोपी और प्रोसेसिंग सेशन जैसी प्रयोगात्मक कार्यप्रवाह संस्थाओं को बनाने के लिए एक शर्त है।
अंतिम प्रकार की डेटा इकाई, जिसे सामूहिक रूप से “अन्य” के नाम से जाना जाता है, का उपयोग तकनीकी उद्देश्यों (जैसे, फाइल अटैचमेंट या डिफ़ॉल्ट मूल्य) के लिए किया जाता है। इस श्रेणी में टिप्पणी संस्थाएं शामिल हैं जिन्हें किसी भी कार्यप्रवाह या उपकरण/प्रोटोकॉल संस्थाओं से जोड़ा जा सकता है।
सॉफ्टवेयर उपलब्धता
gP2S का ओपन-सोर्स संस्करण https://github.com/arohou/gP2S से अपाचे लाइसेंस संस्करण2.0 26के तहत उपलब्ध है। gP2S चलाने के लिए एक डॉकर छवि https://hub.docker.com/r/arohou/gp2s से उपलब्ध है। रोशे और जेनेटेक में जीपी2एस की एक बंद स्रोत शाखा निरंतर विकास के तहत है ।
gP2S आवेदन चल रहा है
gP2S चलाने के दो तरीके हैं: एक डॉकर कंटेनर के रूप में या स्टैंडअलोन जावा एप्लिकेशन के रूप में। इष्टतम विकल्प लक्ष्य तैनाती पर्यावरण पर निर्भर करेगा। उदाहरण के लिए, यदि उपयोगकर्ताओं की विशिष्ट आवश्यकताओं के अनुरूप कोड को अनुकूलित करने या बढ़ाने की क्षमता वांछित है, तो पूरे एप्लिकेशन को पहले फिर से बनाया जाना चाहिए। इस मामले में, स्टैंडअलोन एप्लिकेशन के रूप में gP2S चलाने की सिफारिश की जा सकती है।
डॉकर कंटेनर
GP2S एप्लिकेशन के साथ काम करना शुरू करने का सबसे आसान तरीका इसे डॉकर सेवा के रूप में चलाना है। इस उद्देश्य के लिए, एक समर्पित डॉकर छवि तैयार की गई है और डॉकर हब भंडार (“https://hub.docker.com/r/arohou/gp2s”) में प्रकाशित की गई है। gP2S छवि चलाना MySQL और मोंगोडीबी डेटाबेस तक पहुंच और एलडीएपी सर्वर पर निर्भर करता है। गैर-उत्पादन वातावरण के लिए, इन सभी निर्भरताओं को जीपी 2एस आवेदन के साथ बहु-कंटेनर डॉकर अनुप्रयोगों के रूप में चलाने की सिफारिश की जाती है। इस निर्बाध बनाने के लिए, एक डॉकर-कंपोज फ़ाइल (https://github.com/arohou/gP2S/blob/master/docker-compose.yml) जिसमें अंतिम वातावरण के सभी आवश्यक विन्यास शामिल हैं, तैयार किया गया है और gP2S GitHub भंडार (https://github.com/arohou/gP2S) में प्रदान किया गया है। निम्नलिखित डॉकर छवियां निर्भरता हैं: माईस्कल27,मोंगोड्ब28,अपाच29।
डिफ़ॉल्ट विन्यास में, सभी संग्रहीत डेटा, दोनों संस्थाओं और फ़ाइल अनुलग्नकों डॉकर कंटेनरों को हटाने पर हटा दिया जाएगा । डेटा को बनाए रखने के लिए, या तो डॉकर वॉल्यूम का उपयोग किया जाना चाहिए, या gP2S एप्लिकेशन को समर्पित डेटाबेस उदाहरणों (MySQL और मोंगोडीबी) से जोड़ा जाना चाहिए। अपाचेडीएस एलडीएपी सर्वर कंटेनर एक प्रीकॉन्फिगर एडमिन यूजर (पासवर्ड: सीक्रेट) के साथ आता है। इन साख का उपयोग डॉकर सेवा के रूप में चलाए जाने पर gP2S एप्लिकेशन में लॉग इन करने के लिए किया जाना चाहिए। उत्पादन वातावरण के लिए एक ही डॉकर-कंपोज फ़ाइल का उपयोग एक डॉकर झुंड कंटेनर आर्केस्ट्रा प्लेटफॉर्म के लिए सेवाओं के रूप में gP2S (और अन्य कंटेनरों यदि आवश्यक हो तो) तैनात करने के लिए किया जा सकता है।
एक डॉकर कंटेनर के रूप में gP2S चलाने की पूरी प्रक्रिया, उचित विन्यास के बारे में सभी विवरण सहित gP2S GitHub भंडार में वर्णित है और निम्नलिखित विषयों को शामिल किया गया है:
• सभी निर्भरताओं के साथ डॉकराइज्ड जीपी 2एस एप्लिकेशन चलाना।
• gP2S आवेदन, डेटाबेस और एलडीएपी तक पहुंचना।
• एक नए संस्करण के साथ gP2S सेवा को अपडेट करना।
• gP2S आवेदन को हटाना।
• डेटा हठ को कॉन्फ़िगर करना।
• समर्पित डेटाबेस या एलडीएपी सर्वर से डॉकराइज्ड जीपी 2एस एप्लिकेशन को जोड़ना।
• विन्यास विवरण
स्टैंडअलोन जावा आवेदन
gP2S एप्लिकेशन को चलाने के लिए एक और विकल्प एक स्व-निहित जावा पैकेज बनाना है। यदि डॉकर कंटेनर चलाना संभव नहीं है तो यह दृष्टिकोण अपनाया जाना चाहिए । जीपी 2एस एप्लिकेशन का निर्माण करने के लिए जावा डेवलपमेंट किट संस्करण 8 या उससे ऊपर स्थापित करने की आवश्यकता है। पूरी बिल्ड प्रक्रिया का प्रबंधन मावेन टूल द्वारा किया जाता है, जो गिटहब भंडार में कोडबेस में प्रदान किया जाता है। विन्यास का निर्माण पहले फ्रंटएंड भाग बनाने के लिए तैयार है, फिर इसे बैकएंड स्रोतों में कॉपी करें, और फिर इसे अंतिम आवेदन के रूप में बनाएं। इस तरह, पूरी तरह से कार्य करने वाले gP2S पैकेज तैयार करने के लिए किसी अन्य उपकरण या पुस्तकालयों को स्थापित करने की कोई आवश्यकता नहीं है। डिफ़ॉल्ट रूप से, निर्माण का परिणाम एक जार पैकेज (स्थानीय रूप से संग्रहीत) और डॉकर छवि (मावेन पोम.xml फ़ाइल में विन्यास भंडार में धकेल दिया गया है)। यह याद रखना महत्वपूर्ण है कि पैकेज बनाने से पहले बाहरी सिस्टम (डेटाबेस और एलडीएपी सर्वर) से कनेक्ट करने के लिए आवश्यक जानकारी एक उचित विन्यास फ़ाइल में प्रदान की जानी चाहिए।
एक बार gP2S जार पैकेज बनाया गया है, इसमें आवेदन चलाने के लिए आवश्यक सभी निर्भरताएं और विन्यास जानकारी शामिल है, जिसमें टॉमकैट एप्लिकेशन सर्वर शामिल है जो सिस्टम को होस्ट करता है। यदि पैकेज कई विन्यास फ़ाइलों के साथ बनाया गया था तो इसे पुनर्निर्माण के बिना विभिन्न मोड में चलाया जा सकता है।
gP2S गिटहब भंडार में स्टैंडअलोन एप्लिकेशन के रूप में जीपी 2एस के निर्माण और संचालन की प्रक्रिया का पूरा विवरण शामिल है और इसमें निम्नलिखित विषयों को शामिल किया गया है:
• मावेन टूल का उपयोग करके gP2S का निर्माण
• एम्बेडेड डेटाबेस के साथ बिल्डिंग और रनिंग
• डॉकर कंटेनर के रूप में तैनात निर्भरताओं के साथ भवन और संचालन
• निर्माण और समर्पित डेटाबेस के साथ चल रहा है
• कॉन्फ़िगरिंग प्रमाणीकरण
जब ठीक से और लगातार इस्तेमाल किया जाता है, तो gP2S संरचित डेटा मॉडल और परिभाषित शब्दावली का उपयोग करके महत्वपूर्ण प्रयोगात्मक मेटाडेटा की रिकॉर्डिंग को लागू करके उच्च गुणवत्ता वाले मेटाडेटा को उचित रिकॉर्ड रखने में मदद करता है, लेकिन प्रयोगशाला में उच्च स्तर के अनुपालन को प्राप्त होने पर इसका अतिरिक्त मूल्य केवल पूरी तरह से महसूस किया जाता है। उपरोक्त प्रोटोकॉल में इसे कैसे प्राप्त किया जाए, इसे शामिल नहीं किया गया है। हमने पाया कि एक प्रभावी प्रवर्तन तकनीक के लिए माइक्रोस्कोप ऑपरेटरों को gP2S में पंजीकृत नहीं ग्रिड पर डेटा इकट्ठा करने से इनकार किया गया था । यह बहुत जल्दी अनुपालन दिया और उद्भव के लिए जमीन रखी, अगले महीनों में, विस्तृत और सटीक प्रयोगात्मक विवरण और कॉर्पोरेट स्मृति के एक बड़े शरीर की । उपयोग के कुछ महीनों के बाद, gP2S में संग्रहीत मेटाडेटा के कॉर्पस का मूल्य अधिकांश उपयोगकर्ताओं के लिए इतना स्पष्ट हो गया कि अनुपालन स्पष्ट हस्तक्षेप के बिना उच्च बना रहा।
पूरी तरह से इस सामूहिक स्मृति का लाभ उठाने के लिए आवश्यक है कि gP2S में संग्रहीत मेटाडेटा बाहरी प्रणालियों के लिए सुलभ हो और आसानी से प्रयोगात्मक डेटा (माइक्रोग्राफ) और परिणाम (नक्शे और मॉडल) के साथ जुड़ा हुआ है । उपरोक्त प्रोटोकॉल में अन्य सूचना और डेटा प्रसंस्करण प्रणालियों के साथ gP2S को एकीकृत करने का वर्णन नहीं है। सबसे सीधा gP2S के बैकएंड रेस्ट एपीआई के माध्यम से संभावित एकीकरण हैं, जिन्हें gP2S के किसी भी संशोधन की आवश्यकता नहीं है। उदाहरण के लिए, हमारे डेटा संग्रह डिटेक्टरों को नियंत्रित करने वाला प्रत्येक कंप्यूटर एक स्क्रिप्ट चलाता है जो समय-समय पर माइक्रोस्कोपी सत्र प्रबंधन रेस्ट कंट्रोलर के तहत gP2S के अंतिम बिंदु “getItemByMicroscope” प्रश्न करता है, यह जांचने के लिए कि क्या माइक्रोस्कोपी सत्र अपने माइक्रोस्कोप पर चल रहा है। यदि हां, तो स्क्रिप्ट GP2S से उपयुक्त डेटा स्टोरेज निर्देशिका नाम (जैसा कि सेटिंग पेज में कॉन्फ़िगर किया गया है, ऊपर देखें), और इस नाम का उपयोग करके स्थानीय डेटा स्टोरेज डिवाइस पर एक निर्देशिका बनाता है। यह डेटा स्टोरेज निर्देशिका का व्यवस्थित नामकरण सुनिश्चित करता है और टाइपो के कारण त्रुटि के जोखिम को कम करता है।
यद्यपि उन्हें gP2S के सार्वजनिक संस्करण के स्रोत में टिप्पणी की गई है, लेकिन gP2S उपभोक्ता बाहरी सिस्टम के डेटा को शामिल करते हुए आगे एकीकरण भी संभव है। हमारी प्रयोगशाला में, gP2S की हमारी तैनाती (i) एक परियोजना प्रबंधन प्रणाली के साथ एकीकृत करती है, ताकि gP2S में कॉन्फ़िगर की गई प्रत्येक परियोजना को कंपनी-व्यापी पोर्टफोलियो परियोजना से जोड़ा जा सके, और पोर्टफोलियो से मेटाडेटा को gP2S के भीतर प्रदर्शित किया जा सकता है; (ii) एक प्रोटीन पंजीकरण प्रणाली, ताकि gP2S में जोड़े गए प्रत्येक प्रोटीन को स्थानीय रूप से संग्रहीत एक पहचानकर्ता के माध्यम से प्रोटीन के उद्गम का ब्यौरा देने वाले अभिलेखों के एक पूर्ण सेट से जोड़ा जाए, जिसमें प्रासंगिक आणविक जीव विज्ञान, अभिव्यक्ति प्रणाली और शुद्धि का विवरण शामिल है; (iii) एक छोटा सा अणु यौगिक प्रबंधन प्रणाली, जिससे gP2S को प्रत्येक लिगामेंट के बारे में महत्वपूर्ण जानकारी प्रदर्शित करने की अनुमति मिलती है, जैसे कि इसकी रासायनिक संरचना । इन एकीकरणों को सक्षम करने के लिए आवश्यक कोड संशोधनों को gP2S भंडार (https://github.com/arohou/gP2S) से उपलब्ध README-BUILD.md दस्तावेज़ के “एकीकरण” अनुभाग में वर्णित किया गया है।
GP2S के वर्तमान संस्करण की सीमाएं हैं, जिनमें से पहले पीढ़ी सरलीकृत डेटा मॉडल और संरचना (मॉडल) जमाव के लिए फ्रंटएंड है। यह जानबूझकर gP2S के जारी संस्करण में एक “barebones” राज्य में छोड़ दिया गया था क्योंकि एक पूरी तरह से विकसित संरचना जमाव और सत्यापन सुविधा वर्तमान में एक्स-रे क्रिस्टलोग्राफी के लिए समर्थन के साथ एक साथ विकास के तहत है । एक और डिजाइन निर्णय किसी भी विशेषाधिकार या अनुमति प्रणाली को लागू नहीं करना था: gP2S में सभी उपयोगकर्ताओं को इसकी सुविधाओं और डेटा तक समान पहुंच है। यह उन सुविधाओं के लिए एक खराब विकल्प बना सकता है जो प्रतिस्पर्धी हितों और गोपनीयता आवश्यकताओं के साथ उपयोगकर्ता समूहों की सेवा करते हैं, लेकिन हमारी सुविधा के लिए चिंता का विषय नहीं था।
gP2S के हमारे इन-हाउस संस्करण का विकास चल रहा है और यह हमारी आशा है कि यहां वर्णित ओपन-सोर्स संस्करण अन्य क्रायोईएम समूहों के लिए उपयोगी होगा, और कुछ भविष्य में सुझाव, या कोड सुधार में योगदान दे सकते हैं। भविष्य के उच्च मूल्य के विकास उदाहरण के लिए प्रयोगशाला उपकरणों (vitrification रोबोट, इलेक्ट्रॉन माइक्रोस्कोप), सॉफ्टवेयर (जैसे फसल छवि प्रसंस्करण मेटाडेटा) और बाहरी सार्वजनिक भंडार (उदाहरण के लिए संरचना जमा की सुविधा के लिए) के साथ एकीकरण पर ध्यान केंद्रित कर सकते हैं ।
प्रयोगशाला और क्रायोईएम सुविधा में gP2S के नियमित उपयोग से सक्षम उच्च गुणवत्ता वाले मेटाडेटा के व्यवस्थित संग्रह का वर्षों की अवधि में समानांतर रूप से कई परियोजनाओं पर मुकदमा चलाने की क्षमता पर एक महत्वपूर्ण, सकारात्मक प्रभाव पड़ सकता है। चूंकि अधिक से अधिक साझा और केंद्रीकृत क्रायोईएम समूह और सुविधाएं स्थापित की जाती हैं, हम आशा करते हैं कि gP2S जैसे सूचना प्रबंधन प्रणालियों की आवश्यकता बढ़ती रहेगी।
The authors have nothing to disclose.
लेखक gP2S विकास टीम के अन्य सभी सदस्यों को धन्यवाद देते हैं जिन्होंने अपनी स्थापना के बाद से इस परियोजना पर काम किया है: राफेल उडज़िएला, सेज़री Krzyżanowski, प्रज़ेमाइस्वा स्टैनकोवस्की, जेसेक ज़िमस्की, पिओटर सुचिकी, कारोलिना Pająk, इवआउट वंडेडेन एडेन, डैमियन मिर्ज़िन्स्की, मिचेल वोजटकोवस्की, पिओटर पिकुसा, अन्ना सुरदाका, कामिल लसुज़क और आर्टुर कुसक। हम टीम को इकट्ठा करने और परियोजना को आकार देने में मदद करने के लिए रेमंड हा और क्लाउडियो सिफेरी को भी धन्यवाद देते हैं।