बायोमेडिकल रिपोर्ट में वर्णित माइटोकॉन्ड्रियल प्रोटीन और कार्डियोवैस्कुलर बीमारी के साथ उनके संबंधों की जांच के लिए एक कम्प्यूटेशनल प्रोटोकॉल, केसओलैप लिफ्ट और एक उपयोग मामला प्रस्तुत किया जाता है। इस प्रोटोकॉल को उपयोगकर्ता द्वारा चयनित सेलुलर घटकों और रोगों का अध्ययन करने के लिए आसानी से अनुकूलित किया जा सकता है।
बायोमेडिकल रिपोर्ट की तेजी से बढ़ती और विशाल मात्रा, प्रत्येक में कई संस्थाएं और समृद्ध जानकारी होती है, बायोमेडिकल टेक्स्ट-माइनिंग अनुप्रयोगों के लिए एक समृद्ध संसाधन का प्रतिनिधित्व करती है। ये उपकरण जांचकर्ताओं को रोग विकृति और चिकित्सीय में नई अंतर्दृष्टि को उजागर करने के लिए इन खोजों को एकीकृत, अवधारणा और अनुवाद करने में सक्षम बनाते हैं। इस प्रोटोकॉल में, हम टेक्स्ट डेटासेट (जैसे, बायोमेडिकल साहित्य) से उपयोगकर्ता-चयनित जानकारी निकालकर सेलुलर घटकों और उनके रोग संघों की जांच करने के लिए एक नई कम्प्यूटेशनल पाइपलाइन, केसओलैप लिफ्ट प्रस्तुत करते हैं। सॉफ्टवेयर रोग-प्रासंगिक दस्तावेजों के भीतर उप-सेलुलर प्रोटीन और उनके कार्यात्मक भागीदारों की पहचान करता है। सॉफ्टवेयर के लेबल लांछन विधि के माध्यम से अतिरिक्त रोग-प्रासंगिक दस्तावेजों की पहचान की जाती है। परिणामी प्रोटीन-रोग संघों को प्रासंगिक बनाने और कई प्रासंगिक बायोमेडिकल संसाधनों से जानकारी को एकीकृत करने के लिए, आगे के विश्लेषण के लिए स्वचालित रूप से एक ज्ञान ग्राफ का निर्माण किया जाता है। हम इस पद्धति का उपयोग करके अलग-अलग कार्डियोवैस्कुलर रोग फेनोटाइप्स में माइटोकॉन्ड्रियल प्रोटीन की भूमिका को स्पष्ट करने का एक उदाहरण प्रदान करने के लिए ऑनलाइन डाउनलोड किए गए ~ 34 मिलियन पाठ दस्तावेजों के संग्रह के साथ एक उपयोग मामला प्रस्तुत करते हैं। इसके अलावा, प्रोटीन और बीमारी के बीच पहले से रिपोर्ट नहीं किए गए संबंधों की भविष्यवाणी करने के लिए परिणामी ज्ञान ग्राफ पर एक गहन शिक्षण मॉडल लागू किया गया था, जिसके परिणामस्वरूप अनुमानित संभावनाओं >0.90 और परीक्षण सेट पर 0.91 के रिसीवर ऑपरेटिंग विशेषता वक्र (एयूआरओसी) के तहत एक क्षेत्र के साथ 1,583 संबंध थे। इस सॉफ्टवेयर में विश्लेषण के लिए उपलब्ध कच्चे डेटा के व्यापक दायरे के साथ एक अत्यधिक अनुकूलन योग्य और स्वचालित वर्कफ़्लो है; इसलिए, इस पद्धति का उपयोग करके, प्रोटीन-रोग संघों को एक टेक्स्ट कॉर्पस के भीतर बढ़ी हुई विश्वसनीयता के साथ पहचाना जा सकता है।
रोग से संबंधित प्रोटीन का अध्ययन रोगजनन के वैज्ञानिक ज्ञान को बढ़ाता है और संभावित चिकित्सीय की पहचान करने में मदद करता है। बायोमेडिकल प्रकाशनों के कई बड़े पाठ निगम, जैसे कि PubMed के 34 मिलियन लेख जिनमें प्रकाशन शीर्षक, सार और पूर्ण-पाठ दस्तावेज शामिल हैं, नए निष्कर्षों की रिपोर्ट करते हैं जो प्रोटीन को बीमारियों से जोड़ते हैं। हालांकि, ये निष्कर्ष विभिन्न स्रोतों में खंडित हैं और नई बायोमेडिकल अंतर्दृष्टि उत्पन्न करने के लिए एकीकृत किया जाना चाहिए। प्रोटीन-रोग संघों 1,2,3,4,5,6,7 को एकीकृत करने के लिए कई जैव चिकित्सा संसाधन मौजूद हैं। हालांकि, ये क्यूरेटेड संसाधन अक्सर अधूरे होते हैं और नवीनतम शोध निष्कर्षों को शामिल नहीं कर सकते हैं। बड़े टेक्स्ट कॉर्पोरेट में प्रोटीन-रोग संघों को निकालने और संश्लेषित करने के लिए टेक्स्ट-माइनिंग दृष्टिकोण आवश्यक हैं, जिसके परिणामस्वरूप वैज्ञानिक साहित्य में इन बायोमेडिकल अवधारणाओं की अधिक व्यापक समझ होगी।
प्रोटीन-रोग संबंधों 8,9,10,11,12,13,14 को उजागर करने के लिए कई बायोमेडिकल टेक्स्ट-माइनिंग दृष्टिकोण मौजूद हैं, और अन्य पाठ 13,15,16,17 में उल्लिखित प्रोटीन, बीमारियों या अन्य बायोमेडिकल संस्थाओं की पहचान करकेइन संबंधों को निर्धारित करने में योगदान करते हैं। 18,19. हालांकि, इनमें से कई उपकरणों में सबसे अद्यतित साहित्य तक पहुंच की कमी है, कुछ के अपवाद के साथ जो समय-समय परअपडेट किए जाते हैं 8,11,13,15। इसी तरह, कई उपकरणों में भी अध्ययन का सीमित दायरा होता है, क्योंकि वे व्यापक पूर्वनिर्धारित बीमारियों या प्रोटीन 9,13 तक ही सीमित होते हैं। पाठ के भीतर झूठी सकारात्मकता की पहचान के लिए कई दृष्टिकोण भी प्रवण हैं; दूसरों ने इन मुद्दों को प्रोटीन नामों की एक व्याख्यायोग्य और वैश्विक ब्लैकलिस्ट 9,11 या उससे कम व्याख्या योग्य नाम इकाई पहचान तकनीक 15,20 के साथ संबोधित किया है। जबकि अधिकांश संसाधन केवल पूर्व-गणना किए गए परिणाम प्रस्तुत करते हैं, कुछ उपकरण वेब ऐप्स या सुलभ सॉफ़्टवेयर कोड 8,9,11 के माध्यम से अन्तरक्रियाशीलता प्रदान करते हैं।
उपरोक्त सीमाओं को संबोधित करने के लिए, हम निम्नलिखित प्रोटोकॉल, केसओएलएपी को लेबल लांछन और पूर्ण पाठ (CaseOLAP LIFT) के साथ प्रस्तुत करते हैं, जो प्रोटीन (जैसे, सेलुलर घटक से जुड़े प्रोटीन) और पाठ डेटासेट से बीमारियों के बीच संबंधों की जांच करने के लिए एक लचीला और अनुकूलन योग्य मंच है। इस प्लेटफ़ॉर्म में जीन ऑन्कोलॉजी (जीओ) शब्द-विशिष्ट प्रोटीन (जैसे, ऑर्गेनेल-विशिष्ट प्रोटीन), लापता दस्तावेज़ विषय लेबल के लांछन, पूर्ण-पाठ दस्तावेजों के विश्लेषण, साथ ही विश्लेषण उपकरण और भविष्य कहनेवाला उपकरण (चित्रा 1, चित्रा 2, और तालिका 1) के स्वचालित क्यूरेशन शामिल हैं। CaseOLAP लिफ्ट उपयोगकर्ता द्वारा प्रदान किए गए जीओ शब्दों (जैसे, ऑर्गेनेल कम्पार्टमेंट) और कार्यात्मक रूप से संबंधित प्रोटीन का उपयोग करके स्ट्रिंग21, रिएक्टोम 22, और जीआरएनडीबी23 का उपयोग करके ऑर्गेनेल-विशिष्ट प्रोटीन को क्यूरेट करता है। रोग-अध्ययन दस्तावेजों की पहचान उनके PubMed-एनोटेटेड मेडिकल सब्जेक्ट हेडर (MeSH) लेबल द्वारा की जाती है। ~ 15.1% अनलेबल दस्तावेजों के लिए, लेबल को आरोपित किया जाता है यदि शीर्षक में कम से कम एक एमईएसएच शब्द पर्यायवाची पाया जाता है या सार में कम से कम दो पाए जाते हैं। यह पहले से अवर्गीकृत प्रकाशनों को पाठ-खनन विश्लेषण में विचार करने में सक्षम बनाता है। CaseOLAP LIFT उपयोगकर्ता को एक निर्दिष्ट समय सीमा (जैसे, 2012-2022) के भीतर प्रकाशनों के अनुभागों (जैसे, केवल शीर्षक और सार, पूर्ण पाठ, या विधियों को छोड़कर पूर्ण पाठ) का चयन करने की अनुमति देता है। सॉफ्टवेयर प्रोटीन नामों के उपयोग के मामले-विशिष्ट ब्लैकलिस्ट को अर्ध-स्वचालित रूप से क्यूरेट करता है, जो अन्य दृष्टिकोणों में मौजूद गलत-सकारात्मक प्रोटीन-रोग संघों को महत्वपूर्ण रूप से कम करता है। कुल मिलाकर, ये सुधार अधिक अनुकूलन और स्वचालन को सक्षम करते हैं, विश्लेषण के लिए उपलब्ध डेटा की मात्रा का विस्तार करते हैं, और बड़े बायोमेडिकल टेक्स्ट कॉर्पोरेट से अधिक आत्मविश्वास प्रोटीन-रोग संघ उत्पन्न करते हैं।
केसओलैप लिफ्ट बायोमेडिकल ज्ञान को शामिल करता है और एक ज्ञान ग्राफ का उपयोग करके विभिन्न बायोमेडिकल अवधारणाओं के संबंध का प्रतिनिधित्व करता है, जिसका उपयोग ग्राफ में छिपे हुए संबंधों की भविष्यवाणी करने के लिए किया जाता है। हाल ही में, ग्राफ-आधारित गणना विधियों को जैविक सेटिंग्स पर लागू किया गया है, जिसमें बायोमेडिकल अवधारणाओं 24,25 को एकीकृत और व्यवस्थित करना, दवा पुन: उपयोग और विकास 26,27,28, और प्रोटिओमिक्स डेटा 29 से नैदानिक निर्णय लेने के लिए शामिल हैं।
ज्ञान ग्राफ के निर्माण की सेटिंग में केसओलैप लिफ्ट की उपयोगिताओं को प्रदर्शित करने के लिए, हम माइटोकॉन्ड्रियल प्रोटीन और कार्डियोवैस्कुलर बीमारी की आठ श्रेणियों के बीच संबंधों की जांच पर एक उपयोग मामले को उजागर करते हैं। बीमारियों से जुड़े शीर्ष माइटोकॉन्ड्रियल प्रोटीन और मार्गों की पहचान करने के लिए ~ 362,000 रोग-प्रासंगिक दस्तावेजों के साक्ष्य का विश्लेषण किया गया था। इसके बाद, इन प्रोटीनों, उनके कार्यात्मक रूप से संबंधित प्रोटीन, और उनके पाठ-खनन परिणामों को एक ज्ञान ग्राफ में शामिल किया गया था। बायोमेडिकल प्रकाशनों के भीतर अब तक रिपोर्ट नहीं किए गए प्रोटीन-रोग संघों की भविष्यवाणी करने के लिए एक गहन सीखने-आधारित लिंक भविष्यवाणी विश्लेषण में इस ग्राफ का लाभ उठाया गया था।
परिचय अनुभाग हमारे प्रोटोकॉल की पृष्ठभूमि जानकारी और उद्देश्यों का वर्णन करता है। निम्न अनुभाग कम्प्यूटेशनल प्रोटोकॉल के चरणों का वर्णन करता है। इसके बाद, इस प्रोटोकॉल के प्रतिनिधि परिणाम वर्णित हैं। अंत में, हम संक्षेप में कम्प्यूटेशनल प्रोटोकॉल उपयोग मामलों, फायदे, कमियों और भविष्य के अनुप्रयोगों पर चर्चा करते हैं।
केसओलैप लिफ्ट शोधकर्ताओं को कार्यात्मक प्रोटीन (जैसे, सेलुलर घटक, जैविक प्रक्रिया, या आणविक कार्य से जुड़े प्रोटीन) और जैविक श्रेणियों (जैसे, बीमारियों) के बीच संबंधों की जांच करने का अधिकार देता है। वर्णित प्रोटोकॉल को निर्दिष्ट अनुक्रम में निष्पादित किया जाना चाहिए, प्रोटोकॉल अनुभाग 2 और प्रोटोकॉल अनुभाग 3 सबसे महत्वपूर्ण कदम हैं, क्योंकि प्रोटोकॉल अनुभाग 4 और प्रोटोकॉल अनुभाग 5 उनके परिणामों पर निर्भर करते हैं। प्रोटोकॉल अनुभाग 1 के विकल्प के रूप में, CaseOLAP लिफ्ट कोड को GitHub रिपॉजिटरी (https://github.com/CaseOLAP/caseolap_lift) से क्लोन और एक्सेस किया जा सकता है। यह ध्यान दिया जाना चाहिए कि सॉफ्टवेयर विकास के दौरान परीक्षण के बावजूद, बग हो सकते हैं। यदि हां, तो असफल कदम दोहराया जाना चाहिए। यदि समस्या बनी रहती है, तो यह सुनिश्चित करने के लिए प्रोटोकॉल अनुभाग 1 को दोहराने की सिफारिश की जाती है कि डॉकर कंटेनर के नवीनतम संस्करण का उपयोग किया जाता है। अतिरिक्त समर्थन के लिए GitHub रिपॉजिटरी पर एक समस्या बनाकर आगे की सहायता उपलब्ध है।
यह विधि जांचकर्ताओं को रुचि की संस्थाओं की पहचान करने और उनके बीच संभावित संबंधों को प्रकट करने में सक्षम करके परिकल्पना पीढ़ी का समर्थन करती है, जो मौजूदा जैव चिकित्सा संसाधनों में आसानी से सुलभ नहीं हो सकती है। परिणामी प्रोटीन-रोग संघ शोधकर्ताओं को स्कोर की व्याख्या योग्य मैट्रिक्स के माध्यम से नई अंतर्दृष्टि प्राप्त करने की अनुमति देते हैं: लोकप्रियता स्कोर एक बीमारी के संबंध में सबसे अधिक अध्ययन किए गए प्रोटीन का संकेत देते हैं, विशिष्टता स्कोर प्रोटीन के लिए सबसे अद्वितीय बीमारियों का संकेत देते हैं, और संयुक्त केसओएलएपी स्कोर दोनों का एक संयोजन है। झूठी-सकारात्मक पहचान (जैसे, होमोनिम्स के कारण) को रोकने के लिए, कुछ टेक्स्ट-माइनिंग टूल 9,11 से बचने के लिए शब्दों की ब्लैकलिस्ट का उपयोग करते हैं। इसी तरह, केसओलैप लिफ्ट भी एक ब्लैकलिस्ट का उपयोग करता है लेकिन उपयोगकर्ता को ब्लैकलिस्ट को उनके उपयोग के मामले में तैयार करने की अनुमति देता है। उदाहरण के लिए, कोरोनरी धमनी रोग (सीएडी) का अध्ययन करते समय, “सीएडी” को प्रोटीन “कैसपेज़-सक्रिय डीऑक्सीराइबोन्यूक्लिज़” का नाम नहीं माना जाना चाहिए। हालांकि, अन्य विषयों का अध्ययन करते समय, “सीएडी” आमतौर पर प्रोटीन का उल्लेख कर सकता है।
CaseOLAP लिफ्ट पाठ खनन के लिए उपलब्ध डेटा की मात्रा के अनुकूल है। तिथि सीमा कार्यक्षमता कम्प्यूटेशनल बोझ को कम करती है और परिकल्पना पीढ़ी के लिए लचीलापन पैदा करती है (उदाहरण के लिए, अध्ययन करना कि प्रोटीन-रोग संघ पर वैज्ञानिक ज्ञान समय के साथ कैसे बदल गया है)। इस बीच, लेबल लांछन और पूर्ण-पाठ घटक टेक्स्ट-माइनिंग के लिए उपलब्ध डेटा के दायरे को बढ़ाते हैं। कम्प्यूटेशनल लागत को कम करने के लिए दोनों घटक डिफ़ॉल्ट रूप से अक्षम हैं, लेकिन उपयोगकर्ता किसी भी घटक को शामिल करने का निर्णय ले सकता है। लेबल लांछन रूढ़िवादी है, और यह अधिकांश प्रकाशनों को सही ढंग से वर्गीकृत करता है (87% परिशुद्धता) लेकिन अन्य श्रेणी लेबल (2% रिकॉल) को याद करता है। यह विधि वर्तमान में एक नियम-आधारित अनुमानी पर निर्भर करती है जो रोग कीवर्ड से मेल खाती है, और दस्तावेज़ विषय मॉडलिंग तकनीकों के उपयोग के माध्यम से प्रदर्शन को बढ़ाने की योजना है। चूंकि कई अवर्गीकृत रिपोर्टें हाल के प्रकाशन होती हैं, इसलिए हाल की तिथि सीमा (जैसे, पिछले 3 वर्षों के भीतर सभी प्रकाशनों) की जांच करने वाले अध्ययनों को लेबल लांछन को अक्षम करके बेहतर सेवा दी जाती है। पूर्ण-पाठ घटक रनटाइम और संग्रहण आवश्यकताओं को बढ़ाता है। विशेष रूप से, केवल कुछ दस्तावेजों में पूर्ण पाठ उपलब्ध है (हमारे अध्ययन में दस्तावेजों का ~ 14%)। यह मानते हुए कि प्रकाशन ों के विधि अनुभाग में उल्लिखित प्रोटीन नामों के रोग विषयों से संबंधित होने की संभावना कम है, विधि अनुभाग को छोड़कर पूर्ण-पाठ लेखों को क्वेरी करने की सिफारिश की जाती है।
परिणामी प्रोटीन-रोग एसोसिएशन स्कोर पारंपरिक विश्लेषणों जैसे क्लस्टरिंग, आयामीता में कमी, या संवर्धन विश्लेषण (जैसे, जीओ, मार्ग) के लिए उपयोगी हैं, इस सॉफ्टवेयर पैकेज में शामिल कुछ कार्यान्वयन के साथ। मौजूदा बायोमेडिकल ज्ञान के भीतर इन स्कोर को प्रासंगिक बनाने के लिए, एक ज्ञान ग्राफ स्वचालित रूप से बनाया जाता है और ग्राफ विज़ुअलाइज़ेशन टूल (जैसे, नियो4जे32, साइटोस्केप33) का उपयोग करके पता लगाया जा सकता है। ज्ञान ग्राफ का उपयोग भविष्य कहनेवाला विश्लेषण (उदाहरण के लिए, असूचित प्रोटीन-रोग संबंधों की लिंक भविष्यवाणी, प्रोटीन नेटवर्क का सामुदायिक पता लगाने, पुरस्कार एकत्र करने वाले पथ-चलने के तरीके) के लिए भी किया जा सकता है।
हमने अनुमानित प्रोटीन-रोग संघों के लिए मॉडल मूल्यांकन मैट्रिक्स की जांच की है (तालिका 5)। मॉडल प्रत्येक प्रोटीन-रोग संघ को 0.0 और 1.0 के बीच एक संभाव्यता स्कोर प्रदान करता है, जिसमें 1.0 के करीब स्कोर भविष्यवाणी में उच्च स्तर के आत्मविश्वास का संकेत देता है। मॉडल प्रदर्शन का आंतरिक मूल्यांकन, जो AUROC, सटीकता, संतुलित सटीकता, विशिष्टता और याद करने सहित विभिन्न मैट्रिक्स पर आधारित था, ने अपने काम में उत्कृष्ट समग्र प्रदर्शन का संकेत दिया। हालांकि, मूल्यांकन ने मॉडल की सटीकता (0.15) के लिए एक खराब स्कोर पर भी प्रकाश डाला, जिसके परिणामस्वरूप कम एयूपीआरसी और एफ 1 स्कोर दोनों थे। इस मीट्रिक को बेहतर बनाने के लिए भविष्य के अध्ययन मॉडल के समग्र प्रदर्शन को बढ़ाने में मदद करेंगे। हम कल्पना करते हैं कि यह अधिक परिष्कृत ज्ञान ग्राफ एम्बेडिंग और ग्राफ भविष्यवाणी मॉडल को लागू करके प्राप्त किया जा सकता है। मॉडल की 0.15 की सटीकता के आधार पर, जांचकर्ताओं को लगभग 15% सकारात्मक पहचान की उम्मीद करनी चाहिए; विशेष रूप से, मॉडल द्वारा अनुमानित सभी 12,688 प्रोटीन-रोग संघों में से, लगभग 15% सच्चे-सकारात्मक संघ हैं। इसे केवल उच्च संभावना स्कोर (जैसे, >0.90) के साथ प्रोटीन-रोग संघों पर विचार करके कम किया जा सकता है; हमारे उपयोग के मामले में, 0.90 की संभावना सीमा के साथ फ़िल्टरिंग ने 1,583 संघों की उच्च-आत्मविश्वास भविष्यवाणियों को जन्म दिया। जांचकर्ताओं को उच्च वैधता सुनिश्चित करने के लिए इन भविष्यवाणियों का मैन्युअल रूप से निरीक्षण करने में भी मदद मिल सकती है (उदाहरण के लिए चित्रा 7 देखें)। हमारी भविष्यवाणियों के एक बाहरी मूल्यांकन ने निर्धारित किया कि एक व्यापक क्यूरेटेड डेटाबेस DisGeNet19 से 310 प्रोटीन-रोग संघों में से 103 की पहचान हमारे टेक्स्ट-माइनिंग अध्ययन में की गई थी, और 88 अतिरिक्त संघों की भविष्यवाणी हमारे ज्ञान ग्राफ विश्लेषण द्वारा संभाव्यता स्कोर >0.90 के साथ की गई थी।
कुल मिलाकर, केसओलैप लिफ्ट में कार्यात्मक प्रोटीन समूहों और बड़े टेक्स्ट कॉर्पोरेट में बीमारी की कई श्रेणियों के बीच संबंधों के कस्टम विश्लेषण को डिजाइन करने में बेहतर लचीलापन और प्रयोज्यता है। यह पैकेज एक नए उपयोगकर्ता के अनुकूल कमांड लाइन इंटरफ़ेस में सुव्यवस्थित है और एक डॉकर कंटेनर के रूप में जारी किया गया है, इस प्रकार प्रोग्रामिंग वातावरण और सॉफ़्टवेयर निर्भरताओं को कॉन्फ़िगर करने से जुड़े मुद्दों को कम करता है। कार्डियोवैस्कुलर बीमारियों में माइटोकॉन्ड्रियल प्रोटीन का अध्ययन करने के लिए केसओलैप लिफ्ट पाइपलाइन को आसानी से अनुकूलित किया जा सकता है; उदाहरण के लिए, इस तकनीक के भविष्य के अनुप्रयोगों में किसी भी जीओ शर्तों और किसी भी बायोमेडिकल श्रेणी से जुड़े किसी भी प्रोटीन के बीच संबंधों की जांच शामिल हो सकती है। इसके अलावा, इस टेक्स्ट-माइनिंग प्लेटफॉर्म द्वारा पहचाने गए रैंक किए गए प्रोटीन-रोग संघ उन्नत प्राकृतिक भाषा तकनीकों के उपयोग के लिए डेटासेट की तैयारी में महत्वपूर्ण हैं। परिणामी ज्ञान ग्राफ जांचकर्ताओं को इन निष्कर्षों को जैविक रूप से सूचनात्मक ज्ञान में परिवर्तित करने में सक्षम बनाता है और अनुवर्ती ग्राफ-आधारित विश्लेषण की नींव रखता है।
The authors have nothing to disclose.
इस कार्य को नेशनल इंस्टीट्यूट ऑफ हेल्थ (एनआईएच) आर 35 HL135772 पी.पी., एनआईएच टी32 HL13945 ए.आर.पी. और डी.एस., एनआईएच टी32 EB016640 ए.आर.पी., नेशनल साइंस फाउंडेशन रिसर्च ट्रेनीशिप (एनआरटी) 1829071 ए.आर.पी. और डी.एस., एनआईएच आर01 HL146739 से आई.ए., जे.आर., ए.वी., के.बी.