Bioengineering

ऊतक इंजीनियरिंग में मध्यम आकार, कम वेग, बहुआयामी डेटा का कुशलतापूर्वक प्रबंधन करने के लिए डेटाबेस

Published: November 22, 2019 doi: 10.3791/60038

Alexander R. Ochs^1,2, Mehrsa Mehrabi^1,2, Danielle Becker^1,2, Mira N. Asad^1,2, Jing Zhao^1,2, Michael V. Zaragoza^3,4, Anna Grosberg^1,2,5,6,7

¹Department of Biomedical Engineering, University of California, Irvine, ²The Edwards Lifesciences Center for Advanced Cardiovascular Technology, University of California, Irvine, ³Pediatrics-Genetics & Genomics Division-School of Medicine, University of California, Irvine, ⁴Biological Chemistry-School of Medicine, University of California, Irvine, ⁵Department of Chemical and Biomolecular Engineering, University of California, Irvine, ⁶Center for Complex Biological Systems, University of California, Irvine, ⁷The NSF-Simons Center for Multiscale Cell Fate Research (CMCF), University of California, Irvine

Summary

कई शोधकर्ता "मध्यम आकार", कम वेग और बहु-आयामी डेटा उत्पन्न करते हैं, जिन्हें स्प्रेडशीट के बजाय डेटाबेस के साथ अधिक कुशलता से प्रबंधित किया जा सकता है। यहां हम बहु-आयामी डेटा की कल्पना करने, संबंधपरक डेटाबेस संरचनाओं में तालिकाओं को जोड़ने, अर्ध-स्वचालित डेटा पाइपलाइनों का मानचित्रण करने और डेटा अर्थ को स्पष्ट करने के लिए डेटाबेस का उपयोग करने सहित डेटाबेस का वैचारिक अवलोकन प्रदान करते हैं।

Abstract

विज्ञान प्रगति के लिए तेजी से जटिल डेटा सेट पर निर्भर करता है, लेकिन स्प्रेडशीट कार्यक्रमों जैसे आम डेटा प्रबंधन विधियां बढ़ते पैमाने और इस जानकारी की जटिलता के लिए अपर्याप्त हैं। जबकि डेटाबेस प्रबंधन प्रणालियों में इन मुद्दों को सुधारने की क्षमता है, वे आमतौर पर व्यापार और सूचना के क्षेत्रों के बाहर उपयोग नहीं किए जाते हैं। फिर भी, कई शोध प्रयोगशालाएं पहले से ही "मध्यम आकार", कम वेग, बहु-आयामी डेटा उत्पन्न करती हैं जो समान प्रणालियों को लागू करने से बहुत लाभान्वित हो सकती हैं। इस लेख में, हम एक वैचारिक अवलोकन प्रदान करते हैं जिसमें यह समझाया गया है कि डेटाबेस कैसे कार्य करते हैं और ऊतक इंजीनियरिंग अनुप्रयोगों में वे क्या फायदे प्रदान करते हैं। एक विशिष्ट प्रयोगात्मक संदर्भ में उदाहरणों को समझाने के लिए लैमिन ए/सी उत्परिवर्तन वाले व्यक्तियों से संरचनात्मक फाइब्रोब्लास्ट डेटा का उपयोग किया गया था । उदाहरणों में बहुआयामी डेटा की कल्पना करना, रिलेशनल डेटाबेस संरचना में तालिकाओं को जोड़ना, कच्चे डेटा को संरचित प्रारूपों में बदलने के लिए अर्ध-स्वचालित डेटा पाइपलाइन का मानचित्रण करना और क्वेरी के अंतर्निहित वाक्यकर को समझाना शामिल है। डेटा का विश्लेषण करने से परिणाम विभिन्न व्यवस्थाओं और महत्व के भूखंडों को बनाने के लिए इस्तेमाल किया गया था हचिनसन-गिलफोर्ड प्रोजेरिया, एक प्रसिद्ध लैमिनोपैथी, और अन्य सभी प्रयोगात्मक समूहों के सकारात्मक नियंत्रण के बीच गठबंधन वातावरण में सेल संगठन में प्रदर्शन किया गया था। स्प्रेडशीट की तुलना में, डेटाबेस विधियां अत्यधिक समय कुशल थीं, एक बार स्थापित होने के बाद उपयोग करने के लिए सरल थीं, मूल फ़ाइल स्थानों की तत्काल पहुंच और डेटा कठोरता में वृद्धि के लिए अनुमति दी गई थीं। प्रायोगिक कठोरता पर राष्ट्रीय स्वास्थ्य संस्थानों (NIH) के जोर के जवाब में, यह संभावना है कि कई वैज्ञानिक क्षेत्रों अंततः जटिल डेटा को प्रभावी ढंग से व्यवस्थित करने के लिए अपनी मजबूत क्षमता के कारण आम अभ्यास के रूप में डेटाबेस को अपनाना होगा ।

Introduction

एक ऐसे युग में जहां वैज्ञानिक प्रगति प्रौद्योगिकी द्वारा भारी है, बड़ी मात्रा में डेटा को संभालना सभी विषयों में अनुसंधान का एक अभिन्न पहलू बन गया है । कम्प्यूटेशनल बायोलॉजी और जीनोमिक्स जैसे नए क्षेत्रों का उद्भव यह रेखांकित करता है कि प्रौद्योगिकी का सक्रिय उपयोग कितना महत्वपूर्ण हो गया है । मूर के कानून और तकनीकी प्रगति^1,²से प्राप्त स्थिर प्रगति के कारण ये रुझान जारी रहना निश्चित है । हालांकि, एक परिणाम उत्पन्न डेटा की बढ़ती मात्रा है जो पहले व्यवहार्य संगठन विधियों की क्षमताओं से अधिक है। यद्यपि अधिकांश अकादमिक प्रयोगशालाओं में जटिल डेटा सेट ों को संभालने के लिए पर्याप्त कम्प्यूटेशनल संसाधन होते हैं, लेकिन कई समूहों के पास आवश्यकताओं के विकास के लिए अनुकूल कस्टम सिस्टम के निर्माण के लिए आवश्यक तकनीकी विशेषज्ञता की कमी होती है^3। इस तरह के डेटा सेट का प्रबंधन और अद्यतन करने का कौशल होना कुशल कार्यप्रवाह और आउटपुट के लिए महत्वपूर्ण बना हुआ है। डेटा और विशेषज्ञता के बीच अंतर को पाटना कुशलतापूर्वक हैंडलिंग, फिर से अपडेट करने और बहुआयामी डेटा के व्यापक स्पेक्ट्रम का विश्लेषण करने के लिए महत्वपूर्ण है।

बड़े डेटा सेट को संभालते समय स्केलेबिलिटी एक आवश्यक विचार है। उदाहरण के लिए, बिग डेटा अनुसंधान का एक समृद्ध क्षेत्र है जिसमें भारी मात्रा, बड़ी विषमता और पीढ़ी की उच्च दरों जैसे ऑडियो और वीडियो^4,⁵की विशेषता वाले डेटा प्रसंस्करण से नई अंतर्दृष्टि का खुलासा करना शामिल है। संगठन और विश्लेषण के स्वचालित तरीकों का उपयोग करना इस क्षेत्र के लिए डेटा के टोरेंट को उचित रूप से संभालने के लिए अनिवार्य है। बड़े डेटा में उपयोग किए जाने वाले कई तकनीकी शब्दों को स्पष्ट रूप से परिभाषित नहीं किया गया है, हालांकि, और भ्रामक हो सकते हैं; उदाहरण के लिए, "उच्च वेग" डेटा अक्सर प्रति दिन लाखों नई प्रविष्टियों से जुड़ा होता है जबकि "कम वेग" डेटा केवल प्रति दिन सैकड़ों प्रविष्टियां हो सकती हैं, जैसे कि अकादमिक प्रयोगशाला सेटिंग में। हालांकि वहां कई रोमांचक निष्कर्ष अभी तक बड़े डेटा का उपयोग कर की खोज की है, ज्यादातर अकादमिक प्रयोगशालाओं गुंजाइश, शक्ति की आवश्यकता नहीं है, और अपने स्वयं के वैज्ञानिक सवालों को संबोधित करने के लिए इस तरह के तरीकों की जटिलता⁵। हालांकि यह संदेह नहीं है कि वैज्ञानिक डेटा⁶समय के साथ तेजी से जटिल बढ़ता है, कई वैज्ञानिकों को संगठन के तरीकों का उपयोग करना जारी है कि अब उनके विस्तार डेटा की जरूरत को पूरा । उदाहरण के लिए, सुविधाजनक स्प्रेडशीट कार्यक्रमों का उपयोग अक्सर वैज्ञानिक डेटा को व्यवस्थित करने के लिए किया जाता है, लेकिन लंबे समय तक^7,⁸में अस्केलेबल, त्रुटि प्रवण और समय अक्षम होने की कीमत पर। इसके विपरीत, डेटाबेस समस्या का एक प्रभावी समाधान है क्योंकि वे स्केलेबल, अपेक्षाकृत सस्ते और चल रही परियोजनाओं के विभिन्न डेटा सेटों को संभालने में उपयोग करने में आसान हैं।

डेटा संगठन के स्कीमों पर विचार करते समय उत्पन्न होने वाली तत्काल चिंताएं प्रशिक्षण और उपयोग के लिए लागत, पहुंच और समय निवेश हैं। अक्सर व्यापार सेटिंग्स में इस्तेमाल किया, डेटाबेस कार्यक्रम अधिक किफायती हैं, या तो अपेक्षाकृत सस्ती या मुक्त किया जा रहा है, बड़े डेटा सिस्टम के उपयोग का समर्थन करने के लिए आवश्यक धन से । वास्तव में, वाणिज्यिक रूप से उपलब्ध और ओपन सोर्स सॉफ्टवेयर दोनों की एक किस्म ओरेकल डेटाबेस, माईक्यूएल और माइक्रोसॉफ्ट (एमएस) एक्सेस⁹जैसे डेटाबेस बनाने और बनाए रखने के लिए मौजूद है। कई शोधकर्ताओं को भी जानने के लिए प्रोत्साहित किया जाएगा कि कई एमएस कार्यालय अकादमिक संकुल एमएस का उपयोग के साथ आते हैं, आगे लागत विचार ों को कम । इसके अलावा, लगभग सभी डेवलपर्स ऑनलाइन व्यापक दस्तावेज प्रदान करते हैं और शोधकर्ताओं को संरचित क्वेरी भाषा (एसक्यूएल)^10,^11,¹²को समझने और उपयोग करने में मदद करने के लिए कोदशकी, W3Schools और SQLBolt जैसे मुफ्त ऑनलाइन संसाधनों की अधिकता है। किसी भी प्रोग्रामिंग भाषा की तरह, एसक्यूएल का उपयोग करके डेटाबेस और कोड का उपयोग करने का तरीका सीखना मास्टर करने में समय लगता है, लेकिन पर्याप्त संसाधनों के साथ प्रक्रिया सरल और निवेश किए गए प्रयास के लायक है।

डेटाबेस डेटा पहुंच और एकत्रीकरण में आसानी बढ़ाने के लिए शक्तिशाली उपकरण हो सकते हैं, लेकिन यह समझना महत्वपूर्ण है कि कौन से डेटा को संगठन के अधिक नियंत्रण से सबसे अधिक लाभ होगा। बहु-आयामीता उन स्थितियों की संख्या को संदर्भित करती है जिनके खिलाफ माप को समूहीकृत किया जा सकता है, और कई अलग-अलग स्थितियों का प्रबंधन करते समय डेटाबेस सबसे शक्तिशाली होते^हैं। इसके विपरीत, स्प्रेडशीट कार्यक्रम का उपयोग करके कम आयामीता के साथ जानकारी सबसे सरल है; उदाहरण के लिए, वर्षों से युक्त डेटा सेट और प्रत्येक वर्ष के लिए मूल्य में केवल एक संभव समूह (वर्षों के विरुद्ध माप)। नैदानिक सेटिंग्स जैसे उच्च आयामी डेटा को प्रभावी ढंग से बनाए रखने के लिए मैनुअल संगठन की एक बड़ी डिग्री की आवश्यकता होगी, स्प्रेडशीट^{कार्यक्रमों 13}के दायरे से परे एक थकाऊ और त्रुटि-प्रवण प्रक्रिया। गैर-संबंधपरक (NoSQL) डेटाबेस भी मुख्य रूप से उन अनुप्रयोगों में विभिन्न भूमिकाओं को पूरा करते हैं जहां डेटा पंक्तियों और कॉलम¹⁴में अच्छी तरह से व्यवस्थित नहीं होता है। अक्सर खुले स्रोत होने के अलावा, इन संगठनात्मक स्कीमों में ग्राफिकल संघ, समय श्रृंखला डेटा या दस्तावेज़-आधारित डेटा शामिल हैं। NoSQL SQL से बेहतर स्केलेबिलिटी में उत्कृष्टता प्राप्त करता है, लेकिन जटिल प्रश्न नहीं बना सकता है, इसलिए संबंधपरक डेटाबेस उन स्थितियों में बेहतर होते हैं जिन्हें स्थिरता, मानकीकरण और निराला बड़े पैमाने पर डेटा परिवर्तन की आवश्यकता होती है^15। डेटाबेस प्रभावी ढंग से समूहीकृत करने और डेटा को फिर से अपडेट करने में सबसे अच्छे हैं , जो अक्सर वैज्ञानिक सेटिंग्स¹³^,¹⁶में आवश्यक संरचनाओं की बड़ी सरणी में होते हैं ।

इसलिए, इस काम का मुख्य उद्देश्य वैज्ञानिक समुदाय को "मध्यम आकार" के लिए स्केलेबल डेटा प्रबंधन प्रणालियों के रूप में डेटाबेस की क्षमता के बारे में सूचित करना है, कम वेग डेटा के साथ-साथ रोगी सोर्स सेल-लाइन प्रयोगों के विशिष्ट उदाहरणों का उपयोग करके एक सामान्य टेम्पलेट प्रदान करना है। इसी तरह के अन्य अनुप्रयोगों में नदी के बिस्तरों के भू-स्थानिक डेटा, देशीयनैदानिक अध्ययनों से प्रश्नावली और विकास मीडिया^17,^18,¹⁹में माइक्रोबियल वृद्धि की स्थिति शामिल है। यह काम कच्चे डेटा को संरचित प्रारूपों में परिवर्तित करने के लिए आवश्यक डेटा-पाइपलाइन के साथ मिलकर डेटाबेस के निर्माण की सामान्य बातों और उपयोगिता पर प्रकाश डालता है। एसक्यूएल में डेटाबेस के लिए डेटाबेस इंटरफेस और कोडिंग की मूल बातें प्रदान की जाती हैं और उदाहरणों के साथ सचित्र हैं ताकि दूसरों को बुनियादी ढांचे के निर्माण के लिए लागू ज्ञान प्राप्त करने की अनुमति मिल सके। अंत में, एक नमूना प्रयोगात्मक डेटा सेट दर्शाता है कि विभिन्न तरीकों से बहुआयामी डेटा को एकत्र करने के लिए डेटाबेस को कितनी आसानी से और प्रभावी ढंग से डिज़ाइन किया जा सकता है। यह जानकारी अपनी प्रायोगिक जरूरतों के लिए डेटाबेस को लागू करने की दिशा में रास्ते पर साथी वैज्ञानिकों की सहायता के लिए संदर्भ, टीका और टेम्पलेट्स प्रदान करती है।

एक अनुसंधान प्रयोगशाला सेटिंग में एक स्केलेबल डेटाबेस बनाने के प्रयोजनों के लिए, मानव फाइब्रोब्लास्ट कोशिकाओं का उपयोग कर प्रयोगों से डेटा पिछले तीन वर्षों में एकत्र किया गया था । इस प्रोटोकॉल का प्राथमिक ध्यान कंप्यूटर सॉफ्टवेयर के संगठन पर रिपोर्ट करना है ताकि उपयोगकर्ता को सबसे अधिक लागत और समय-कुशल तरीके से डेटा को एकत्र करने, अद्यतन करने और प्रबंधित करने में सक्षम बनाया जा सके, लेकिन प्रासंगिक प्रायोगिक विधियां भी प्रदान की जाती हैं संदर्भ.

प्रायोगिक सेटअप
नमूनों को तैयार करने के लिए प्रायोगिक प्रोटोकॉल को पहले^20,²¹वर्णित किया गया है, और यहां संक्षेप में प्रस्तुत किया गया है। पॉलीडिमेथिलसिलॉक्सेन (पीडीएमएस) और क्यूरिंग एजेंट के 10:1 मिश्रण के साथ स्पिन-कोटिंग आयताकार ग्लास कवरस्लिप द्वारा निर्माण तैयार किए गए थे, फिर 0.05 मिलीग्राम/एमएल फाइब्रोनेक्टिन, या तो असंगठित (आइसोट्रोपिक) या 5 माइक्रोमीटर गैप माइक्रोपैटर्न्ड व्यवस्थाओं (लाइनों) के साथ 20 माइक्रोमीटर लाइनों में लागू किया गया था। फाइब्रोब्लास्ट कोशिकाओं को इष्टतम घनत्व पर कवरस्लिप पर 7 (या सकारात्मक नियंत्रण के लिए 16 मार्ग) पर वरीयता प्राप्त की गई थी और 24 घंटे के बाद मीडिया के साथ 48 एच के लिए बढ़ने के लिए छोड़ दिया गया था। इसके बाद कोशिकाओं को 4% पैराफॉर्मलडिहाइड (पीएफए) समाधान और 0.0005% nonionic सर्फेक्टेंट का उपयोग करके तय किया गया था, इसके बाद सेल न्यूक्लिकी (4',6'-डिमिनोडिनिनो-2-फेनिलिनोडोल [डीएपीआई]), ऐक्टिन (एलेक्सा फ्लोर 488 फेलोइडिन), और फाइब्रोनेक्टिन (पॉलीक्लोनकल खरगोश एंटी-ह्यूमन फाइब्रोनेक्टिन) के लिए कवरस्लिप इम्यूनोदाग किया जा रहा है। बकरी विरोधी खरगोश IgG एंटीबॉडी (एलेक्सा फ्लोर ७५० बकरी विरोधी खरगोश) का उपयोग कर फाइब्रोनेक्टिन के लिए एक माध्यमिक दाग लागू किया गया था और संरक्षण एजेंट फ्लोरोसेंट लुप्त होती को रोकने के लिए सभी कवरस्लिप पर मुहिम शुरू की गई थी । नेल पॉलिश माइक्रोस्कोप स्लाइड पर कवरस्लिप सील करने के लिए इस्तेमाल किया गया था तो 24 घंटे के लिए सूखी छोड़ दिया है ।

फ्लोरेसेंस छवियों के रूप में पहले²⁰ वर्णित एक डिजिटल चार्ज युग्मित डिवाइस (सीसीडी) एक उल्टे मोटरीकृत माइक्रोस्कोप पर घुड़सवार कैमरे के साथ मिलकर किया गया । देखने के दस बेतरतीब ढंग से चयनित क्षेत्रों 40x आवर्धन पर प्रत्येक कवरस्लिप के लिए छवि थे, एक ६.२२ पिक्सल/μm संकल्प के अनुरूप । कस्टम-लिखित कोड का उपयोग न्यूक्लिकी, ऐक्टिन फिलामेंट्स और फाइब्रोनेक्टिन का वर्णन करने वाली छवियों से विभिन्न चरों की मात्रा निर्धारित करने के लिए किया गया था; इसी मूल्यों के साथ-साथ संगठन और ज्यामिति मापदंडों को डेटा फ़ाइलों में स्वचालित रूप से सहेजा गया था।

सेल लाइनें
सभी नमूना डेटा सेल लाइनों पर अधिक व्यापक प्रलेखन पूर्व^{प्रकाशनों 20}में पाया जा सकता है । संक्षेप में वर्णन करने के लिए, डेटा संग्रह को मंजूरी दे दी गई थी और यूसी इरविन इंस्टीट्यूशनल रिव्यू बोर्ड (आईआरबी # 2014-1253) के अनुसार सूचित सहमति दी गई थी। मानव फाइब्रोब्लास्ट कोशिकाओं को लैमिन ए/सी(एलएमएनए)जीन उत्परिवर्तन के विभिन्न विविधताओं के तीन परिवारों से एकत्र किया गया: हेटेरोजिगौस एलएमएना स्प्लिस-साइट उत्परिवर्तन (c.357-2A>G)²² (परिवार ए); LMNA बकवास उत्परिवर्तन (c.736 सीएंडटी, pQ246X) एक्सोन 4²³ (परिवार बी) में; और LMNA गलत अर्थ उत्परिवर्तन (c.1003C>t, pR335W) एक्सोन ६^२४ (परिवार सी) में । प्रत्येक परिवार के अन्य व्यक्तियों से संबंधित उत्परिवर्तन-नकारात्मक नियंत्रण के रूप में फाइब्रोब्लास्ट कोशिकाओं को भी एकत्र किया गया था, जिसे "नियंत्रण" के रूप में जाना जाता है, और अन्य को असंबंधित उत्परिवर्तन-नकारात्मक नियंत्रण के रूप में खरीदा गया था, जिसे "दानदाता" के रूप में जाना जाता है। एक सकारात्मक नियंत्रण के रूप में, हचिनसन-ग्लिफोर्ड प्रोजेरिया (एचजीपीएस) के साथ एक व्यक्ति से फाइब्रोब्लास्ट कोशिकाओं को खरीदा गया था और एक 8 वर्षीय महिला रोगी से ली गई त्वचा बायोप्सी से उगाया गया था, जिसमें एचजीपीएस के साथ एलएमएनए G608G पॉइंट म्यूटेशन²⁵था । कुल मिलाकर, 22 व्यक्तियों से फाइब्रोब्लास्ट का परीक्षण किया गया और इस काम में डेटा के रूप में उपयोग किया गया।

डेटा प्रकार
फाइब्रोब्लास्ट डेटा दो श्रेणियों में से एक में गिर गया: सेलुलर न्यूक्लिकी चर (यानी, डिस्मॉर्फिक नाभिक का प्रतिशत, नाभिक का क्षेत्र, नाभिक सनक का क्षेत्र)²⁰ या संरचनात्मक चर ओरिएंटेशनल ऑर्डर पैरामीटर (ओओपी)^21,^26,²⁷ (यानी, ऐक्टिन ओओपी, फाइब्रोनेक्टिन ओओपी, न्यूक्लिकओओपी) से उपजी। यह पैरामीटर सभी अभिविन्यास वेक्टर के मीन ऑर्डर टेंपर के अधिकतम ईजेनवैल्यू के बराबर है, और इसे पिछले प्रकाशनों²⁶^,²⁸में विस्तार से परिभाषित किया गया है। इन मूल्यों को विभिन्न प्रकार की संभावित संरचनाओं में एकत्रित किया जाता है, जैसे आयु के खिलाफ मूल्य, लिंग, रोग की स्थिति, कुछ लक्षणों की उपस्थिति आदि। इन चरों का उपयोग कैसे किया जाता है, इसके उदाहरण परिणाम अनुभाग में पाए जा सकते हैं।

उदाहरण कोड और फ़ाइलें
ऊपर दिए गए डेटा के आधार पर उदाहरण कोड और अन्य फाइलों को इस पेपर के साथ डाउनलोड किया जा सकता है, और उनके नाम और प्रकार तालिका 1में संक्षेप में दिए जाते हैं।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

नोट: इस प्रोटोकॉल में उपयोग किए जाने वाले सॉफ़्टवेयर संस्करणों के लिए सामग्री की तालिका देखें।

1. मूल्यांकन करें कि डेटा डेटा बेसबेस संगठन योजना से लाभान्वित होगा या नहीं

उदाहरण कोड और डेटाबेस डाउनलोड करें (पूरक कोडिंग फ़ाइलेंदेखें, जिन्हें तालिका 1में संक्षेप में पेश किया गया है)।
यदि रुचि का डेटा सेट "बहु-आयामी" है, तो मूल्यांकन करने के लिए चित्रा 1 का उपयोग करें।
नोट: चित्रा 1 उदाहरण डेटा सेट के लिए प्रदान किए गए बहु-आयामी डेटाबेस का एक चित्रमय प्रतिनिधित्व है।
यदि डेटा को उदाहरण की तरह "बहु-आयामी" रूप में कल्पना की जा सकती है और यदि किसी भी आयाम (यानी, स्थितियां) के लिए विशिष्ट प्रयोगात्मक परिणाम से संबंधित करने की क्षमता उपलब्ध डेटा में अधिक वैज्ञानिक अंतर्दृष्टि के लिए अनुमति देगी, तो आगे बढ़ें एक रिलेशनल डेटाबेस का निर्माण करें।

2. डेटाबेस संरचना को व्यवस्थित करें

नोट: रिलेशनल डेटाबेस तालिकाओं के रूप में जानकारी स्टोर करते हैं। टेबल पंक्तियों और स्तंभों की स्कीमा में आयोजित किए जाते हैं, स्प्रेडशीट के समान, और डेटाबेस के भीतर पहचान की जानकारी को लिंक करने के लिए उपयोग किया जा सकता है।

डेटा फ़ाइलों को व्यवस्थित करें, इसलिए उन्होंने अद्वितीय नामों को अच्छी तरह से सोचा है। फ़ाइल नामकरण सम्मेलनों और फ़ोल्डर-सबफोल्डर संरचनाओं के साथ अच्छा अभ्यास, जब अच्छा किया जाता है, तो मैन्युअल रूप से फ़ाइलों तक पहुंचने की पठनीयता से समझौता किए बिना व्यापक डेटाबेस स्केलेबिलिटी की अनुमति देता है। एक सुसंगत प्रारूप में तिथि फ़ाइलों को जोड़ें, जैसे "20XX-YY-ZZ", और मेटाडेटा के अनुसार सबफोल्डर का नाम ऐसा ही एक उदाहरण है।
डेटा-बेस संरचना डिज़ाइन की गई है, विभिन्न तालिकाओं में क्षेत्रों के बीच संबंधों को आकर्षित करें। इस प्रकार, बहु-आयामीता को अलग-अलग तालिकाओं में विभिन्न क्षेत्रों (यानी टेबल में कॉलम) से संबंधित द्वारा एक दूसरे को संभाला जाता है।
रेडमी डॉक्यूमेंटेशन बनाएं जो चरण 2.2 में बनाए गए डेटाबेस और रिश्तों का वर्णन करता है। एक बार विभिन्न तालिकाओं के बीच प्रवेश लिंक हो जाने के बाद, सभी संबद्ध जानकारी उस प्रविष्टि से संबंधित है और वांछित जानकारी को फ़िल्टर करने के लिए जटिल प्रश्नों को कॉल करने के लिए उपयोग किया जा सकता है।
नोट: रेडमी दस्तावेज संरचना में गैर-समान डेटा को जोड़े बिना किसी परियोजना के बारे में पूरक जानकारी और डेटाबेस संरचनात्मक जानकारी प्रदान करने के लिए एक आम समाधान हैं।
चरण 2.1−2.3 के बाद, अंतिम परिणाम को इस उदाहरण के समान बनाएं जहां व्यक्तियों की भिन्न विशेषताएं(चित्रा 2ए)उन व्यक्तियों के संबद्ध प्रयोगात्मक डेटा(चित्र ा 2बी)से संबंधित हैं। विभिन्न आशुलिपि नोटेशन(चित्रा 2बी)की व्याख्या करने के लिए मुख्य डेटा मूल्यतालिका में प्रविष्टियों का मिलान करने के लिए पैटर्न प्रकारों(चित्रा 2सी)और डेटा प्रकार(चित्रा 2डी)के संबंधित स्तंभों के माध्यम से भी ऐसा ही किया गया था।
लंबी दूरी के डेटा संग्रह के लिए दर्ज किए जाने वाले सभी आवश्यक और केवल सहायक डेटा बिंदुओं को निर्धारित करें।
नोट: स्प्रेडशीट कार्यक्रमों पर डेटाबेस का उपयोग करने का एक प्रमुख लाभ, जैसा कि पहले उल्लेख किया गया है, स्केलेबिलिटी है: अतिरिक्त डेटा बिंदुओं को किसी भी बिंदु पर मामूली रूप से जोड़ा जा सकता है और औसत जैसे गणनाएं, नए जोड़े गए डेटा बिंदुओं को प्रतिबिंबित करने के लिए तुरंत अपडेट किए जाते हैं।
1. शुरुआत से पहले अलग-अलग डेटा पॉइंट बनाने के लिए आवश्यक जानकारी की पहचान करें। कच्चे डेटा को संशोधित करने या उस पर सहेजने के बजाय अछूता छोड़ दें, ताकि पुनर्विश्लेषण संभव और सुलभ हो।
  नोट: दिए गए उदाहरण के लिए(चित्रा 2),किसी व्यक्ति के अनुरूप "डिज़ाइनर", "पैटर्न प्रकार", "कवरस्लिप #", और "वेरिएबल टाइप" संबंधित मूल्य की विशिष्टता के लिए सभी महत्वपूर्ण क्षेत्र थे।
2. यदि वांछित है, तो अन्य सहायक, गैर-महत्वपूर्ण जानकारी जोड़ें जैसे "कुल # कवरस्लिप" के लिए आयोजित पुनरावृत्ति की संख्या को इंगित करने के लिए और यह निर्धारित करने में मदद करते हैं कि इस उदाहरण में डेटा अंक गायब हैं या नहीं।

3. पाइपलाइन की स्थापना और व्यवस्थित

उन सभी विभिन्न प्रयोगों और डेटा विश्लेषण विधियों की पहचान करें जो प्रत्येक डेटा प्रकार के लिए सामान्य डेटा संग्रहण प्रथाओं के साथ-साथ डेटा संग्रह का कारण बन सकते हैं। उपयोगकर्ता बोझ को कम करते हुए आवश्यक स्थिरता और संस्करण नियंत्रण सुनिश्चित करने के लिए गेटहब जैसे ओपन सोर्स संस्करण नियंत्रण सॉफ्टवेयर के साथ काम करें।
यदि संभव हो, तो स्वचालित पाइपलाइन के लिए अनुमति देने के लिए डेटा के लगातार नामकरण और भंडारण के लिए प्रक्रिया बनाएं।
नोट: उदाहरण में, आउटपुट सभी को लगातार नामित किया गया था, इस प्रकार फ़ाइलों का चयन होने के बाद विशिष्ट विशेषताओं की तलाश में डेटा-पाइपलाइन बनाना सीधा था। यदि लगातार नामकरण संभव नहीं है, तो डेटाबेस में तालिकाओं को मैन्युअल रूप से आबाद करने की आवश्यकता होगी, जिसकी सिफारिश नहीं की गई है।
डेटाबेस के लिए नई डेटा प्रविष्टियां उत्पन्न करने के लिए किसी भी सुविधाजनक प्रोग्रामिंग भाषा का उपयोग करें।
1. अलग-अलग फ़ाइलों में छोटे "सहायक" टेबल (टेबल 1में #10 #8 फ़ाइलें) बनाएं जो डेटा के स्वचालित चयन का मार्गदर्शन कर सकते हैं। ये फाइलें पाइपलाइन के तहत संचालित करने के लिए संभावनाओं के टेम्पलेट के रूप में काम करती हैं और इसे संपादित करना आसान है।
2. डेटा-पाइपलाइन(चित्रा 3डी)के लिए नए डेटा प्रविष्टियां उत्पन्न करने के लिए, कोड (Locationसूचक.m #1) कार्यक्रम के लिए उपयोगकर्ता द्वारा चुने जाने वाले इनपुट के रूप मेंसहायक तालिकाओं का उपयोग करने के लिए (टेबल 1में #8−#10 फाइलें)।
3. यहां से, पिछली प्रविष्टियों(चित्रा 3ई)के साथ नई प्रविष्टियों के संयोजन से फ़ाइल स्थानों की एक नई स्प्रेडशीट को इकट्ठा करें। इस चरण को स्वचालित करने के लिए एक कोड बनाएं जैसा कि LocationसूचकCompile.m (तालिका में#2 फ़ाइल) में दिखाया गया है।
4. बाद में, डुप्लिकेट के लिए इस विलय स्प्रेडशीट की जांच करें, जिसे स्वचालित रूप से हटा दिया जाना चाहिए। इस चरण को स्वचालित करने के लिए एक कोड बनाएं जैसा कि LocationPointer_Remove_Duplicates में दिखाया गया है (तालिका 1में फ़ाइल #3) ।
5. इसके अतिरिक्त, त्रुटियों के लिए स्प्रेडशीट की जांच करें, और उनके कारण और स्थान(चित्रा 3एफ) के उपयोगकर्ता को सूचितकरें। इस चरण को स्वचालित करने के लिए एक कोड बनाएं जैसा कि BadसूचकCheck.m में दिखाया गया है (तालिका मेंफ़ाइल #4)। वैकल्पिक रूप से, एक कोड लिखें जो संकलित डेटाबेस की जांच करेगा और एक चरण में डुप्लिकेट की पहचान करेगा जैसा कि LocationPointer_Check में दिखाया गया है (तालिका 1में फ़ाइल #5) ।
6. उपयोगकर्ता को डेटाबेस की अखंडता को खोए बिना मैन्युअल रूप से बुरे बिंदुओं को हटाने के लिए एक कोड बनाएं जैसा कि Manual_Pointer_Removal में दिखाया गया है (तालिका 1में फ़ाइल #6)।
7. फिर फ़ाइल स्थानों का उपयोग डेटा वैल्यू स्प्रेडशीट(चित्रा 3जी,फाइल #12 टू टेबल 1)उत्पन्न करने के साथ-साथ उन प्रविष्टियों की सबसे अद्यतन सूची बनाने के लिए करें जिन्हें फ़ाइल स्थानों की पहचान करने या भविष्य की प्रविष्टियों(चित्रा 3एच)के साथ विलय करने के लिए एक्सेस किया जा सकता है। इस चरण को स्वचालित करने के लिए एक कोड बनाएं जैसा कि Database_Generate में दिखाया गया है (तालिका 1में फ़ाइल #7)।
डबल चेक करें कि पाइपलाइन कठोर नामकरण सम्मेलनों, स्वचालित फ़ाइल असेंबली कोड, और स्वचालित त्रुटि जांच के रूप में पहले वर्णित शामिल करने के लिए जांच करके प्रयोगात्मक कठोरता को जोड़ता है।

4. डेटाबेस और प्रश्न बनाएं

नोट: यदि टेबल डेटाबेस में जानकारी स्टोर करते हैं, तो प्रश्न विशिष्ट मानदंड दी गई जानकारी के लिए डेटाबेस से अनुरोध कर रहे हैं। डेटाबेस बनाने के दो तरीके हैं: खाली दस्तावेज़ से शुरू करना या मौजूदा फ़ाइलों से शुरू करना। चित्रा 4 एसक्यूएल सिंटेक्स का उपयोग करके एक नमूना क्वेरी दिखाता है जिसे चित्रा 2में दिखाए गए डेटाबेस संबंधों का उपयोग करके चलाने के लिए डिज़ाइन किया गया है।

विधि 1: डेटाबेस और प्रश्नों को बनाने में खरोंच से शुरू
1. एक खाली डेटाबेस दस्तावेज़ बनाएं।
2. बाहरी डेटा का चयन करके हेल्पर टेबल (टेबल 1में #10 #8 फाइलें) लोड करें। टेक्स्ट फाइल इम्पोर्ट । फ़ाइल चुनें (फाइलें #8−#10) । परिसीमित । पहली पंक्ति में हेडर, कॉमा शामिल हैं । डिफ़ॉल्ट छोड़ दें । मेरी खुद की प्राथमिक कुंजी चुनें (सेल लाइनों के लिए डिज़ाइनर #8, डेटा प्रकार फ़ाइल #9 के लिए चर नाम, पैटर्न टाइप फ़ाइल #10 के लिए पैट नाम) । डिफ़ॉल्ट छोड़ दें । खत्म करो।
3. बाहरी डेटा का चयन करके डेटा मूल्य तालिका (टेबल 1में फाइल #12) लोड करें। टेक्स्ट फाइल इम्पोर्ट । फ़ाइल चुनें (फाइल #12) । परिसीमित । पहली पंक्ति में हेडर, कॉमा शामिल हैं । डिफ़ॉल्ट छोड़ दें । एक्सेस को प्राथमिक कुंजी जोड़ने दें। तालिका में आयात: डेटावैल्यूज । खत्म करो।
4. डेटाबेस टूल्स का चयन करके संबंध बनाएं । रिश्ते । बोर्ड के लिए सभी टेबल खींचें । संपादित करें रिश्तों । नया बनाएं । हेल्पर टेबल्स डिज़ाइनर के साथ डेटावैल्यू फ़ील्ड से मेल खाते हैं। ज्वाइंट टाइप 3।
5. चुनें बनाएं । क्वेरी डिजाइन।
6. सभी प्रासंगिक तालिकाओं को शीर्ष खिड़की में चुनें या खींचें। इस उदाहरण में 'सेल लाइंस', 'डेटा वैल्यूज', 'डेटा टाइप', और 'पैटर्न टाइप'। रिश्तों को अपने आप पिछले रिश्ते डिजाइन के आधार पर स्थापित करना चाहिए ।
7. उदाहरण के लिए, वांछित परिणामों के लिए क्वेरी कॉलम भरें:
  1. शो पर क्लिक करें । योग।
  2. पहला कॉलम (तालिका: डेटावैल्यूज, फ़ील्ड: डेटावर, कुल: GroupBy, मानदंड: "Act_OOP"), दूसरा कॉलम (टेबल: डेटावैल्यूज, फ़ील्ड: पटवार, कुल: GroupBy, मानदंड: "लाइनें"), और तीसरा कॉलम (तालिका: Cell_Lines, फ़ील्ड: डिज़ाइनर, कुल: GroupBy, सॉर्ट: आरोही) ।
  3. चौथा कॉलम (तालिका: डेटावैल्यूज, फ़ीट: पैरामीटर, कुल: Ave), पांचवां कॉलम (तालिका: डेटावैल्यूज़, फ़ील्ड: पैरामीटर, कुल: StDev), और छठा कॉलम (तालिका: डेटावैल्यूज, फ़ील्ड: पैरामीटर, कुल: गिनती) भरें।
8. क्वेरी चलाएं।
वैकल्पिक रूप से, उदाहरण के लिए एक आधार के रूप में प्रदान किए गए उदाहरण डेटाबेस का उपयोग करें। डेटाबेस फ़ाइल Database_Queries.accdb (तालिका 1में #13 फ़ाइल) खोलें जिसे पहले डाउनलोड किया गया था। ब्याज के डेटा के साथ मौजूदा तालिकाओं को बदलकर इसे टेम्पलेट के रूप में उपयोग करें।

5. आउटपुट टेबल को महत्व विश्लेषण के लिए सांख्यिकीय सॉफ्टवेयर में ले जाएं

इस नमूना प्रयोगात्मक डेटा के लिए, विभिन्न शर्तों के बीच मतलब तुलना के लिए Tukey परीक्षण का उपयोग कर विचरण (ANOVA) के एक तरह से विश्लेषण का उपयोग करें ।
नोट: पी एंड एलटी के मूल्यों को सांख्यिकीय रूप से महत्वपूर्ण माना गया।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

डेटा की बहुआयामीता
यहां प्रस्तुत उदाहरण डेटा-सेट के संदर्भ में, विधियों अनुभाग में वर्णित विषयों को हृदय रोग पैदा करने वाले एलएमनए उत्परिवर्तन ("रोगियों"), संबंधित गैर-उत्परिवर्तन नकारात्मक नियंत्रण ("नियंत्रण"), असंबंधित गैर-उत्परिवर्तन नकारात्मक नियंत्रण ("दाताओं"), और हचिनसन-गिलफोर्ड प्रोजेरिया सिंड्रोम (एचजीपीएस) के साथ एक व्यक्ति को सकारात्मक नियंत्रण²⁰के रूप में विभाजित किया गया था। नियंत्रण और दाताओं से परिणाम आगे एक समग्र नकारात्मक नियंत्रण (नेकां) समूह के रूप में एक साथ समूहीकृत किया जा सकता है, LMNA उत्परिवर्तन के अपने सामूहिक कमी को देखते हुए । हर विषय की सेल लाइन में "म्यूटेशन स्टेटस" शामिल था, जो उनकी स्थिति समूह(चित्र 1 - गहरे नीले रंग की धुरी) के आधार पर था। प्रत्येक प्रयोग के लिए, विषयों से फाइब्रोब्लास्ट कोशिकाओं को या तो असंगठित (आइसोट्रॉपिक) या माइक्रोपैटर्नेड (लाइन्स) फाइब्रोनेक्टिन की व्यवस्थाओं पर सुसंस्कृत किया गया था, जो "पैटर्न प्रकार"(चित्रा 1 - नारंगी धुरी) की स्थिति बना रहा था। कोशिकाओं को ठीक करने, इम्यूनोदाग्ड और इमेजड के बाद, "कवरस्लिप #" को लिखित किया गया था, क्योंकि एक ही व्यक्ति की कोशिकाओं(चित्र 1 - हल्के हरे रंग की धुरी) का उपयोग करके कई प्रयोग (यानी, तकनीकी प्रतिकृति) होती है। कस्टम मैटलैब कोड^20,²¹ का उपयोग सेल न्यूक्लिकी या ऊतक संगठन चर के विभिन्न पहलुओं को "वेरिएबल प्रकार"(चित्रा 1 - चैती हरी धुरी) के रूप में निर्धारित करने के लिए किया गया था। तीन कारक कोशिकाओं के मानव स्रोत से जुड़े थे और इसके परिणामस्वरूप "परिवार"(चित्रा 1 - गहरे गुलाबी धुरी) और "बायोप्सी के समय आयु"(चित्र 1 - गहरे हरे रंग की धुरी) के अलावा "उत्परिवर्तन स्थिति" से जुड़े थे। चित्रा 1 में शामिल नहीं अन्य आयाम "प्रस्तुति की आयु," "लक्षण," "डिज़ाइनर," और प्रश्न में व्यक्ति के "लिंग" थे। यहां प्रदान किए गए उदाहरण में डेटा एकत्रीकरण के लिए कम से कम दस संभावित आयाम होते हैं। इस प्रकार यह उदाहरण डेटा संबंधपरक डेटाबेस द्वारा संगठन के लिए एक प्रमुख उम्मीदवार है।

चित्रा 1: LMNA उत्परिवर्तन डेटा सेट से बहुआयामी डेटा का एक दृश्य। एक घन "चर प्रकार," "पैटर्न प्रकार," और "Coverslip #" के तीन आयामों द्वारा परिभाषित किया गया है । इसके अलावा आयाम "उत्परिवर्तन की स्थिति," "बायोप्सी की आयु" (yrs), और "परिवार" के कुल्हाड़ियों के रूप में दिखाया गया है । रंगीन लेबल दिखाए गए विभिन्न अक्षों के अनुरूप होते हैं, जैसे कि प्रत्येक व्यक्ति के घन के लिए बायोप्सी (हरे रंग की संख्या) की आयु। यहां, दस संभावित आयामों में से छह का उपयोग प्रायोगिक डेटा बिंदुओं की बहु-आयामीता को समझाने के लिए किया जाता है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

पाइपलाइन का आयोजन
सभी डिजिटल डेटा का अनुमानित 95% तक असंरचित⁴है, लेकिन डेटाबेस के लिए संरचित प्रारूपों की आवश्यकता होती है। फिर भी, डेटा-पाइपलाइन के लिए एक अच्छा स्वचालित तरीका बनाना अत्यधिक संदर्भ निर्भर है।

चित्रा 2: LMNA उत्परिवर्तन डेटा सेट के भीतर तालिका और डिजाइन दृश्य संबंध। रिलेशनल डेटाबेस में एक तालिका में क्षेत्रों को दूसरी तालिका में जानकारी के साथ जोड़ने का लाभ होता है, जो एकत्रीकरण की तत्काल पारस्परिकता की अनुमति देता है। यहां उदाहरण नेत्रहीन दर्शाता है कि कैसे अलग जानकारी से जोड़ा जा सकता है । कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

इस उदाहरण के लिए, प्रत्येक प्रयोग से एकत्र की गई छवियों को जिम्मेदार प्रयोगशाला सदस्य की तारीख और प्रारंभिक द्वारा नामित फ़ोल्डर में संग्रहीत किया गया था, जिसमें उप-फ़ोल्डर विषय और कवरस्लिप नंबर को सूचीबद्ध करते थे। पाइपलाइन फ़ाइलों को पूरक कोडिंग फ़ाइलोंमें प्रदान किया जाता है, साथ ही प्रवाह चार्ट चित्रण(चित्रा 3)में संक्षेप में भी दिया जाता है। विभिन्न विषयों में विभिन्न प्रयोगात्मक स्थितियों से विभिन्न मैट्रिक्स कस्टम कोड(चित्र 3बी)²⁰^,²¹का उपयोग करइन फ्लोरोसेंट छवियों(चित्र 3ए)से मात्रा निर्धारित किए गए थे । उदाहरण के लिए, ऐक्टिन ओरिएंटेशनल ऑर्डर पैरामीटर²¹ को फालोडिन(चित्रा 3ए)से दागित ऊतकों से निकाला गया था और विभिन्न व्यक्तियों से फाइब्रोब्लास्ट के संगठन की तुलना करने के लिए उपयोग किया जाता था। कोड आउटपुट स्रोत छवियों(चित्र 3सी)के रूप में एक ही फ़ोल्डर में सहेजे गए थे।

चित्रा 3: सामान्यीकृत संदर्भ में सामान्य डेटा-पाइपलाइन की आवश्यकताका एक उदाहरण। उपयोगकर्ता इनपुट और स्वचालित कोड का उपयोग करके नई प्रविष्टियां बनाई गई थीं, जो महत्वपूर्ण जानकारी को स्प्रेडशीट प्रारूप में स्वरूपित करती थीं। इन प्रविष्टियों को फ़ाइल स्थान प्रविष्टियों के सबसे हालिया सेट के साथ जोड़ा गया था, त्रुटियों की जांच की गई थी, फिर फ़ाइल स्थानों की स्प्रेडशीट और डेटा मूल्यों की स्प्रेडशीट दोनों के रूप में संग्रहीत किया गया था। स्केल बार = 20 माइक्रोन. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

LMNA उत्परिवर्तन डेटा सेट में एक उपन्यास संबंध की पहचान
जब संभावित संरचनाओं की भीड़ दी जाती है, तो मैन्युअल डेटा एकत्रीकरण विधियों का उपयोग करके उपन्यास संबंध कहां मौजूद हैं, यह पहचानना मुश्किल हो सकता है। इस विशिष्ट संदर्भ में, हम ओओपी²⁷का उपयोग करके मापा गया कई स्थितियों में उपकोशिकीय ऐक्टिन फिलामेंट्स के संगठन की तुलना करने में रुचि रखते थे।

चित्रा 4: एसक्यूएल सिंटैक्स का उपयोग करके एक उदाहरण क्वेरी। चयन करें और बयानों से एक क्वेरी उत्पन्न करने के लिए आवश्यकताएं हैं, लेकिन अतिरिक्त आदेश और मानदंड अक्सर शामिल होते हैं। समूह द्वारा स्पष्टीकरण प्रदान करता है कि डेटा, होने या कहां बयान आउटपुट को विशिष्ट मानदंडों को पूरा करने वाले डेटा तक सीमित करते हैं, और आदेश द्वारा उस आदेश को इंगित करता है जिसके द्वारा आउटपुट की व्यवस्था की जानी चाहिए। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

ओओपी एक गणितीय निर्माण है जो एनिसोट्रोपिक वातावरण में व्यवस्था की डिग्री की मात्रा निर्धारित करता है, जो पूरी तरह से आइसोट्रॉपिक ऊतक के अनुरूप शून्य और पूरी तरह से गठबंधन ऊतक के अनुरूप होता है। डेटा सेट को पहले पैटर्न प्रकार द्वारा लाइनों(चित्रा 5ए)और आइसोट्रोपिक(चित्रा 5बी)स्थितियों के रूप में विभाजित किया गया था, जिनके पास फाइब्रोनेक्टिन माइक्रोपैटर्निंग के बाद से ऊतक संगठन को भारी प्रभावित करने के बाद से बेहद अलग ओओपी होने की उम्मीद थी। आइसोट्रोपिक ऊतकों की तुलना करते समय स्थितियों के बीच कोई महत्वपूर्ण अंतर नहीं था(चित्र5बी)। इसके विपरीत, नमूनों वाले ऊतकों को सकारात्मक नियंत्रण सेल लाइन (एचजीपीएस)(चित्रा 5ए)में सांख्यिकीय रूप से कम संगठित किया गया था, और यह संबंध तब भी आयोजित किया गया था जब डेटा को विभिन्न समूहों(चित्रा 5सी)में एकत्र किया गया था। ऐक्टिन ओओपी को नैदानिक चर के खिलाफ एकत्रीकरण को समझाने के लिए बायोप्सी(चित्रा 5डी)के समय व्यक्तियों की उम्र के खिलाफ अतिरिक्त रूप से साजिश रची गई थी। ²⁰परमाणु दोषों के विपरीत, ऐक्टिन संगठन और किसी व्यक्ति की उम्र(चित्रा 5डी)के बीच कोई संबंध नहीं है । अंततः, चित्रा 5 में दिखाए गए भूखंडों में यह स्पष्ट किया गया है कि विभिन्न संयोजनों में एक ही डेटा का विश्लेषण कैसे किया जा सकता है और कई वर्गों के तहत आने वाले डेटा को एकत्र करने का सामान्य रूप से मुश्किल कार्य डेटाबेस का उपयोग करके कितना आसानी से पूरा किया जा सकता है।

इस लेख के लिए, रोगी सोर्स फाइब्रोब्लास्ट से डेटा की तुलना उत्परिवर्तन परिणामों को निर्धारित करने के लिए शर्तों के बीच की गई थी। हालांकि दोनों HGPS और इस अध्ययन में तीन परिवारों LMNAसे जुड़े रोगों है कि संभावित परमाणु लिफाफे को बाधित है, रोगियों को मुख्य रूप से दिल की शिथिलता के साथ जुड़े लक्षण प्रदर्शित करते हैं, जबकि HGPS व्यक्तियों कई अंग प्रणाली^{प्रभावित 22,}^23,²⁴है । दरअसल, एक एचजीपीएस रोगी से उत्पन्न माइक्रोपैटर्न वाले पर्यावरण कोशिकाओं के बावजूद अन्य कोशिका ओं में से किसी की तुलना में सांख्यिकीय रूप से कम ऐक्टिन ओओपी मूल्य था(चित्रा 5ए,सी)। एचजीपीएस रोगियों के साथ यह किसी भी त्वचा उत्परिवर्तन की वजह से असामान्यताओं के साथ अध्ययन में ही लोगों को किया जा रहा है । विभिन्न संरचनाओं में एक ही डेटा को देखना भी एक विविध डेटा सेट(चित्रा 5)में वैज्ञानिक जांच में अतिरिक्त अंतर्दृष्टि और रास्ते प्रदान करने के लिए उपयोगी है ।

चित्रा 5: ऐक्टिन ओओपी वेरिएबल के लिए शर्तों के बीच तुलना। (ए,बी)समूह चार प्राथमिक स्थितियों के अनुरूप हैं: गैर-संबंधित नकारात्मक नियंत्रण दाताओं, संबंधित नकारात्मक नियंत्रण नियंत्रण नियंत्रण, तीन परिवारों से एलएमएनए उत्परिवर्तन रोगियों, और सकारात्मक नियंत्रण एचजीपीएस। (ग)सभी नकारात्मक नियंत्रण (नेकां) संयुक्त थे और रोगियों को परिवार (पीए, पीबी, पीसी) के बजाय अलग किया गया । (घ)इस अध्ययन के लिए एकत्र किए गए बायोप्सी के समय उम्र के खिलाफ आइसोट्रोपिक ऐक्टिन ओओपी का संभावित ग्राफ, स्थिति और परिवार से अलग। पैनल ए, सी और डी को लाइनों पैटर्न के साथ माइक्रोपैटर्न वाले ऊतकों के लिए प्लॉट किया जाता है, जबकि पैनल बी आइसोट्रोपिक ऊतकों के लिए साजिश रची जाती है। पी एंड एलटी; 0.05 (*) का सांख्यिकीय महत्व पैनल ए, सी और डी में पाया गया। पैनल बी में किसी भी जोड़े के बीच कोई महत्व नहीं पाया गया । सभी त्रुटि सलाखों डेटाबेस के भीतर गणना मानक विचलन का प्रतिनिधित्व करते हैं। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।

पूरक कोडिंग फ़ाइलें। कृपया इस फ़ाइल को देखने के लिए यहां क्लिक करें (डाउनलोड करने के लिए सही क्लिक करें)।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

प्रोटोकॉल की तकनीकी चर्चा
डेटाबेस के उपयोग पर विचार करते समय पहला कदम यह मूल्यांकन करना है कि डेटा को ऐसे संगठन से लाभ होगा या नहीं।

अगला आवश्यक कदम एक स्वचालित कोड बनाना है जो उपयोगकर्ता से न्यूनतम इनपुट पूछेगा और तालिका डेटा संरचना उत्पन्न करेगा। उदाहरण में, उपयोगकर्ता ने डेटा प्रकार (सेल नाभिक या संरचनात्मक माप), सेल लाइनों के विषय निर्दिष्टकर्ता और चयनित की जा रही फ़ाइलों की संख्या की श्रेणी में प्रवेश किया। इसके बाद संबंधित फ़ाइलों को उपयोगकर्ता(तालिका 2,कॉलम 1) द्वारा चुना गया, जिसमें पंक्ति प्रविष्टियों को स्वचालित रूप से बनाया जा रहा है और फ़ाइल के भीतर निहित सभी चरों के साथ आबादी(तालिका 2,कॉलम 2)। इसके अलावा, यह महत्वपूर्ण है कि कोड लचीला है ताकि यदि एक और प्रयोगात्मक प्रविष्टि को जोड़ने की आवश्यकता है, तो उपयोगकर्ता लूप जारी रखने के लिए चयन कर सकता है; यदि नहीं, तो फ़ाइलों को सहेजा जाता है और लूप समाप्त हो जाता है। नई प्रविष्टियों को जोड़ने, त्रुटियों की जांच करने और इस चरण में वर्णित फ़ाइल स्थानों से स्प्रेडशीट कोडांतरण के बुनियादी कार्य एक कुशल डेटा-पाइपलाइन सेटअप के लिए सभी महत्वपूर्ण हैं।

यह ध्यान रखना अनिवार्य है कि डेटा-पाइपलाइन बनाते समय फ़ाइल स्थानों का उपयोग करने से प्रयोगात्मक कठोरता बढ़ जाती है। विशेष रूप से, डेटा मूल्यों के लिए सभी फ़ाइल स्थानों को सूचीबद्ध करने वाली एक संबंधित स्प्रेडशीट होने से उपयोगकर्ता को कच्चे डेटा एकत्र करने वाले शोधकर्ता की प्रयोगशाला नोटबुक में किसी भी डेटा पॉइंट को पीछे करने की अनुमति देता है। जब डेटा अंक के हजारों के लिए सैकड़ों के साथ काम कर रहे हैं, अधिक से अधिक पारदर्शिता और पहुंच एक परियोजना के जीवनकाल में अमूल्य है । यह अत्यधिक अनुशंसा की जाती है कि उपयोगकर्ता केवल डेटा मूल्यों को संग्रहीत करने के बजाय डेटा के लिए फ़ाइल स्थानों को पहले और बाद में संकलित करने पर विचार करें।

एक बार डेटाबेस बन जाने के बाद, डिजाइन दृश्य के माध्यम से प्रश्नों को प्रोग्राम करके शुरू करने का सबसे सरल तरीका है। उपयोगकर्ता को एक प्रारंभिक बिंदु के रूप में प्रदान किए गए टेम्पलेट (फ़ाइल#13 तालिका 1 में) डाउनलोड करना उपयोगी लगेगा। वैकल्पिक रूप से, इन्हें सीधे एसक्यूएल भाषा(चित्र4)के माध्यम से प्रोग्राम किया जा सकता है।

वैज्ञानिक चर्चा
इस लेख का उद्देश्य डेटा-पाइपलाइन और डेटाबेस से जुड़े तरीकों का प्रसार करना था जो डेटा सेट स्केलेबिलिटी और पारदर्शिता को स्पष्ट करते थे। इन तरीकों का व्यापक रूप से सूचना और व्यापार के बाहर उपयोग नहीं किया जाता है, लेकिन जैविक संदर्भों में काम करने वालों के लिए विशाल क्षमता है। चूंकि विज्ञान कंप्यूटर पर अधिक भारी भरोसा करता रहता है, इसलिए प्रभावी प्रबंधन प्रणालियों का महत्व भी^6,²⁹बढ़ जाता है । डेटाबेस का उपयोग अक्सर उच्च मात्रा और/या उच्च वेग अनुप्रयोगों के लिए किया जाता है और साहित्य में अच्छी तरह से उद्धृत किया जाता है, विशेष रूप से नैदानिक रोगी आबादी^8,^30,³¹के लिए उनके उपयोग के बारे में । कई पहले ही विशिष्ट क्षेत्रों जैसे चूहा जीनोम डाटाबेस क्यूरेशन टूल्स या नैदानिक और ट्रांसलेशनल रिसर्च³²^,³³के लिए रेडकैप के लिए निर्माण किया जा चुका है । इस प्रकार, डेटाबेस का उपयोग नैदानिक डोमेन⁸ या बड़े जीनोमिक डेटाबेस³²में अपनाया गया है, लेकिन ऊतक इंजीनियरिंग जैसे अन्य वैज्ञानिक विषयों में आम नहीं हो गया है।

स्प्रेडशीट कार्यक्रमों का उपयोग करके तेजी से जटिल आंकड़ों को संभालने के मुद्दों को वैज्ञानिक समुदाय³⁴के भीतर लंबे समय से स्वीकार किया गया है । एक अध्ययन में बताया गया है कि पूरक फाइलों वाले जीनोमिक जर्नल पेपर्स में लगभग 20% जीन नाम थे जो गलती से³⁵तारीखों में बदल दिए गए थे । इन गलतियों को २०१० से २०१५ के लिए प्रति वर्ष 15% की औसत से वृद्धि हुई है, अभी तक प्रति वर्ष 4% पर जीनोमिक्स कागजात की वार्षिक वृद्धि से आगे निकल । डेटा की एक बड़ी मात्रा के भीतर व्यक्तिगत त्रुटियों की पहचान करना अक्सर लगभग असंभव होता है, क्योंकि प्रकृति स्प्रेडशीट कार्यक्रम परिणामों या सूत्र गणनाओं के आसान सत्यापन के लिए अनुपयुक्त होते हैं। प्रकाशित लेख भी त्रुटियों की आवृत्ति को कम करने के प्रयास में बेहतर स्प्रेडशीट प्रथाओं पर वैज्ञानिकों को शिक्षित करने के लिए मौजूद हैं⁷। डेटाबेस के सबसे मजबूत लाभों में से एक स्वचालित तरीकों और संभावित संदिग्ध डेटा(चित्रा 3)को मान्य करने की क्षमता के माध्यम से त्रुटि की कमी है।

इस पद्धति का एक महत्वपूर्ण परिणाम डेटा विश्लेषण की बढ़ी हुई कठोरता है । एनआईएच के साथ - साथ अन्य वैज्ञानिकों और^{संस्थानों}द्वारा आंकड़ों की पुन: उत्पादन क्षमता बढ़ाने के महत्व को उजागर किया गया है^. हर डेटाबेस के अनुरूप फ़ाइल स्थानों की स्प्रेडशीट होने से, प्रश्न में प्रयोग की प्रयोगशाला नोटबुक(चित्रा 3)को डेटा पॉइंट वापस ट्रेस करना आसान है। व्यक्तिगत डेटा बिंदुओं को भी जल्दी से पहचाना जा सकता है और संबंधित फ़ाइल स्थानों का उपयोग करके इलेक्ट्रॉनिक रूप से पाया जा सकता है, जो कई बार अमूल्य होता है, यहां तक कि डेटा-पाइपलाइन प्रक्रिया के दौरान स्वचालित त्रुटि स्क्रीनिंग के साथ मिलकर भी। यहां तक कि डेटा सेट समय के साथ संशोधित किया जाता है, सबसे अच्छा अभ्यास सभी पिछली फ़ाइलों को रखने के मामले में मुद्दों होते है या पुराने संस्करणों की जांच की जरूरत शामिल है । गैर विनाशकारी काम कर रहे है और डेटा पाइपलाइन के भीतर पुराने संस्करणों रखने अतिरेक के माध्यम से सुरक्षा बनाता है और बेहतर समस्या निवारण के लिए अनुमति देता है ।

कोडिंग भाषाओं के संयोजन में असंख्य संबंधपरक डेटाबेस प्रबंधन प्रणालियां हैं जिनका उपयोग एक ही डेटा-पाइपलाइन की जरूरतों के लिए किया जा सकता है। सबसे उपयुक्त विकल्प डेटा और संदर्भ का उपयोग किए जाने पर अत्यधिक निर्भर हैं; कुछ अनुप्रयोगों स्केलेबिलिटी, लचीलापन, विश्वसनीयता, और अन्य प्राथमिकताओं⁹में सबसे अच्छा उत्कृष्टता . हालांकि डेटाबेस अभी भी तकनीकी रूप से पैमाने में परिमित हैं, स्मृति सीमा तक पहुंचने सबसे वैज्ञानिक प्रयोगशालाओं के दायरे से परे रहता है । उदाहरण के लिए, एक एमएस एक्सेस डेटाबेस में 2 जीबी की मेमोरी साइज लिमिट होती है, जो डेटा और फील्ड्स की संख्या के आधार पर सैकड़ों हजारों से लाखों प्रविष्टियों के ऑर्डर पर डेटा सेट होगा । अधिकांश प्रयोगशालाओं में इस परिमाण की प्रायोगिक आवश्यकताएं कभी नहीं होंगी, लेकिन यदि उन्होंने तब स्प्रेडशीट सॉफ्टवेयर वैसे भी अपनी प्रभावी सीमा से परे होगा। इसकी तुलना में, व्यापार स्तर के संबंधपरक डेटाबेस प्रबंधन प्रणालियां²⁹के साथ लाखों लेनदेन प्रसंस्करण करते हुए बड़े परिमाण के डेटा सेट को संभाल सकती हैं। कारण डेटाबेस आमतौर पर वैज्ञानिक प्रयोगशालाओं में इस्तेमाल नहीं कर रहे है का हिस्सा है कि पिछले प्रयोगों शायद ही कभी इस तरह के डेटा परिमाण की जरूरत है शिखा, तो आसान ी से उपयोग स्प्रेडशीट सॉफ्टवेयर के बजाय व्यापक हो गया । हालांकि, इन तरीकों को कार्य करने के लिए आवश्यक एक महत्वपूर्ण निवेश डेटा-पाइपलाइन की योजना बनाने और डेटाबेस(चित्रा 3 और चित्रा 4)का उपयोग करने के लिए एसक्यूएल सीखने के लिए आवश्यक है। हालांकि कोडिंग अनुभव प्रक्रिया को बहुत जल्दी करता है, अधिकांश को खरोंच से एसक्यूएल सीखने की आवश्यकता होगी। डेवलपर्स द्वारा व्यापक दस्तावेज के माध्यम से दस्तावेज का खजाना ऑनलाइन उपलब्ध है, साथ ही मुफ्त एसक्यूएल ट्यूटोरियल जैसे कि कोदशकी, W3Schools और एसक्यूएलबोल्ट^10,^11,^12। कुछ विकल्प जिन्हें सदस्यता की आवश्यकता होती है, हालांकि, कार्यक्रम शिक्षण वेबसाइट लिंडा³⁸जैसे मौजूद हैं; डेटाबेस मूल बातें के बारे में आगे पढ़ने ऑनलाइन पाया जा सकता है। एक अकादमिक सेटिंग में, अच्छी प्रयोगशाला खरीद-इन और मजबूत सिस्टम अपने रचनाकारों को मात दे सकते हैं और कई छात्रों में कई वर्षों की परियोजनाओं को सुविधाजनक बनाने में मदद कर सकते हैं। इसे सेटअप के दौरान दिशानिर्देशों और कार्यान्वयन चरणों के निर्माण के माध्यम से पूरा किया जा सकता है। दरअसल, एक अच्छी तरह से काम कर रहे संयुक्त डेटा पाइपलाइन और डेटाबेस प्रणाली होने में सभी शोधकर्ताओं के लिए उच्च मूल्य है ।

इस पद्धति के अन्य लाभों में कच्चे डेटा को संरचित प्रारूपों में परिवर्तित करने के लिए स्वचालित तरीकों को नियोजित करने की क्षमता, डेटाबेस के अंदर संग्रहीत एक बार उपयोग में आसानी, और डेटासेट(चित्रा 3)के निरंतर पुनः अपडेट करने और पुनर्एकत्रीकरण शामिल हैं। एक डेटा फ़ाइल से कई चर ों की जानकारी खींचना और प्रेरित होने पर ऐसा करने के लिए डेटा-पाइपलाइन को स्वचालित करना भी संभव है। दिखाए गए संदर्भ में, आमतौर पर उपलब्ध और किफायती सॉफ्टवेयर का उपयोग यह प्रदर्शित करने वाले परिणामों को प्राप्त करने के लिए किया जाता था कि एक कार्यात्मक डेटाबेस प्राप्त करने में महंगे और आला सॉफ्टवेयर पैकेज अनिवार्य नहीं हैं। अधिकांश प्रयोगशालाओं के अनुसंधान कोषों की सीमित पहुंच को देखते हुए, डेटाबेस प्रबंधन की दक्षता बढ़ाने की क्षमता एक अमूल्य वस्तु है ।

निष्कर्ष में, के रूप में वैज्ञानिक डेटा सेट और अधिक जटिल हो जाते हैं, डेटाबेस तेजी से वैज्ञानिक समुदाय के लिए और अधिक महत्वपूर्ण हो जाते है और महान क्षमता के रूप में आम के रूप में और भी डेटा के लिए वर्तमान व्यापक स्प्रेडशीट उपयोग से अधिक प्रभावी है भंडारण. डेटा पारदर्शिता और विज्ञान में प्रतिकृति के साथ मुद्दों को केवल भविष्य में विस्तार जारी रहेगा के रूप में डेटा सेट के लिए आकार और जटिलता में वृद्धि जारी है, डेटाबेस और स्वचालित डेटा पाइपलाइन तरीकों के अधिक व्यापक गोद लेने के महत्व पर प्रकाश डाला सामान्य वैज्ञानिक अब और भविष्य में जरूरतहै ।

संदर्भ संख्या	फाइल नाम	प्रकार
1	स्थानसूचक	पाइप लाइन कोड
2	स्थानसूचक कंपाइल.एम	पाइप लाइन कोड
3	LocationPointer_Remove_Duplicates	पाइप लाइन कोड
4	BadसूचकCheck.m	पाइप लाइन कोड
5	LocationPointer_Check	पाइप लाइन कोड
6	Manual_Pointer_Removal	पाइप लाइन कोड
7	Database_Generate	पाइप लाइन कोड
8	Cell_Lines.सीएसवी	हेल्पर टेबल
9	Data_Types.सीएसवी	हेल्पर टेबल
10	Pattern_Types.सीएसवी	हेल्पर टेबल
11	DataLocation_Comp_2018_6_26_10_01.सीएसवी	उदाहरण डेटा स्थान फ़ाइल
12	DataValues_2018_6_26_10_02.सीएसवी	उदाहरण डेटा वैल्यूफ़ाइल
13	Database_Queries.accdb	उदाहरण डेटाबेस

तालिका 1: प्रोटोकॉल चलाने के लिए अपलोड की जा सकने वाली सभी उदाहरण फ़ाइलों की सूची।

फाइल चयनित	चर
सारांश.चटाई	दोषपूर्ण नाभिक का अनुपात
	सभी न्यूक्लिकी क्षेत्र औसत (μm2)
	दोषपूर्ण न्यूक्लिकी क्षेत्र औसत (μm2)
	सामान्य नाभिक क्षेत्र औसत (μm2)
	सभी नाभिक सनक औसत
	दोषपूर्ण नाभिक सनक औसत
	सामान्य नाभिक सनक औसत
	सभी नाभिक एमएनसी औसत
	दोषपूर्ण न्यूक्लिकी एमएनसी औसत
	सामान्य न्यूक्लिकी एमएनसी औसत
Act_OOP.चटाई	ऐक्टिन ओओपी
Act_OOP.चटाई	ऐक्टिन ओओपी डायरेक्टर एंगल
Fibro_OOP चटाई	फिब्रोनेक्टिन ओओपी
Fibro_OOP चटाई	फिब्रोनेक्टिन ओओपी निदेशक कोण
Nuc_OOP.चटाई	नाभिक ओओपी
Nuc_OOP.चटाई	न्यूक्लिआई ओओपी निदेशक कोण

तालिका 2: सूचीबद्ध चुनिंदा फ़ाइलें जो कोशिका नाभिक मापन या फाइब्रोब्लास्ट संरचनात्मक (ओओपी) डेटा के विभिन्न चरों के अनुरूप हैं।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों के पास खुलासा करने के लिए कुछ नहीं है ।

Acknowledgments

इस काम को राष्ट्रीय हृदय, फेफड़े और रक्त संस्थान द्वारा राष्ट्रीय स्वास्थ्य संस्थानों में, अनुदान संख्या R01 HL129008 द्वारा समर्थित है। लेखक विशेष रूप से अध्ययन में उनकी भागीदारी के लिए LMNA जीन उत्परिवर्तन परिवार के सदस्यों का शुक्रिया अदा करते हैं । हम भी सेल संस्कृति के साथ उसकी सहायता के लिए लिंडा मैककार्थी शुक्रिया अदा करना चाहते है और प्रयोगशाला रिक्त स्थान को बनाए रखने, सेल इमेजिंग और नाभिक डेटा विश्लेषण में उसकी भागीदारी के लिए Nasam Chokr, और माइकल ए Grosberg हमारे प्रारंभिक माइक्रोसॉफ्ट का उपयोग डेटाबेस की स्थापना के साथ ही अंय तकनीकी सवालों का जवाब देने के साथ अपनी प्रासंगिक सलाह के लिए ।

Materials

Name	Company	Catalog Number	Comments
4',6'-diaminodino-2-phenylinodole (DAPI)	Life Technologies, Carlsbad, CA
Alexa Fluor 488 Phalloidin	Life Technologies, Carlsbad, CA
Alexa Fluor 750 goat anti-rabbit	Life Technologies, Carlsbad, CA
digital CCD camera ORCAR2 C10600-10B	Hamamatsu Photonics, Shizuoka Prefecture, Japan
fibronectin	Corning, Corning, NY
IX-83 inverted motorized microscope	Olympus America, Center Valley, PA
Matlab R2018b	Mathworks, Natick, MA
MS Access	Microsoft, Redmond, WA
paraformaldehyde (PFA)	Fisher Scientific Company, Hanover Park, IL
polycloncal rabbit anti-human fibronectin	Sigma Aldrich Inc., Saint Louis, MO
polydimethylsiloxane (PDMS)	Ellsworth Adhesives, Germantown, WI
Prolong Gold Antifade	Life Technologies, Carlsbad, CA
rectangular glass coverslips	Fisher Scientific Company, Hanover Park, IL
Triton-X	Sigma Aldrich Inc., Saint Louis, MO

DOWNLOAD MATERIALS LIST

References

Cavin, R. K., Lugli, P., Zhirnov, V. V. Science and engineering beyond Moore's law. Proceedings of the IEEE. 100, Special Centennial Issue 1720-1749 (2012).
Mast, F. D., Ratushny, A. V., Aitchison, J. D. Systems cell biology. The Journal of Cell Biology. 206 (6), 695-706 (2014).
Barone, L., Williams, J., Micklos, D. Unmet needs for analyzing biological big data: A survey of 704 NSF principal investigators. PLoS Computational Biology. 13 (10), 1005755 (2017).
Gandomi, A., Haider, M. Beyond the hype: Big data concepts, methods, and analytics. International Journal of Information Management. 35 (2), 137-144 (2015).
Siddiqa, A., et al. A survey of big data management: Taxonomy and state-of-the-art. Journal of Network and Computer Applications. 71, 151-166 (2016).
Anderson, C. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. Wired Magazine. , (2008).
Broman, K. W., Woo, K. H. Data Organization in Spreadsheets. The American Statistician. 72 (1), 2-10 (2018).
Lee, H., et al. How I do it: a practical database management system to assist clinical research teams with data collection, organization, and reporting. Academic Radiology. 22 (4), 527-533 (2015).
Bassil, Y. A comparative study on the performance of the Top DBMS systems. Journal of Computer Science & Research. 1 (1), 20-31 (2012).
Learn SQL - Codeacademy. , Available from: https://www.codecademy.com/learn/learn-sql (2018).
SQL Tutorial - w3schools.com. , Available from: https://www.w3schools.com/sql (2018).
Introduction to SQL - SQLBolt. , Available from: https://sqlbolt.com (2018).
Pedersen, T. B., Jensen, C. S. Multidimensional database technology. Computer. 34 (12), 40-46 (2001).
Győrödi, C., Gyorodi, R., Sotoc, R. A Comparative Study of Relational and Non-Relational Database Models in a Web- Based Application. International Journal of Advanced Computer Science and Applications. 6 (11), 78-83 (2015).
Nayak, A., Poriya, A., Poojary, D. Type of NOSQL databases and its comparison with relational databases. International Journal of Applied Information Systems. 5 (4), 16-19 (2013).
Lei, C., Feng, D., Wei, C., Ai-xin, Z., Zhen-hu, C. The application of multidimensional data analysis in the EIA database of electric industry. Procedia Environmental Sciences. 10, 1210-1215 (2011).
Soranno, P. A., et al. Building a multi-scaled geospatial temporal ecology database from disparate data sources: fostering open science and data reuse. GigaScience. 4, 28 (2015).
Edwards, P. Questionnaires in clinical trials: guidelines for optimal design and administration. Trials. 11, 2 (2010).
Richards, M. A., et al. MediaDB: A Database of Microbial Growth Conditions in Defined Media. PLoS ONE. 9 (8), 103548 (2014).
Core, J. Q., et al. Age of heart disease presentation and dysmorphic nuclei in patients with LMNA mutations. PLoS ONE. 12 (11), 0188256 (2017).
Drew, N. K., Johnsen, N. E., Core, J. Q., Grosberg, A. Multiscale Characterization of Engineered Cardiac Tissue Architecture. Journal of Biomechanical Engineering. 138 (11), 111003 (2016).
Zaragoza, M. V., et al. Exome Sequencing Identifies a Novel LMNA Splice-Site Mutation and Multigenic Heterozygosity of Potential Modifiers in a Family with Sick Sinus Syndrome, Dilated Cardiomyopathy, and Sudden Cardiac Death. PLoS ONE. 11 (5), 0155421 (2016).
Zaragoza, M., Nguyen, C., Widyastuti, H., McCarthy, L., Grosberg, A. Dupuytren's and Ledderhose Diseases in a Family with LMNA-Related Cardiomyopathy and a Novel Variant in the ASTE1 Gene. Cells. 6 (4), 40 (2017).
Zaragoza, M. V., Hakim, S. A., Hoang, V., Elliott, A. M. Heart-hand syndrome IV: a second family with LMNA-related cardiomyopathy and brachydactyly. Clinical Genetics. 91 (3), 499-500 (2017).
Eriksson, M., et al. Recurrent de novo point mutations in lamin A cause Hutchinson-Gilford progeria syndrome. Nature. 423 (6937), 293-298 (2003).
Drew, N. K., Eagleson, M. A., Baldo, D. B., Parker, K. K., Grosberg, A. Metrics for Assessing Cytoskeletal Orientational Correlations and Consistency. PLoS Computational Biology. 11 (4), 1004190 (2015).
Hamley, I. W. Introduction to Soft Matter: Synthetic and Biological Self-Assembling Materials. , John Wiley & Sons. Hoboken, NJ. (2013).
Grosberg, A., Alford, P. W., McCain, M. L., Parker, K. K. Ensembles of engineered cardiac tissues for physiological and pharmacological study: Heart on a chip. Lab Chip. 11 (24), 4165-4173 (2011).
Hey, T., Trefethen, A. The Data Deluge: An e-Science Perspective. Grid Computing: Making the Global Infrastructure a Reality. Berman, F., Fox, G., Hey, A. J. G. , John Wiley & Sons. Hoboken, NJ. Ch. 36 (2003).
Wardle, M., Sadler, M. How to set up a clinical database. Practical Neurology. 16 (1), 70-74 (2016).
Kerr, W. T., Lau, E. P., Owens, G. E., Trefler, A. The future of medical diagnostics: large digitized databases. The Yale Journal of Biology and Medicine. 85 (3), 363 (2012).
Laulederkind, S. J., et al. The Rat Genome Database curation tool suite: a set of optimized software tools enabling efficient acquisition, organization, and presentation of biological data. Database. 2011, (2011).
Harris, P. A., et al. Research electronic data capture (REDCap)--a metadata-driven methodology and workflow process for providing translational research informatics support. Journal of Biomedical Informatics. 42 (2), 377-381 (2009).
Panko, R. R. What we know about spreadsheet errors. Journal of Organizational and End User Computing (JOEUC). 10 (2), 15-21 (1998).
Ziemann, M., Eren, Y., El-Osta, A. Gene name errors are widespread in the scientific literature. Genome Biology. 17 (1), 177 (2016).
Enhancing Reproducibility through Rigor and Transparency. NIH. , Available from: https://grants.nih.gov/reproducibility/index.htm (2018).
Hofseth, L. J. Getting rigorous with scientific rigor. Carcinogenesis. 39 (1), 21-25 (2017).
SQL Training and Tutorials - Lynda.com. , Available from: https://www.lynda.com/SQL-training-tutorials/446-0.html (2018).

Bioengineering

ऊतक इंजीनियरिंग में मध्यम आकार, कम वेग, बहुआयामी डेटा का कुशलतापूर्वक प्रबंधन करने के लिए डेटाबेस

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.