Summary

ऊतक इंजीनियरिंग में मध्यम आकार, कम वेग, बहुआयामी डेटा का कुशलतापूर्वक प्रबंधन करने के लिए डेटाबेस

Published: November 22, 2019
doi:

Summary

कई शोधकर्ता “मध्यम आकार”, कम वेग और बहु-आयामी डेटा उत्पन्न करते हैं, जिन्हें स्प्रेडशीट के बजाय डेटाबेस के साथ अधिक कुशलता से प्रबंधित किया जा सकता है। यहां हम बहु-आयामी डेटा की कल्पना करने, संबंधपरक डेटाबेस संरचनाओं में तालिकाओं को जोड़ने, अर्ध-स्वचालित डेटा पाइपलाइनों का मानचित्रण करने और डेटा अर्थ को स्पष्ट करने के लिए डेटाबेस का उपयोग करने सहित डेटाबेस का वैचारिक अवलोकन प्रदान करते हैं।

Abstract

विज्ञान प्रगति के लिए तेजी से जटिल डेटा सेट पर निर्भर करता है, लेकिन स्प्रेडशीट कार्यक्रमों जैसे आम डेटा प्रबंधन विधियां बढ़ते पैमाने और इस जानकारी की जटिलता के लिए अपर्याप्त हैं। जबकि डेटाबेस प्रबंधन प्रणालियों में इन मुद्दों को सुधारने की क्षमता है, वे आमतौर पर व्यापार और सूचना के क्षेत्रों के बाहर उपयोग नहीं किए जाते हैं। फिर भी, कई शोध प्रयोगशालाएं पहले से ही “मध्यम आकार”, कम वेग, बहु-आयामी डेटा उत्पन्न करती हैं जो समान प्रणालियों को लागू करने से बहुत लाभान्वित हो सकती हैं। इस लेख में, हम एक वैचारिक अवलोकन प्रदान करते हैं जिसमें यह समझाया गया है कि डेटाबेस कैसे कार्य करते हैं और ऊतक इंजीनियरिंग अनुप्रयोगों में वे क्या फायदे प्रदान करते हैं। एक विशिष्ट प्रयोगात्मक संदर्भ में उदाहरणों को समझाने के लिए लैमिन ए/सी उत्परिवर्तन वाले व्यक्तियों से संरचनात्मक फाइब्रोब्लास्ट डेटा का उपयोग किया गया था । उदाहरणों में बहुआयामी डेटा की कल्पना करना, रिलेशनल डेटाबेस संरचना में तालिकाओं को जोड़ना, कच्चे डेटा को संरचित प्रारूपों में बदलने के लिए अर्ध-स्वचालित डेटा पाइपलाइन का मानचित्रण करना और क्वेरी के अंतर्निहित वाक्यकर को समझाना शामिल है। डेटा का विश्लेषण करने से परिणाम विभिन्न व्यवस्थाओं और महत्व के भूखंडों को बनाने के लिए इस्तेमाल किया गया था हचिनसन-गिलफोर्ड प्रोजेरिया, एक प्रसिद्ध लैमिनोपैथी, और अन्य सभी प्रयोगात्मक समूहों के सकारात्मक नियंत्रण के बीच गठबंधन वातावरण में सेल संगठन में प्रदर्शन किया गया था। स्प्रेडशीट की तुलना में, डेटाबेस विधियां अत्यधिक समय कुशल थीं, एक बार स्थापित होने के बाद उपयोग करने के लिए सरल थीं, मूल फ़ाइल स्थानों की तत्काल पहुंच और डेटा कठोरता में वृद्धि के लिए अनुमति दी गई थीं। प्रायोगिक कठोरता पर राष्ट्रीय स्वास्थ्य संस्थानों (NIH) के जोर के जवाब में, यह संभावना है कि कई वैज्ञानिक क्षेत्रों अंततः जटिल डेटा को प्रभावी ढंग से व्यवस्थित करने के लिए अपनी मजबूत क्षमता के कारण आम अभ्यास के रूप में डेटाबेस को अपनाना होगा ।

Introduction

एक ऐसे युग में जहां वैज्ञानिक प्रगति प्रौद्योगिकी द्वारा भारी है, बड़ी मात्रा में डेटा को संभालना सभी विषयों में अनुसंधान का एक अभिन्न पहलू बन गया है । कम्प्यूटेशनल बायोलॉजी और जीनोमिक्स जैसे नए क्षेत्रों का उद्भव यह रेखांकित करता है कि प्रौद्योगिकी का सक्रिय उपयोग कितना महत्वपूर्ण हो गया है । मूर के कानून और तकनीकी प्रगति1,2से प्राप्त स्थिर प्रगति के कारण ये रुझान जारी रहना निश्चित है । हालांकि, एक परिणाम उत्पन्न डेटा की बढ़ती मात्रा है जो पहले व्यवहार्य संगठन विधियों की क्षमताओं से अधिक है। यद्यपि अधिकांश अकादमिक प्रयोगशालाओं में जटिल डेटा सेट ों को संभालने के लिए पर्याप्त कम्प्यूटेशनल संसाधन होते हैं, लेकिन कई समूहों के पास आवश्यकताओं के विकास के लिए अनुकूल कस्टम सिस्टम के निर्माण के लिए आवश्यक तकनीकी विशेषज्ञता की कमी होती है3। इस तरह के डेटा सेट का प्रबंधन और अद्यतन करने का कौशल होना कुशल कार्यप्रवाह और आउटपुट के लिए महत्वपूर्ण बना हुआ है। डेटा और विशेषज्ञता के बीच अंतर को पाटना कुशलतापूर्वक हैंडलिंग, फिर से अपडेट करने और बहुआयामी डेटा के व्यापक स्पेक्ट्रम का विश्लेषण करने के लिए महत्वपूर्ण है।

बड़े डेटा सेट को संभालते समय स्केलेबिलिटी एक आवश्यक विचार है। उदाहरण के लिए, बिग डेटा अनुसंधान का एक समृद्ध क्षेत्र है जिसमें भारी मात्रा, बड़ी विषमता और पीढ़ी की उच्च दरों जैसे ऑडियो और वीडियो4,5की विशेषता वाले डेटा प्रसंस्करण से नई अंतर्दृष्टि का खुलासा करना शामिल है। संगठन और विश्लेषण के स्वचालित तरीकों का उपयोग करना इस क्षेत्र के लिए डेटा के टोरेंट को उचित रूप से संभालने के लिए अनिवार्य है। बड़े डेटा में उपयोग किए जाने वाले कई तकनीकी शब्दों को स्पष्ट रूप से परिभाषित नहीं किया गया है, हालांकि, और भ्रामक हो सकते हैं; उदाहरण के लिए, “उच्च वेग” डेटा अक्सर प्रति दिन लाखों नई प्रविष्टियों से जुड़ा होता है जबकि “कम वेग” डेटा केवल प्रति दिन सैकड़ों प्रविष्टियां हो सकती हैं, जैसे कि अकादमिक प्रयोगशाला सेटिंग में। हालांकि वहां कई रोमांचक निष्कर्ष अभी तक बड़े डेटा का उपयोग कर की खोज की है, ज्यादातर अकादमिक प्रयोगशालाओं गुंजाइश, शक्ति की आवश्यकता नहीं है, और अपने स्वयं के वैज्ञानिक सवालों को संबोधित करने के लिए इस तरह के तरीकों की जटिलता5। हालांकि यह संदेह नहीं है कि वैज्ञानिक डेटा6समय के साथ तेजी से जटिल बढ़ता है, कई वैज्ञानिकों को संगठन के तरीकों का उपयोग करना जारी है कि अब उनके विस्तार डेटा की जरूरत को पूरा । उदाहरण के लिए, सुविधाजनक स्प्रेडशीट कार्यक्रमों का उपयोग अक्सर वैज्ञानिक डेटा को व्यवस्थित करने के लिए किया जाता है, लेकिन लंबे समय तक7,8में अस्केलेबल, त्रुटि प्रवण और समय अक्षम होने की कीमत पर। इसके विपरीत, डेटाबेस समस्या का एक प्रभावी समाधान है क्योंकि वे स्केलेबल, अपेक्षाकृत सस्ते और चल रही परियोजनाओं के विभिन्न डेटा सेटों को संभालने में उपयोग करने में आसान हैं।

डेटा संगठन के स्कीमों पर विचार करते समय उत्पन्न होने वाली तत्काल चिंताएं प्रशिक्षण और उपयोग के लिए लागत, पहुंच और समय निवेश हैं। अक्सर व्यापार सेटिंग्स में इस्तेमाल किया, डेटाबेस कार्यक्रम अधिक किफायती हैं, या तो अपेक्षाकृत सस्ती या मुक्त किया जा रहा है, बड़े डेटा सिस्टम के उपयोग का समर्थन करने के लिए आवश्यक धन से । वास्तव में, वाणिज्यिक रूप से उपलब्ध और ओपन सोर्स सॉफ्टवेयर दोनों की एक किस्म ओरेकल डेटाबेस, माईक्यूएल और माइक्रोसॉफ्ट (एमएस) एक्सेस9जैसे डेटाबेस बनाने और बनाए रखने के लिए मौजूद है। कई शोधकर्ताओं को भी जानने के लिए प्रोत्साहित किया जाएगा कि कई एमएस कार्यालय अकादमिक संकुल एमएस का उपयोग के साथ आते हैं, आगे लागत विचार ों को कम । इसके अलावा, लगभग सभी डेवलपर्स ऑनलाइन व्यापक दस्तावेज प्रदान करते हैं और शोधकर्ताओं को संरचित क्वेरी भाषा (एसक्यूएल)10,11,12को समझने और उपयोग करने में मदद करने के लिए कोदशकी, W3Schools और SQLBolt जैसे मुफ्त ऑनलाइन संसाधनों की अधिकता है। किसी भी प्रोग्रामिंग भाषा की तरह, एसक्यूएल का उपयोग करके डेटाबेस और कोड का उपयोग करने का तरीका सीखना मास्टर करने में समय लगता है, लेकिन पर्याप्त संसाधनों के साथ प्रक्रिया सरल और निवेश किए गए प्रयास के लायक है।

डेटाबेस डेटा पहुंच और एकत्रीकरण में आसानी बढ़ाने के लिए शक्तिशाली उपकरण हो सकते हैं, लेकिन यह समझना महत्वपूर्ण है कि कौन से डेटा को संगठन के अधिक नियंत्रण से सबसे अधिक लाभ होगा। बहु-आयामीता उन स्थितियों की संख्या को संदर्भित करती है जिनके खिलाफ माप को समूहीकृत किया जा सकता है, और कई अलग-अलग स्थितियों का प्रबंधन करते समय डेटाबेस सबसे शक्तिशाली होतेहैं। इसके विपरीत, स्प्रेडशीट कार्यक्रम का उपयोग करके कम आयामीता के साथ जानकारी सबसे सरल है; उदाहरण के लिए, वर्षों से युक्त डेटा सेट और प्रत्येक वर्ष के लिए मूल्य में केवल एक संभव समूह (वर्षों के विरुद्ध माप)। नैदानिक सेटिंग्स जैसे उच्च आयामी डेटा को प्रभावी ढंग से बनाए रखने के लिए मैनुअल संगठन की एक बड़ी डिग्री की आवश्यकता होगी, स्प्रेडशीटकार्यक्रमों 13के दायरे से परे एक थकाऊ और त्रुटि-प्रवण प्रक्रिया। गैर-संबंधपरक (NoSQL) डेटाबेस भी मुख्य रूप से उन अनुप्रयोगों में विभिन्न भूमिकाओं को पूरा करते हैं जहां डेटा पंक्तियों और कॉलम14में अच्छी तरह से व्यवस्थित नहीं होता है। अक्सर खुले स्रोत होने के अलावा, इन संगठनात्मक स्कीमों में ग्राफिकल संघ, समय श्रृंखला डेटा या दस्तावेज़-आधारित डेटा शामिल हैं। NoSQL SQL से बेहतर स्केलेबिलिटी में उत्कृष्टता प्राप्त करता है, लेकिन जटिल प्रश्न नहीं बना सकता है, इसलिए संबंधपरक डेटाबेस उन स्थितियों में बेहतर होते हैं जिन्हें स्थिरता, मानकीकरण और निराला बड़े पैमाने पर डेटा परिवर्तन की आवश्यकता होती है15। डेटाबेस प्रभावी ढंग से समूहीकृत करने और डेटा को फिर से अपडेट करने में सबसे अच्छे हैं , जो अक्सर वैज्ञानिक सेटिंग्स13,16में आवश्यक संरचनाओं की बड़ी सरणी में होते हैं ।

इसलिए, इस काम का मुख्य उद्देश्य वैज्ञानिक समुदाय को “मध्यम आकार” के लिए स्केलेबल डेटा प्रबंधन प्रणालियों के रूप में डेटाबेस की क्षमता के बारे में सूचित करना है, कम वेग डेटा के साथ-साथ रोगी सोर्स सेल-लाइन प्रयोगों के विशिष्ट उदाहरणों का उपयोग करके एक सामान्य टेम्पलेट प्रदान करना है। इसी तरह के अन्य अनुप्रयोगों में नदी के बिस्तरों के भू-स्थानिक डेटा, देशीयनैदानिक अध्ययनों से प्रश्नावली और विकास मीडिया17,18,19में माइक्रोबियल वृद्धि की स्थिति शामिल है। यह काम कच्चे डेटा को संरचित प्रारूपों में परिवर्तित करने के लिए आवश्यक डेटा-पाइपलाइन के साथ मिलकर डेटाबेस के निर्माण की सामान्य बातों और उपयोगिता पर प्रकाश डालता है। एसक्यूएल में डेटाबेस के लिए डेटाबेस इंटरफेस और कोडिंग की मूल बातें प्रदान की जाती हैं और उदाहरणों के साथ सचित्र हैं ताकि दूसरों को बुनियादी ढांचे के निर्माण के लिए लागू ज्ञान प्राप्त करने की अनुमति मिल सके। अंत में, एक नमूना प्रयोगात्मक डेटा सेट दर्शाता है कि विभिन्न तरीकों से बहुआयामी डेटा को एकत्र करने के लिए डेटाबेस को कितनी आसानी से और प्रभावी ढंग से डिज़ाइन किया जा सकता है। यह जानकारी अपनी प्रायोगिक जरूरतों के लिए डेटाबेस को लागू करने की दिशा में रास्ते पर साथी वैज्ञानिकों की सहायता के लिए संदर्भ, टीका और टेम्पलेट्स प्रदान करती है।

एक अनुसंधान प्रयोगशाला सेटिंग में एक स्केलेबल डेटाबेस बनाने के प्रयोजनों के लिए, मानव फाइब्रोब्लास्ट कोशिकाओं का उपयोग कर प्रयोगों से डेटा पिछले तीन वर्षों में एकत्र किया गया था । इस प्रोटोकॉल का प्राथमिक ध्यान कंप्यूटर सॉफ्टवेयर के संगठन पर रिपोर्ट करना है ताकि उपयोगकर्ता को सबसे अधिक लागत और समय-कुशल तरीके से डेटा को एकत्र करने, अद्यतन करने और प्रबंधित करने में सक्षम बनाया जा सके, लेकिन प्रासंगिक प्रायोगिक विधियां भी प्रदान की जाती हैं संदर्भ.

प्रायोगिक सेटअप
नमूनों को तैयार करने के लिए प्रायोगिक प्रोटोकॉल को पहले20,21वर्णित किया गया है, और यहां संक्षेप में प्रस्तुत किया गया है। पॉलीडिमेथिलसिलॉक्सेन (पीडीएमएस) और क्यूरिंग एजेंट के 10:1 मिश्रण के साथ स्पिन-कोटिंग आयताकार ग्लास कवरस्लिप द्वारा निर्माण तैयार किए गए थे, फिर 0.05 मिलीग्राम/एमएल फाइब्रोनेक्टिन, या तो असंगठित (आइसोट्रोपिक) या 5 माइक्रोमीटर गैप माइक्रोपैटर्न्ड व्यवस्थाओं (लाइनों) के साथ 20 माइक्रोमीटर लाइनों में लागू किया गया था। फाइब्रोब्लास्ट कोशिकाओं को इष्टतम घनत्व पर कवरस्लिप पर 7 (या सकारात्मक नियंत्रण के लिए 16 मार्ग) पर वरीयता प्राप्त की गई थी और 24 घंटे के बाद मीडिया के साथ 48 एच के लिए बढ़ने के लिए छोड़ दिया गया था। इसके बाद कोशिकाओं को 4% पैराफॉर्मलडिहाइड (पीएफए) समाधान और 0.0005% nonionic सर्फेक्टेंट का उपयोग करके तय किया गया था, इसके बाद सेल न्यूक्लिकी (4′,6′-डिमिनोडिनिनो-2-फेनिलिनोडोल [डीएपीआई]), ऐक्टिन (एलेक्सा फ्लोर 488 फेलोइडिन), और फाइब्रोनेक्टिन (पॉलीक्लोनकल खरगोश एंटी-ह्यूमन फाइब्रोनेक्टिन) के लिए कवरस्लिप इम्यूनोदाग किया जा रहा है। बकरी विरोधी खरगोश IgG एंटीबॉडी (एलेक्सा फ्लोर ७५० बकरी विरोधी खरगोश) का उपयोग कर फाइब्रोनेक्टिन के लिए एक माध्यमिक दाग लागू किया गया था और संरक्षण एजेंट फ्लोरोसेंट लुप्त होती को रोकने के लिए सभी कवरस्लिप पर मुहिम शुरू की गई थी । नेल पॉलिश माइक्रोस्कोप स्लाइड पर कवरस्लिप सील करने के लिए इस्तेमाल किया गया था तो 24 घंटे के लिए सूखी छोड़ दिया है ।

फ्लोरेसेंस छवियों के रूप में पहले20 वर्णित एक डिजिटल चार्ज युग्मित डिवाइस (सीसीडी) एक उल्टे मोटरीकृत माइक्रोस्कोप पर घुड़सवार कैमरे के साथ मिलकर किया गया । देखने के दस बेतरतीब ढंग से चयनित क्षेत्रों 40x आवर्धन पर प्रत्येक कवरस्लिप के लिए छवि थे, एक ६.२२ पिक्सल/μm संकल्प के अनुरूप । कस्टम-लिखित कोड का उपयोग न्यूक्लिकी, ऐक्टिन फिलामेंट्स और फाइब्रोनेक्टिन का वर्णन करने वाली छवियों से विभिन्न चरों की मात्रा निर्धारित करने के लिए किया गया था; इसी मूल्यों के साथ-साथ संगठन और ज्यामिति मापदंडों को डेटा फ़ाइलों में स्वचालित रूप से सहेजा गया था।

सेल लाइनें
सभी नमूना डेटा सेल लाइनों पर अधिक व्यापक प्रलेखन पूर्वप्रकाशनों 20में पाया जा सकता है । संक्षेप में वर्णन करने के लिए, डेटा संग्रह को मंजूरी दे दी गई थी और यूसी इरविन इंस्टीट्यूशनल रिव्यू बोर्ड (आईआरबी # 2014-1253) के अनुसार सूचित सहमति दी गई थी। मानव फाइब्रोब्लास्ट कोशिकाओं को लैमिन ए/सी(एलएमएनए)जीन उत्परिवर्तन के विभिन्न विविधताओं के तीन परिवारों से एकत्र किया गया: हेटेरोजिगौस एलएमएना स्प्लिस-साइट उत्परिवर्तन (c.357-2A>G)22 (परिवार ए); LMNA बकवास उत्परिवर्तन (c.736 सीएंडटी, pQ246X) एक्सोन 423 (परिवार बी) में; और LMNA गलत अर्थ उत्परिवर्तन (c.1003C>t, pR335W) एक्सोन ६२४ (परिवार सी) में । प्रत्येक परिवार के अन्य व्यक्तियों से संबंधित उत्परिवर्तन-नकारात्मक नियंत्रण के रूप में फाइब्रोब्लास्ट कोशिकाओं को भी एकत्र किया गया था, जिसे “नियंत्रण” के रूप में जाना जाता है, और अन्य को असंबंधित उत्परिवर्तन-नकारात्मक नियंत्रण के रूप में खरीदा गया था, जिसे “दानदाता” के रूप में जाना जाता है। एक सकारात्मक नियंत्रण के रूप में, हचिनसन-ग्लिफोर्ड प्रोजेरिया (एचजीपीएस) के साथ एक व्यक्ति से फाइब्रोब्लास्ट कोशिकाओं को खरीदा गया था और एक 8 वर्षीय महिला रोगी से ली गई त्वचा बायोप्सी से उगाया गया था, जिसमें एचजीपीएस के साथ एलएमएनए G608G पॉइंट म्यूटेशन25था । कुल मिलाकर, 22 व्यक्तियों से फाइब्रोब्लास्ट का परीक्षण किया गया और इस काम में डेटा के रूप में उपयोग किया गया।

डेटा प्रकार
फाइब्रोब्लास्ट डेटा दो श्रेणियों में से एक में गिर गया: सेलुलर न्यूक्लिकी चर (यानी, डिस्मॉर्फिक नाभिक का प्रतिशत, नाभिक का क्षेत्र, नाभिक सनक का क्षेत्र)20 या संरचनात्मक चर ओरिएंटेशनल ऑर्डर पैरामीटर (ओओपी)21,26,27 (यानी, ऐक्टिन ओओपी, फाइब्रोनेक्टिन ओओपी, न्यूक्लिकओओपी) से उपजी। यह पैरामीटर सभी अभिविन्यास वेक्टर के मीन ऑर्डर टेंपर के अधिकतम ईजेनवैल्यू के बराबर है, और इसे पिछले प्रकाशनों26,28में विस्तार से परिभाषित किया गया है। इन मूल्यों को विभिन्न प्रकार की संभावित संरचनाओं में एकत्रित किया जाता है, जैसे आयु के खिलाफ मूल्य, लिंग, रोग की स्थिति, कुछ लक्षणों की उपस्थिति आदि। इन चरों का उपयोग कैसे किया जाता है, इसके उदाहरण परिणाम अनुभाग में पाए जा सकते हैं।

उदाहरण कोड और फ़ाइलें
ऊपर दिए गए डेटा के आधार पर उदाहरण कोड और अन्य फाइलों को इस पेपर के साथ डाउनलोड किया जा सकता है, और उनके नाम और प्रकार तालिका 1में संक्षेप में दिए जाते हैं।

Protocol

नोट: इस प्रोटोकॉल में उपयोग किए जाने वाले सॉफ़्टवेयर संस्करणों के लिए सामग्री की तालिका देखें। 1. मूल्यांकन करें कि डेटा डेटा बेसबेस संगठन योजना से लाभान्वित होगा या नहीं उदाहरण क?…

Representative Results

डेटा की बहुआयामीतायहां प्रस्तुत उदाहरण डेटा-सेट के संदर्भ में, विधियों अनुभाग में वर्णित विषयों को हृदय रोग पैदा करने वाले एलएमनए उत्परिवर्तन (“रोगियों”), संबंधित गैर-उत्परिवर्तन नकारात्म?…

Discussion

प्रोटोकॉल की तकनीकी चर्चा
डेटाबेस के उपयोग पर विचार करते समय पहला कदम यह मूल्यांकन करना है कि डेटा को ऐसे संगठन से लाभ होगा या नहीं।

अगला आवश्यक कदम एक स्वचालित कोड बनाना है जो उपयोगक?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

इस काम को राष्ट्रीय हृदय, फेफड़े और रक्त संस्थान द्वारा राष्ट्रीय स्वास्थ्य संस्थानों में, अनुदान संख्या R01 HL129008 द्वारा समर्थित है। लेखक विशेष रूप से अध्ययन में उनकी भागीदारी के लिए LMNA जीन उत्परिवर्तन परिवार के सदस्यों का शुक्रिया अदा करते हैं । हम भी सेल संस्कृति के साथ उसकी सहायता के लिए लिंडा मैककार्थी शुक्रिया अदा करना चाहते है और प्रयोगशाला रिक्त स्थान को बनाए रखने, सेल इमेजिंग और नाभिक डेटा विश्लेषण में उसकी भागीदारी के लिए Nasam Chokr, और माइकल ए Grosberg हमारे प्रारंभिक माइक्रोसॉफ्ट का उपयोग डेटाबेस की स्थापना के साथ ही अंय तकनीकी सवालों का जवाब देने के साथ अपनी प्रासंगिक सलाह के लिए ।

Materials

4',6'-diaminodino-2-phenylinodole (DAPI) Life Technologies, Carlsbad, CA
Alexa Fluor 488 Phalloidin Life Technologies, Carlsbad, CA
Alexa Fluor 750 goat anti-rabbit Life Technologies, Carlsbad, CA
digital CCD camera ORCAR2 C10600-10B Hamamatsu Photonics, Shizuoka Prefecture, Japan
fibronectin Corning, Corning, NY
IX-83 inverted motorized microscope Olympus America, Center Valley, PA
Matlab R2018b Mathworks, Natick, MA
MS Access Microsoft, Redmond, WA
paraformaldehyde (PFA) Fisher Scientific Company, Hanover Park, IL
polycloncal rabbit anti-human fibronectin Sigma Aldrich Inc., Saint Louis, MO
polydimethylsiloxane (PDMS) Ellsworth Adhesives, Germantown, WI
Prolong Gold Antifade Life Technologies, Carlsbad, CA
rectangular glass coverslips Fisher Scientific Company, Hanover Park, IL
Triton-X Sigma Aldrich Inc., Saint Louis, MO

References

  1. Cavin, R. K., Lugli, P., Zhirnov, V. V. Science and engineering beyond Moore’s law. Proceedings of the IEEE. 100, 1720-1749 (2012).
  2. Mast, F. D., Ratushny, A. V., Aitchison, J. D. Systems cell biology. The Journal of Cell Biology. 206 (6), 695-706 (2014).
  3. Barone, L., Williams, J., Micklos, D. Unmet needs for analyzing biological big data: A survey of 704 NSF principal investigators. PLoS Computational Biology. 13 (10), 1005755 (2017).
  4. Gandomi, A., Haider, M. Beyond the hype: Big data concepts, methods, and analytics. International Journal of Information Management. 35 (2), 137-144 (2015).
  5. Siddiqa, A., et al. A survey of big data management: Taxonomy and state-of-the-art. Journal of Network and Computer Applications. 71, 151-166 (2016).
  6. Anderson, C. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. Wired Magazine. , (2008).
  7. Broman, K. W., Woo, K. H. Data Organization in Spreadsheets. The American Statistician. 72 (1), 2-10 (2018).
  8. Lee, H., et al. How I do it: a practical database management system to assist clinical research teams with data collection, organization, and reporting. Academic Radiology. 22 (4), 527-533 (2015).
  9. Bassil, Y. A comparative study on the performance of the Top DBMS systems. Journal of Computer Science & Research. 1 (1), 20-31 (2012).
  10. . Learn SQL – Codeacademy Available from: https://www.codecademy.com/learn/learn-sql (2018)
  11. . SQL Tutorial – w3schools.com Available from: https://www.w3schools.com/sql (2018)
  12. . Introduction to SQL – SQLBolt Available from: https://sqlbolt.com (2018)
  13. Pedersen, T. B., Jensen, C. S. Multidimensional database technology. Computer. 34 (12), 40-46 (2001).
  14. Győrödi, C., Gyorodi, R., Sotoc, R. A Comparative Study of Relational and Non-Relational Database Models in a Web- Based Application. International Journal of Advanced Computer Science and Applications. 6 (11), 78-83 (2015).
  15. Nayak, A., Poriya, A., Poojary, D. Type of NOSQL databases and its comparison with relational databases. International Journal of Applied Information Systems. 5 (4), 16-19 (2013).
  16. Lei, C., Feng, D., Wei, C., Ai-xin, Z., Zhen-hu, C. The application of multidimensional data analysis in the EIA database of electric industry. Procedia Environmental Sciences. 10, 1210-1215 (2011).
  17. Soranno, P. A., et al. Building a multi-scaled geospatial temporal ecology database from disparate data sources: fostering open science and data reuse. GigaScience. 4, 28 (2015).
  18. Edwards, P. Questionnaires in clinical trials: guidelines for optimal design and administration. Trials. 11, 2 (2010).
  19. Richards, M. A., et al. MediaDB: A Database of Microbial Growth Conditions in Defined Media. PLoS ONE. 9 (8), 103548 (2014).
  20. Core, J. Q., et al. Age of heart disease presentation and dysmorphic nuclei in patients with LMNA mutations. PLoS ONE. 12 (11), 0188256 (2017).
  21. Drew, N. K., Johnsen, N. E., Core, J. Q., Grosberg, A. Multiscale Characterization of Engineered Cardiac Tissue Architecture. Journal of Biomechanical Engineering. 138 (11), 111003 (2016).
  22. Zaragoza, M. V., et al. Exome Sequencing Identifies a Novel LMNA Splice-Site Mutation and Multigenic Heterozygosity of Potential Modifiers in a Family with Sick Sinus Syndrome, Dilated Cardiomyopathy, and Sudden Cardiac Death. PLoS ONE. 11 (5), 0155421 (2016).
  23. Zaragoza, M., Nguyen, C., Widyastuti, H., McCarthy, L., Grosberg, A. Dupuytren’s and Ledderhose Diseases in a Family with LMNA-Related Cardiomyopathy and a Novel Variant in the ASTE1 Gene. Cells. 6 (4), 40 (2017).
  24. Zaragoza, M. V., Hakim, S. A., Hoang, V., Elliott, A. M. Heart-hand syndrome IV: a second family with LMNA-related cardiomyopathy and brachydactyly. Clinical Genetics. 91 (3), 499-500 (2017).
  25. Eriksson, M., et al. Recurrent de novo point mutations in lamin A cause Hutchinson-Gilford progeria syndrome. Nature. 423 (6937), 293-298 (2003).
  26. Drew, N. K., Eagleson, M. A., Baldo, D. B., Parker, K. K., Grosberg, A. Metrics for Assessing Cytoskeletal Orientational Correlations and Consistency. PLoS Computational Biology. 11 (4), 1004190 (2015).
  27. Hamley, I. W. . Introduction to Soft Matter: Synthetic and Biological Self-Assembling Materials. , (2013).
  28. Grosberg, A., Alford, P. W., McCain, M. L., Parker, K. K. Ensembles of engineered cardiac tissues for physiological and pharmacological study: Heart on a chip. Lab Chip. 11 (24), 4165-4173 (2011).
  29. Hey, T., Trefethen, A., Berman, F., Fox, G., Hey, A. J. G. The Data Deluge: An e-Science Perspective. Grid Computing: Making the Global Infrastructure a Reality. , (2003).
  30. Wardle, M., Sadler, M. How to set up a clinical database. Practical Neurology. 16 (1), 70-74 (2016).
  31. Kerr, W. T., Lau, E. P., Owens, G. E., Trefler, A. The future of medical diagnostics: large digitized databases. The Yale Journal of Biology and Medicine. 85 (3), 363 (2012).
  32. Laulederkind, S. J., et al. The Rat Genome Database curation tool suite: a set of optimized software tools enabling efficient acquisition, organization, and presentation of biological data. Database. 2011, (2011).
  33. Harris, P. A., et al. Research electronic data capture (REDCap)–a metadata-driven methodology and workflow process for providing translational research informatics support. Journal of Biomedical Informatics. 42 (2), 377-381 (2009).
  34. Panko, R. R. What we know about spreadsheet errors. Journal of Organizational and End User Computing (JOEUC). 10 (2), 15-21 (1998).
  35. Ziemann, M., Eren, Y., El-Osta, A. Gene name errors are widespread in the scientific literature. Genome Biology. 17 (1), 177 (2016).
  36. Enhancing Reproducibility through Rigor and Transparency. NIH Available from: https://grants.nih.gov/reproducibility/index.htm (2018)
  37. Hofseth, L. J. Getting rigorous with scientific rigor. Carcinogenesis. 39 (1), 21-25 (2017).
  38. . SQL Training and Tutorials – Lynda.com Available from: https://www.lynda.com/SQL-training-tutorials/446-0.html (2018)
check_url/60038?article_type=t

Play Video

Cite This Article
Ochs, A. R., Mehrabi, M., Becker, D., Asad, M. N., Zhao, J., Zaragoza, M. V., Grosberg, A. Databases to Efficiently Manage Medium Sized, Low Velocity, Multidimensional Data in Tissue Engineering. J. Vis. Exp. (153), e60038, doi:10.3791/60038 (2019).

View Video