Bioengineering

Doku Mühendisliğinde Orta Ölçekli, Düşük Hız, Çok Boyutlu Verileri Verimli Bir Şekilde Yönetecek Veritabanları

Published: November 22, 2019 doi: 10.3791/60038

Alexander R. Ochs^1,2, Mehrsa Mehrabi^1,2, Danielle Becker^1,2, Mira N. Asad^1,2, Jing Zhao^1,2, Michael V. Zaragoza^3,4, Anna Grosberg^1,2,5,6,7

¹Department of Biomedical Engineering, University of California, Irvine, ²The Edwards Lifesciences Center for Advanced Cardiovascular Technology, University of California, Irvine, ³Pediatrics-Genetics & Genomics Division-School of Medicine, University of California, Irvine, ⁴Biological Chemistry-School of Medicine, University of California, Irvine, ⁵Department of Chemical and Biomolecular Engineering, University of California, Irvine, ⁶Center for Complex Biological Systems, University of California, Irvine, ⁷The NSF-Simons Center for Multiscale Cell Fate Research (CMCF), University of California, Irvine

Summary

Birçok araştırmacı, elektronik tablolar yerine veritabanları ile daha verimli bir şekilde yönetilebilen "orta ölçekli", düşük hız ve çok boyutlu veriler oluşturur. Burada, çok boyutlu verileri görselleştirme, ilişkisel veritabanı yapılarındaki tabloları bağlama, yarı otomatik veri ardışık lıklarının eşlemi nin eşleştirilmesi ve veri anlamlarının açıklığa kavuşturulması için veritabanını kullanma gibi veritabanlarının kavramsal bir genel görünümünü salıyoruz.

Abstract

Bilim ilerleme için giderek daha karmaşık veri kümeleri dayanır, ancak elektronik tablo programları gibi yaygın veri yönetimi yöntemleri büyüyen ölçek ve bu bilgilerin karmaşıklığı için yetersizdir. Veritabanı yönetim sistemleri bu sorunları giderme potansiyeline sahip olmakla birlikte, iş ve bilişim alanları dışında yaygın olarak kullanılmaz. Ancak, birçok araştırma laboratuvarı zaten büyük ölçüde benzer sistemlerin uygulanmasından yararlanabilir "orta ölçekli", düşük hız, çok boyutlu veri üretmek. Bu makalede, veritabanlarının nasıl işlediğini ve doku mühendisliği uygulamalarında sağladıkları avantajları açıklayan kavramsal bir genel bakış sayılmaktadır. Lamin A/C mutasyonu olan bireylerin yapısal fibroblast verileri belirli bir deneysel bağlamda örnekleri göstermek için kullanılmıştır. Örnekler arasında çok boyutlu verileri görselleştirmek, ilişkisel veritabanı yapısındaki tabloları bağlamak, ham verileri yapılandırılmış biçimlere dönüştürmek için yarı otomatik leştirilmiş bir veri ardışık lığı eşlemi ve sorgunun altında yatan sözdizimini açıklamak verilebilir. Verilerin analiz edilmesinden elde edilen sonuçlar, hücre organizasyonunda hutchinson-Gilford progeria, bilinen bir laminopati ve diğer tüm deneysel grupların pozitif kontrolü arasındaki uyumlu ortamlarda çeşitli düzenlemelerin ve önemin çizimlerinin oluşturulmasında kullanıldı. Elektronik tablolarla karşılaştırıldığında, veritabanı yöntemleri son derece verimliydi, bir kez ayarlandıktan sonra kullanımı basit, orijinal dosya konumlarına anında erişim eve izin verilen ve artan veri katılığı. Ulusal Sağlık Enstitüleri'nin (NIH) deneysel titizlik vurgusuna yanıt olarak, birçok bilimsel alanın karmaşık verileri etkili bir şekilde organize etme güçlü yetenekleri nedeniyle veritabanlarını ortak bir uygulama olarak benimsemesi olasıdır.

Introduction

Bilimsel ilerlemenin yoğun olarak teknoloji tarafından yürütüldüğü bir çağda, büyük miktarda veriyi işlemek tüm disiplinlerde araştırmanın ayrılmaz bir yüzü haline gelmiştir. Hesaplamalı biyoloji ve genomik gibi yeni alanların ortaya çıkması, teknolojinin proaktif kullanımının ne kadar kritik hale geldiğinin altını çizmektedir. Bu eğilimler Moore yasası ve sürekli ilerleme teknolojik gelişmeler 1^,²elde nedeniyle devam edeceği kesindir. Ancak bunun bir sonucu, daha önce uygulanabilir kuruluş yöntemlerinin yeteneklerini aşan artan veri miktarlarıdır. Çoğu akademik laboratuvar karmaşık veri kümelerini işlemek için yeterli hesaplama kaynaklarına sahip olmasına rağmen, birçok grup ihtiyaçları geliştirmeye uygun özel sistemler oluşturmak için gerekli teknik uzmanlığa sahip değildir^3. Bu tür veri kümelerini yönetme ve güncelleme becerilerine sahip olmak, verimli iş akışı ve çıktı için kritik öneme sahip olmaya devam etmektedir. Veri ve uzmanlık arasındaki boşluğu kapatmak, çok yönlü verilerin geniş bir yelpazesini verimli bir şekilde işlemek, yeniden güncellemek ve analiz etmek için önemlidir.

Ölçeklenebilirlik, büyük veri kümelerini işlerken göz önünde bulundurulması gereken bir konudur. Büyük veri, örneğin, büyük hacimleri, büyük heterojenlik ve ses ve video⁴gibi nesil yüksek oranları ile karakterize veri işleme yeni anlayışlar ifşa içeren araştırma gelişen bir alandır ,⁵. Bu alanın veri sellerini uygun şekilde işlemesi için otomatik organizasyon ve analiz yöntemlerinin kullanılması zorunludur. Ancak, büyük verilerde kullanılan birçok teknik terim açıkça tanımlanmamıştır ve kafa karıştırıcı olabilir; örneğin, "yüksek hız" verileri genellikle günde milyonlarca yeni girişle ilişkilendirilirken, "düşük hız" verileri akademik laboratuvar ortamında olduğu gibi günde yalnızca yüzlerce giriş olabilir. Henüz büyük veri kullanılarak keşfedilecek birçok heyecan verici bulgular olmasına rağmen, en akademik laboratuvarlar kapsam, güç ve kendi bilimsel soruları ele almak için bu tür yöntemlerin karmaşıklığı gerekmez⁵. Bilimsel verilerin^zamanlagiderek karmaşıklaşan 6, birçok bilim adamının artık genişleyen veri ihtiyaçlarını karşılamadan organizasyon yöntemlerini kullanmaya devam ettiği şüphe götürmez bir durumdur. Örneğin, uygun elektronik tablo programları sık sık bilimsel verileri düzenlemek için kullanılır, ancak ölçeklenebilir olma pahasına, hata eğilimli, ve uzun vadede verimsiz zaman⁷^,⁸. Tersine, veritabanları ölçeklenebilir, nispeten ucuz ve devam eden projelerin çeşitli veri kümelerini işleme kullanımında kullanımı kolay olduğu için soruna etkili bir çözümdür.

Veri organizasyonu şemaları göz önünde bulundurulduğunda ortaya çıkan acil endişeler eğitim ve kullanım için maliyet, erişilebilirlik ve zaman yatırımıdır. Sık sık iş ortamlarında kullanılan, veritabanı programları daha ekonomik, ya nispeten ucuz ya da ücretsiz, finansman büyük veri sistemlerinin kullanımını desteklemek için gerekli daha olmak. Aslında, Oracle Database, MySQL ve Microsoft (MS) Access⁹gibi veritabanları oluşturmak ve korumak için hem ticari hem de açık kaynak kodyazılım çeşitli vardır. Birçok araştırmacı da birkaç MS Office akademik paketleri MS Access dahil, daha fazla maliyet hususları en aza indirmek ile birlikte geldiğini öğrenmek için teşvik edilecektir. Ayrıca, hemen hemen tüm geliştiriciler kapsamlı belgeler online sağlamak ve codecademy, W3Schools ve SQLBolt gibi ücretsiz online kaynakların bir bolluk araştırmacılar anlamak ve yapılandırılmış sorgu dili (SQL)¹⁰^,¹¹^,¹²kullanmanıza yardımcı olmak tır. Herhangi bir programlama dili gibi, SQL kullanarak veritabanları ve kod kullanmayı öğrenmek ana zaman alır, ancak yeterli kaynakları mevcut süreç basit ve iyi yatırım çaba değer.

Veritabanları, veri erişilebilirliğini ve toplama kolaylığını artırmak için güçlü araçlar olabilir, ancak hangi verilerin daha fazla organizasyon denetiminden en çok yararlanacağını ayırt etmek önemlidir. Çok boyutluluk, bir ölçümün karşı gruplandırılabildiği koşullar sayısını ifade eder ve veritabanları birçok farklı koşulu yönetirken en güçlüdür^13. Tersine, düşük boyutlubilgi bir elektronik tablo programı kullanarak işlemek için basittir; örneğin, yıllar ve her yıl için bir değer içeren bir veri kümesi yalnızca bir olası gruplandırma (yıllara göre ölçümler) vardır. Klinik ayarlardan gibi yüksek boyutlu veriler etkili bir şekilde korumak için manuel organizasyon büyük bir dereceye gerektirir, elektronik tablo programları¹³kapsamı dışında sıkıcı ve hataya eğilimli bir süreç. İlişkisel olmayan (NoSQL) veritabanları da, öncelikle verilerin satır ve sütunlar^14'teiyi organize olmadığı uygulamalarda çeşitli rolleri yerine getirmektedir. Sık sık açık kaynak olmasının yanı sıra, bu kuruluş şemaları grafik çağrışımları, zaman serisi verileri veya belge tabanlı verileri içerir. NoSQL ölçeklenebilirlik SQL daha iyi excels, ancak karmaşık sorgular oluşturamazsınız, bu nedenle ilişkisel veritabanları tutarlılık, standardizasyon ve seyrek büyük ölçekli veri değişiklikleri¹⁵gerektiren durumlarda daha iyidir. Veritabanları etkili bir şekilde gruplandırma ve genellikle bilimsel ortamlarda¹³^,¹⁶gerekli konformasyonlar büyük dizi içine verileri yeniden güncelleme en iyisidir.

Bu çalışmanın temel amacı, bu nedenle, "orta ölçekli" için ölçeklenebilir veri yönetim sistemleri olarak veritabanlarının potansiyeli hakkında bilimsel topluluk bilgilendirmek için, düşük hız verileri yanı sıra hasta kaynaklı hücre hattı deneyleri belirli örnekler kullanarak genel bir şablon sağlamaktır. Diğer benzer uygulamalar nehir yatakları jeouzamsal verileri, uzunlamasına klinik çalışmalardan anketler ve büyüme medya mikrobiyal büyüme koşulları¹⁷^,¹⁸^,¹⁹içerir. Bu çalışma, ham verileri yapılandırılmış biçimlere dönüştürmek için gerekli olan veri aktarıcısıyla birleştiğinde bir veritabanı oluşturmanın yaygın husudlarını ve yararlarını vurgulamaktadır. SQL'deki veritabanları için veritabanı arabirimlerinin ve kodlamanın temelleri sağlanır ve başkalarının temel çerçeveler oluşturmak için geçerli olan bilgileri edinmelerini sağlayacak örneklerle gösterilmiştir. Son olarak, örnek bir deneysel veri kümesi, veritabanlarının çok yönlü verileri çeşitli şekillerde toplamak için ne kadar kolay ve etkili bir şekilde tasarlanabileceğini gösterir. Bu bilgiler, kendi deneysel ihtiyaçları için veritabanlarını uygulama yolunda diğer bilim adamlarına yardımcı olmak için bağlam, yorum ve şablonlar sağlar.

Bir araştırma laboratuvarı ortamında ölçeklenebilir bir veritabanı oluşturmak amacıyla, insan fibroblast hücreleri kullanarak deneylerden elde edilen veriler son üç yıl içinde toplanmıştır. Bu protokolün temel odak noktası, kullanıcının verileri mümkün olan en uygun maliyetli ve zamanında toplamasını, güncellemesini ve yönetmesini sağlamak için bilgisayar yazılımının organizasyonunu rapor etmektir, ancak ilgili deneysel yöntemler Bağlam.

Deneysel kurulum
Numune lerin hazırlanmasına yönelik deneysel protokol daha önce²⁰^,²¹olarak tanımlanmış ve burada kısaca sunulmuştur. Yapılar, 10:1 polidimetilsiloksane (PDMS) ve kürleme maddesi karışımı ile spin kaplama dikdörtgen cam kapaklar tarafından, daha sonra 0.05 mg/mL fibronectin uygulanarak, organize olmayan (izotropik) veya 5 μm boşluklu mikro desenli aranjmanlı (hat) 20 μm çizgilerle hazırlanmıştır. Fibroblast hücreleri optimum yoğunluklarda kapak lara 7 numaralı geçitte (veya pozitif kontroller için 16. geçitte) tohumlanmış ve 24 saat sonra ortam değiştirilmeküzere 48 saat boyunca büyümeye bırakılmıştır. Hücreler daha sonra %4 paraformaldehit (PFA) solüsyonu ve %0.0005 nonnik yüzey aktif madde kullanılarak sabitlendi, ardından kapaklar hücre çekirdeği (4',6'-diaminodinono-2-feninlinodole [DAPI]), aktin (Alexa Fluor 488 phalloidin) ve fibronektin (poliklonkal tavşan anti-fibronin) için immünosüllü idi. Keçi anti-tavşan IgG antikorları (Alexa Fluor 750 keçi anti-tavşan) kullanılarak fibronektin için ikincil bir leke uygulandı ve floresan solma önlemek için tüm kapak lar üzerine koruma maddesi monte edildi. Oje mikroskop slaytlar üzerine kapakları mühür lemek için kullanılan sonra 24 saat kurumaya bırakılır.

Floresan görüntüleri daha önce açıklandığı gibi elde edildi²⁰ bir 40x yağ daldırma amacı ile bir dijital şarj birleştiğinde cihaz (CCD) kamera ters motorlu mikroskop üzerine monte. Her coverslip için 6,22 piksel/μm çözünürlüğe karşılık gelen 40x büyütmede rastgele seçilen on görüntü alanı görüntülendi. Çekirdekleri, aktin filamentleri ve fibronektin'i açıklayan görüntülerden farklı değişkenleri ölçmek için özel yazılmış kodlar kullanılmıştır; ilgili değerlerin yanı sıra organizasyon ve geometri parametreleri, veri dosyalarına otomatik olarak kaydedildi.

Hücre hatları
Tüm örnek veri hücresi hatları hakkında daha kapsamlı belgeler önceki yayınlarda bulunabilir²⁰. Kısaca açıklamak için, veri toplama onaylandı ve uc Irvine Kurumsal İnceleme Kurulu (IRB # 2014-1253) uyarınca bilgilendirilmiş onayı yapıldı. İnsan fibroblast hücreleri lamin A/C(LMNA)gen mutasyonunun farklı varyasyonları olan üç aileden toplanmıştır: heterozigot LMNA splice-site mutasyonu (c.357-2A>G)²² (aile A); LMNA saçma mutasyonu (c.736 C>T, pQ246X) exon 4²³ (aile B); ve LMNA yanlış mutasyon (c.1003C>T, pR335W) exon 6²⁴ (aile C). Fibroblast hücreleri de ilgili mutasyon-negatif kontroller olarak her ailede diğer bireylerden toplandı, "Kontroller" olarak anılacaktır, ve diğerleri ilgisiz mutasyon-negatif kontroller olarak satın alındı, "Donörler" olarak anılacaktır. Olumlu bir kontrol olarak, Hutchinson-Gliford progeria (HGPS) olan bir bireyin fibroblast hücreleri satın alındı ve Bir LMNA G608G nokta mutasyonu sahip HGPS ile 8 yaşındaki bir kadın hastadan alınan bir deri biyopsisi büyüdü²⁵. Toplamda 22 kişiden gelen fibroblastlar test edilmiş ve bu çalışmada veri olarak kullanılmıştır.

Veri türleri
Fibroblast verileri iki kategoriden birine ayrılmıştır: hücresel çekirdek değişkenleri (yani, dismorfik çekirdeklerin yüzdesi, çekirdeklerin alanı, çekirdek eksantrikliği)²⁰ veya oryantasyonel sıra parametresinden kaynaklanan yapısal değişkenler (OOP)²¹^,^26,²⁷ (yani, actin OOP, fibronectin OOP, çekirdek oop). Bu parametre tüm yönlendirme vektörlerinin ortalama sıra tensörünün maksimum özdeğerine eşittir ve önceki yayınlarda ayrıntılı olarak tanımlanır²⁶^,²⁸. Bu değerler yaş, cinsiyet, hastalık durumu, belirli semptomların varlığı gibi çeşitli olası konformasyonlara toplanır. Bu değişkenlerin nasıl kullanıldığına örnekler sonuçlar bölümünde bulunabilir.

Örnek kodlar ve dosyalar
Yukarıdaki verilere dayalı örnek kodlar ve diğer dosyalar bu yazı ile indirilebilir ve bunların adları ve türleri Tablo 1'deözetlenmiştir.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOT: Bu protokolde kullanılan yazılım sürümleri için Malzeme Tablosu'na bakın.

1. Verilerin bir veritabanı organizasyon şemasından yararlanıp yararlanmayacağını değerlendirin

Örnek kodları ve veritabanlarını indirin (bkz. Tablo 1'deözetlenen Tamamlayıcı Kodlama Dosyaları).
İlgi alanı veri kümesinin "çok boyutlu" olup olmadığını değerlendirmek için Şekil 1'i kullanın.
NOT: Şekil 1, örnek veri kümesi için sağlanan çok boyutlu bir veritabanının grafik gösterimidir.
Veriler örnek gibi "çok boyutlu" bir biçimde görselleştirilebiliyorsa ve belirli bir deneysel sonucu herhangi bir boyutla ilişkilendirebilme yeteneği (örneğin, koşullar) mevcut veriler hakkında daha fazla bilimsel bilgi edinmesine olanak sağlayacaksa, ilişkisel bir veritabanı oluşturmak.

2. Veritabanı yapısını düzenleme

NOT: İlişkisel veritabanları bilgileri tablo biçiminde depolar. Tablolar, elektronik tablolara benzer şekilde satır ve sütun şemasında düzenlenir ve veritabanıiçindeki tanımlayıcı bilgileri bağlamak için kullanılabilir.

Veri dosyalarını düzenleyin, böylece benzersiz adlar iyi düşünebilsinler. Dosya adlandırma kuralları ve klasör alt klasör yapıları ile iyi uygulama, iyi yapıldığında, dosyaları el ile erişim okunabilirliğinden ödün vermeden geniş veritabanı ölçeklenebilirliği için izin verir. Tarih dosyalarını "20XX-YY-ZZ" gibi tutarlı bir biçimde ekleyin ve meta verilere göre alt klasörleri adlandırmak buna bir örnektir.
Veri tabanı yapısı tasarlanırken, farklı tablolardaki alanlar arasındaki ilişkileri çizin. Böylece, çok boyutluluk farklı alanları (yani tablolardaki sütunlar) tek tek tablolarla birbirine ilişkilendirerek ele alınır.
2.2 adımda oluşturulan veritabanını ve ilişkileri açıklayan readme belgeleri oluşturun. Farklı tablolar arasındaki bir giriş bağlandıktan sonra, ilişkili tüm bilgiler bu girişle ilişkilidir ve istenen bilgilere filtre lemek için karmaşık sorguları çağırmak için kullanılabilir.
NOT: Okuma belgeleri, yapıya tekdüze olmayan veriler eklemeden proje hakkında ek bilgi ve veritabanı yapısal bilgileri sağlamak için ortak bir çözümdür.
2.1−2.3 adımlarını takiben, sonuç, bireylerin farklı özelliklerinin(Şekil 2A)bu bireylerin ilişkili deneysel verileriyle ilişkili olduğu bu örneğe benzer hale getirin(Şekil 2B). Aynı durum, çeşitli steno gösterimlerini açıklamak için ana veri değerleri tablosundaki eşleşen girişlerle desen türlerinin(Şekil 2C)ve veri türlerinin(Şekil 2D)ilgili sütunları ile yapılmıştır ( Şekil2B).
Uzun menzilli veri toplama için kaydedilmesi gereken tüm temel ve yalnızca yararlı veri noktalarını belirleyin.
NOT: Daha önce de belirtildiği gibi, veritabanlarını elektronik tablo programları üzerinden kullanmanın önemli bir avantajı ölçeklenebilirliktir: ek veri noktaları herhangi bir noktada önemsiz bir şekilde eklenebilir ve ortalamalar gibi hesaplamalar yeni eklenen veri noktalarını yansıtacak şekilde anında güncelleştirilir.
1. Başlamadan önce farklı veri noktaları oluşturmak için gerekli bilgileri tanımlayın. Yeniden analizin mümkün ve erişilebilir olması için ham verileri değiştirme veya üzerinde tasarruf etmek yerine el değmemiş olarak bırakın.
  NOT: Verilen örnek için(Şekil 2),bir eye karşılık gelen "Tasarımcı", "Desen tipi", "Kapak #" ve "Değişken türü" ilişkili değerin ayrımı için tüm hayati alanlardır.
2. İstenirse, yapılan tekrarların sayısını belirtmek ve bu örnekte veri noktalarının eksik olup olmadığını belirlemeye yardımcı olmak için "Coverslips'in Toplam #ı" gibi yararlı, hayati olmayan diğer bilgileri ekleyin.

3. Boru hattını kurmak ve düzenlemek

Her veri türü için normal veri depolama uygulamalarıyla birlikte veri toplamaya yol açabilecek tüm çeşitli denemeleri ve veri çözümleme yöntemlerini belirleyin. Kullanıcı yükünü en aza indirirken gerekli tutarlılık ve sürüm denetimini sağlamak için GitHub gibi açık kaynak kodlu sürüm kontrol yazılımıyla çalışın.
Mümkünse, otomatik bir ardışık işlem için izin vermek için tutarlı adlandırma ve veri depolama yordamı oluşturun.
NOT: Örnekte, çıktıların tümü tutarlı bir şekilde adlandırıldı, böylece dosyalar seçildikten sonra belirli öznitelikleri arayan bir veri ardışık lığı oluşturuldu. Tutarlı adlandırma mümkün değilse, veritabanındaki tabloların el ile doldurulması gerekir, bu önerilmez.
Veritabanı için yeni veri girişleri oluşturmak için uygun programlama dilini kullanın.
1. Otomatik veri seçimine yol gösterebilecek ayrı dosyalarda küçük "yardımcı" tablolar (Tablo 1'de#8−#10 dosyaları) oluşturun. Bu dosyalar, ardışık alt altında çalışması için olanaklar şablonu olarak hizmet ve disesi kolaydır.
2. Veri ardışık alanı için yeni veri girişleri oluşturmak için(Şekil 3D),kodu (LocationPointer.m, Dosya #1 Tablo 1'de) programlayarak yardımcı tabloları kullanıcı tarafından seçilecek girişler olarak kullanın (Tablo 1'de#10 #8 dosyalar).
3. Buradan, yeni girişleri önceki girişlerle birleştirerek dosya konumlarının yeni bir elektronik tablosunu bir araya getirin(Şekil 3E). LocationPointerCompile.m'de gösterildiği gibi bu adımı otomatikleştirmek için bir kod oluşturun (Tablo 1'de#2).
4. Daha sonra, otomatik olarak kaldırılması gereken yinelenenler için bu birleştirilmiş elektronik tabloyu denetleyin. LocationPointer_Remove_Duplicates.m'de gösterildiği gibi bu adımı otomatikleştirmek için bir kod oluşturun (Tablo 1'de#3).
5. Ayrıca, elektronik tabloyu hatalariçin denetleyin ve kullanıcıya nedenlerini ve konumlarını bildirin (Şekil 3F). BadPointerCheck.m'de gösterildiği gibi bu adımı otomatikleştirmek için bir kod oluşturun (Tablo 1'dekidosya #4). Alternatif olarak, derlenen veritabanını denetleyecek ve LocationPointer_Check.m'de gösterildiği gibi yinelenenleri tek adımda tanımlayacak bir kod yazın (Tablo 1'de#5 dosya).
6. Manual_Pointer_Removal.m'de gösterildiği gibi veritabanının bütünlüğünü kaybetmeden kullanıcının kötü noktaları el ile kaldırmasına izin vermek için bir kod oluşturun (Tablo 1'de#6 dosya).
7. Daha sonra bir veri değeri elektronik tablosu(Şekil 3G, tablo 1'de#12 dosya) oluşturmak ve dosya konumlarını tanımlamak için erişilebilen veya gelecekteki girişlerle birleştirilebilen girişlerin en güncel listesini oluşturmak için dosya konumlarını kullanın(Şekil 3H). Database_Generate.m'de gösterildiği gibi bu adımı otomatikleştirmek için bir kod oluşturun (Tablo 1'dekidosya #7).
Daha önce açıklandığı gibi sıkı adlandırma kuralları, otomatik dosya derleme kodları ve otomatik hata denetimleri dahil olup olmadığını kontrol ederek boru hattı deneysel titizlik ekler çift kontrol edin.

4. Veritabanı ve sorgular oluşturma

NOT: Tablolar bilgileri veritabanlarında depolarsa, sorgular belirli ölçütler verilen bilgiler için veritabanına istekedilir. Veritabanıoluşturmak için iki yöntem vardır: boş bir belgeden başlayarak veya varolan dosyalardan başlayarak. Şekil 4, Şekil 2'degösterilen veritabanı ilişkilerini kullanarak çalıştırmak üzere tasarlanmış SQL sözdizimini kullanarak örnek bir sorgu gösterir.

Yöntem 1: Veritabanı ve sorguları oluştururken sıfırdan başlayarak
1. Boş bir veritabanı belgesi oluşturun.
2. Yardımcı tabloları (Tablo 1'deki#8−#10 dosyaları) Dış Veri seçerek yükleyin | Metin Dosyası Alma | Dosya'yı seçin (dosyalar #8−#10) | Sınırlandırılmış | İlk Satır İçerdiği Üstbilgi, Virgül | varsayılan bırakın | Kendi Birincil Anahtarımı Seçin (Hücre Hatları Için Atama Dosyası #8, Veri Türleri için Değişken Adı Dosya #9, Desen Türü Dosya için Pat Adı #10) | varsayılan bırakın | Bitir.
3. Dış Veri seçerek Veri değer tablosunu (Tablo 1'dekidosya #12) yükleyin | Metin Dosyası Alma | Dosyayı Seçin (dosya #12) | Sınırlandırılmış | İlk Satır İçerdiği Üstbilgi, Virgül | varsayılan bırakın | Access Birincil Anahtar Ekle | Tabloya Aktar: DataValues | Bitir.
4. Veritabanı Araçlarını seçerek ilişkileri oluşturma | İlişkiler | Tüm Tabloları panoya sürükleyin | İlişkileri Edit | Yeni Oluştur | DataValue alanlarını Yardımcı Tablo Atakanlarla eşleştirin | Eklem Tipi 3.
5. Oluştur'u seçin | Sorgu Tasarımı.
6. İlgili tüm tabloları seçin veya üst pencereye sürükleyin. Bu örnekte 'Hücre Çizgileri', 'Veri Değerleri', 'Veri Türleri' ve 'Desen Türü'. İlişkiler otomatik olarak önceki İlişki tasarımına göre ayarlanmalıdır.
7. İstenilen sonuçlar için sorgu sütunlarını doldurun, örneğin:
  1. Göster'e tıklayın | Toplamları.
  2. İlk sütunu doldurun (Tablo: Veri Değerleri, Alan: VeriVar, Toplam: GroupBy, Ölçütler: "Act_OOP"), ikinci sütun (Tablo: DataValues, Alan: PatVar, Toplam: GroupBy, Ölçütler: "Satırlar") ve üçüncü sütun (Tablo: Cell_Lines, Alan: Atalı, Toplam: GroupBy, Sıralama: Artan).
  3. Dördüncü sütunu doldurun (Tablo: Veri Değerleri, Alan: Parametre, Toplam: Ave), beşinci sütun (Tablo: Veri Değerleri, Alan: Parametre, Toplam: StDev) ve altıncı sütun (Tablo: Veri Değerleri, Alan: Parametre, Toplam: Sayı).
8. Sorguyu çalıştırın.
Alternatif olarak, sağlanan örnek veritabanını örnekler için bir temel olarak kullanın. Daha önce indirilen veritabanı dosyasını Database_Queries.accdb (Tablo 1'de#13 dosya) açın. Varolan tabloları ilgi alanı verileriyle değiştirerek şablon olarak kullanın.

5. Çıktı tablolarını anlamlılık analizi için istatistiksel bir yazılıma taşıma

Bu örnek deneysel veriler için, çeşitli koşullar arasındaki ortalama karşılaştırmalar için Tukey'nin testini kullanarak varyans (ANOVA) tek yönlü analizini kullanın.
NOT: p < 0.05 değerleri istatistiksel olarak anlamlı kabul edildi.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Verilerin çok boyutluluğu
Burada sunulan örnek veri seti bağlamında, Metodlar bölümünde açıklanan denekler, kalp hastalığına neden olan LMNA mutasyonu ("Hastalar"), ilişkili mutasyon dışı negatif kontroller ("Kontroller"), ilişkili olmayan mutasyon negatif kontroller ("Donörler") ve Hutchinson-Gilford progeria sendromu (HGPS) olan bir bireyi pozitif kontrol olarak üç aileden grupolarak ikiye ayrılmıştır²⁰. Kontroller ve Donörlerden elde edilen sonuçlar, lmna mutasyonlarının kolektif eksikliği göz önüne alındığında, genel bir Negatif Kontrol (N.C.) grubu olarak daha da gruplandırılabilir. Her deneğin hücre çizgisinde durum grubuna göre(Şekil 1 – koyu mavi eksen) bir "Mutasyon Durumu" vardı. Her deneyde deneklerin fibroblast hücreleri organize olmayan (Izotropik) veya mikro desenli (Çizgiler) fibronektin düzenlemeleri üzerine kültürlenmiş ve "Desen tipi"(Şekil 1 – turuncu eksen) koşulunu oluşturmuşlardır. Hücreler sabitlendikten, immünosülden geçirildikten ve görüntülendikten sonra, "Coverslip #" transkripsiyonu yapıldı, çünkü birden fazla deney (yani teknik çoğaltmalar) aynı bireyin hücreleri kullanılarak gerçekleşeceği için(Şekil 1 – açık yeşil eksen). Özel MATLAB kodları²⁰^,²¹ daha sonra hücre çekirdekleri veya doku organizasyon değişkenlerinin farklı yönlerini "Değişken tip" olarak ölçmek için kullanılmıştır(Şekil 1 – teal yeşil eksen). Bu üç faktör hücrelerin insan kaynağı ile ilişkilendirildi ve sonuç olarak "Mutasyon Durumu"na ek olarak "Aile"(Şekil 1 – koyu pembe eksen) ve "Biyopsi sırasında yaş"(Şekil 1 – koyu yeşil eksen) ile bağlantılıydı. Şekil 1'de yer almayan diğer boyutlar ise söz konusu bireyin "Sunum Yaşı", "Belirtiler", "Atasözü" ve "Cinsiyeti" idi. Burada verilen örnek, veri toplama için en az on olası boyutla sonuçlanır. Bu nedenle, bu örnek veriler ilişkisel veritabanları tarafından organizasyon için bir asal adaydır.

Şekil 1: LMNA mutasyon veri setinden çok boyutlu verilerin görselleştirilmesi. Tek bir küp " Değişken türü", "Desen türü" ve "Coverslip #" üç boyutu ile tanımlanır. Diğer boyutlar "Mutasyon Durumu", "Biyopsi Yaşı" (yıl) ve "Aile" eksenleri olarak gösterilir. Renkli etiketler, her bireyin küpü için biyopsi (yeşil sayılar) yaşı gibi gösterilen farklı eksenlere karşılık gelir. Burada, on olası boyuttan altısı deneysel veri noktalarının çok boyutluluklarını göstermek için kullanılır. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Boru hattının düzenlenmesi
Tüm dijital verilerin tahmini % 95'ine kadar ı^{yapılandırılmamış4,}ancak veritabanları için yapılandırılmış biçimler gereklidir. Yine de, veri ardışık için iyi bir otomatik yöntem oluşturmak son derece içeriğe bağlıdır.

Şekil 2: LMNA mutasyon veri seti içindeki tablo ve tasarım görünümü ilişkileri. İlişkisel veritabanları, bir tablodaki alanları başka bir tablodaki bilgilerle bağlama avantajına sahiptir ve bu da toplamanın hemen değiştirilebilirliğini sağlar. Buradaki örnek, farklı bilgilerin nasıl ilişkilendirilebileceğini görsel olarak göstermektedir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Bu örnekte, her denemeden toplanan görüntüler, sorumlu laboratuvar üyesinin tarihine ve baş harfine göre isimlendirilen klasörlerde, alt klasörler konu ve kapak numarası listelenmiştir. Boru hattı dosyaları Ek Kodlama Dosyaları'ndave akış şeması çiziminde özetlenmiştir (Şekil 3). Çeşitli denekler arasında çeşitli deneysel koşullardan farklı ölçümler bu floresan görüntülerden(Şekil 3A)özel kodlar kullanılarak ölçüldü (Şekil 3B)²⁰^,²¹. Örneğin, aktin oryantasyonel sıra parametresi²¹ phalloidin (Şekil 3A) ile boyanmış dokulardan çıkarılmış ve farklı bireylerden gelen fibroblastların organizasyonunu karşılaştırmak için kullanılmıştır. Kod çıktıları kaynak görüntülerle aynı klasöre kaydedildi (Şekil 3C).

Şekil 3: Genelleştirilmiş bir bağlamda ortak veri-ardışık ihtiyaçlar örneği. Kullanıcı girişleri ve otomatik kodlar kullanılarak önemli bilgiler elektronik tablo biçiminde biçimlendirilen yeni girişler oluşturuldu. Bu girişler en son dosya konum girişleri kümesiyle birleştirildi, hatalar denetlendi, sonra hem dosya konumlarının elektronik tablosu hem de veri değerlerinin elektronik tablosu olarak depolandı. Ölçek çubuğu = 20 μm. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

LMNA mutasyon veri setinde yeni bir ilişkinin tanımlanması
Çok sayıda olası konformasyon verildiğinde, el ile veri toplama yöntemlerini kullanarak yeni ilişkilerin nerede var olduğunu belirlemek zor olabilir. Bu özel bağlamda, oop²⁷kullanılarak ölçülen, birden fazla koşulda hücre altı aktin filamentlerin organizasyonu karşılaştırarak ilgilendi .

Şekil 4: SQL sözdizimini kullanan örnek bir sorgu. SELECT ve FROM deyimleri sorgu oluşturmak için gereksinimlerdir, ancak ek komutlar ve ölçütler genellikle dahildir. GROUP BY, verilerin nasıl toplandığına, HAVING veya WHERE deyimlerinin çıktıyı belirli ölçütleri karşılayan verilerle nasıl sınırlandırdığı konusunda açıklık sağlar ve ORDER BY çıktıların hangi sıraya göre düzenlenmesi gerektiğini gösterir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

OOP, tamamen izotropik dokuya karşılık gelen sıfıra normalleştirilmiş ve tamamen hizalanmış dokuya karşılık gelen anizotropik ortamlarda ki düzen derecesini ölçen matematiksel bir yapıdır. Veri seti ilk olarak desen tipine göre çizgiler(Şekil 5A) ve izotropik (Şekil 5B) koşullarına göre bölündü ve fibronektin mikrodesenleme doku organizasyonunu ağır etkilediği için çok farklı OOP'lara sahip olması bekleniyordu. İzotropik dokular karşılaştırılırken koşullar arasında anlamlı fark yoktu (Şekil 5B). Tersine, desenli dokular pozitif kontrol hücre hattında (HGPS) istatistiksel olarak daha az organize idi (Şekil 5A), ve bu ilişki veriler farklı gruplara toplandığında bile tutuldu(Şekil 5C). Aktin OOP ayrıca mutasyon durumu ve aile ile ayrılmış, klinik bir değişkene karşı agregasyon göstermek için biyopsi sırasında bireylerin yaşına(Şekil 5D)karşı çizilmiştir. Nükleer defektlerin aksine²⁰, aktin organizasyonu ile bireyin yaşı arasında bir ilişki yoktur (Şekil 5D). Sonuç olarak, Şekil 5'te gösterilen çizimler, aynı verilerin farklı kombinasyonlarda nasıl analiz edilebildiğini ve birden çok sınıfa giren verileri toplama görevinin veritabanları kullanılarak ne kadar kolay gerçekleştirilebileceğini göstermektedir.

Bu makalede, hasta kaynaklı fibroblastlardan elde edilen veriler mutasyon sonuçlarını belirlemek için koşullar arasında karşılaştırıldı. Her iki HGPS ve bu çalışmada üç aile potansiyel nükleer zarf bozmak LMNAbağlı hastalıklar olmasına rağmen, hgps bireylerin etkilenen birden fazla organ sistemleri var ise öncelikle kalp disfonksiyonu ile ilişkili belirtiler sergiler²²^,²³^,²⁴. Nitekim, bir HGPS hastası ndan kaynaklanan mikro desenli çevre hücrelerinin dikkate alınan diğer hücre hatlarının herhangi birinden istatistiksel olarak daha düşük aktin OOP değerine sahip olduğu düşünülürse(Şekil 5A,C). Bu durum, mutasyonun neden olduğu deri anormallikleri olan tek hasta olan HGPS hastaları dır. Aynı verileri farklı konformasyonlarda görüntülemek, çeşitli veri kümesinde bilimsel sorgulamaya ek bilgiler ve yollar sağlamak için de yararlıdır(Şekil 5).

Şekil 5: Aktin OOP değişkeninin koşulları arasındaki karşılaştırmalar. (A,B) gruplandırmaları dört ana koşula karşılık gelir: ilişkili olmayan negatif kontrol Donörleri, ilgili negatif kontrol Kontrolleri, üç aileden LMNA mutasyonu Hastaları ve pozitif kontrol HGPS. (C)tüm negatif kontroller (N.C.) kombine edildi ve hastalar aile (PA, PB, PC) ile ayrıldı. (D) Bu çalışma için toplanan biyopsi sırasında yaşa göre izotropik aktin OOP'un potansiyel bir grafiği, durum ve aile ile ayrılmıştır. Panel Ler A, C ve D çizgiler desenli dokular için çizilir, panel B izotropik dokular için çizilirken. P < 0.05 (*) panellerinin istatistiksel önemi A, C ve D panellerinde bulundu. B panelinde herhangi bir çift arasında bir anlam bulunamadı. Tüm hata çubukları veritabanı içinde hesaplanan standart sapmaları temsil eder. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Ek Kodlama Dosyaları. Bu dosyayı görüntülemek için lütfen buraya tıklayın (İndirmek için sağ tıklatın).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Protokolün teknik tartışması
Veritabanlarının kullanımını göz önünde bulundurarak ilk adım, verilerin böyle bir kuruluştan yararlanıp yararlanmayacağını değerlendirmektir.

Bir sonraki temel adım, kullanıcıdan minimum giriş isteyecek ve tablo veri yapısını oluşturacak otomatik bir kod oluşturmaktır. Örnekte, kullanıcı veri türü (hücre çekirdekleri veya yapısal ölçümler), hücre hatlarının konu taslesi ve seçili dosya sayısı kategorisini girmektedir. Daha sonra ilgili dosyalar kullanıcı tarafından seçilir(Tablo 2, sütun 1), satır girişleri otomatik olarak oluşturulur ve dosya içinde bulunan tüm değişkenlerle doldurulur(Tablo 2, sütun 2). Ayrıca, kodun esnek olması önemlidir, böylece başka bir deneysel giriş eklenmesi gerekiyorsa, kullanıcı döngüye devam etmeyi seçebilir; değilse, dosyalar kaydedilir ve döngü sona erer. Yeni girişler eklemenin, hataları denetlemenin ve bu adımda açıklanan dosya konumlarından elektronik tablonun biraraya getirmenin temel işlevleri, verimli bir veri aktarıcı kurulumu için çok önemlidir.

Veri ardışık düzene¤i oluşturulurken dosya konumlarÄ±nÄ±n kullanÄ±mÄ±nÄ±n deneysel sertliÄ i artÄ±rä±yor. Özellikle, veri değerleri için tüm dosya konumlarını listeleyen ilgili bir elektronik tabloya sahip olmak, kullanıcının herhangi bir veri noktasını ham verileri toplayan araştırmacının laboratuvar not defterine geri izlemesine olanak tanır. Yüzlerce ila on binlerce veri noktasıyla uğraşırken, daha fazla şeffaflık ve erişilebilirlik bir projenin ömrü boyunca paha biçilmezdir. Kullanıcıların yalnızca veri değerlerini depolamak yerine önce dosya konumlarını kaydetmeyi ve daha sonra veri için değerleri derlemeyi düşünmeleri önerilir.

Veritabanı oluşturulduktan sonra, başlamak için en basit yolu tasarım görünümü üzerinden sorguları programlamak tır. Kullanıcı, sağlanan şablonu (Tablo 1'dekidosya #13) başlangıç noktası olarak indirmeyi yararlı bulur. Alternatif olarak, bunlar doğrudan SQL dili üzerinden programlanabilir (Şekil 4).

Bilimsel tartışma
Bu makalenin amacı, veri kümesi ölçeklenebilirliği ve saydamlığı açıklayan bir veri ardışık lığı ve veritabanı nı içeren yöntemleri yaymaktır. Bu yöntemler, bilişim ve iş dışında yaygın olarak kullanılmaz, ancak biyolojik bağlamlarda çalışanlar için muazzam bir potansiyele sahiptir. Bilim bilgisayarlara daha fazla güvenmeye devam ettikçe, etkin yönetim sistemlerinin önemi de⁶^,²⁹yükselir. Veritabanları sıklıkla yüksek hacimli ve/veya yüksek hız uygulamaları için kullanılır ve özellikle klinik hasta popülasyonları^8,30^,³¹için kullanımı ile ilgili olarak literatürde iyi belirtilmiştir. Birkaç zaten rat genom veritabanı kürasyon araçları veya REDCap klinik ve çeviriaraştırma³²^,³³gibi belirli alanlar için inşa edilmiştir. Böylece, veritabanlarının kullanımı klinik^etki 8 veya büyük genomik veritabanları³²benimsenmiştir , ancak doku mühendisliği gibi diğer bilimsel disiplinlerde yaygın hale gelmiştir.

Elektronik tablo programlarını kullanarak giderek daha karmaşık hale gelen verilerin işlenmesi konuları uzun zamandır bilimsel topluluk içinde kabul edilmiştir³⁴. Bir çalışmada, tamamlayıcı dosyaları ile genomik dergi kağıtları yaklaşık% 20 hatalı tarihler³⁵dönüştürülür gen isimleri olduğunu bildirdi. Bu hatalar 2010'dan 2015'e kadar yılda ortalama %15 oranında artmış ve genomik kağıtların yıllık artışını yılda %4 olarak geride katmıştır. Doğa elektronik tablo programları sonuçların veya formül hesaplamalarının kolay doğrulanması için uygun olmadığı ndan, büyük miktarda veri içindeki tek tek hataları tanımlamak genellikle neredeyse imkansızdır. Yayınlanan makaleler bile hataların sıklığını azaltmak için bir girişim daha iyi elektronik tablo uygulamaları bilim adamları eğitmek için var⁷. Veritabanlarının en güçlü avantajlarından biri, otomatik yöntemler le hatanın azaltılması ve potansiyel olarak şüpheli verileri doğrulama yeteneğidir(Şekil 3).

Bu metodolojinin önemli bir sonucu veri analizinin artan titizliğidir. Verilerin tekrarlanabilirliğini artırmanın önemi NIH'nin yanı sıra diğer bilim adamları ve kurumlar tarafından da vurgulanmıştır³⁶^,³⁷. Her veritabanına karşılık gelen dosya konumlarının elektronik tablosuna sahip olarak, söz konusu deneyin laboratuvar not defterine kadar bir veri noktasını izlemek kolaydır(Şekil 3). Tek tek veri noktaları, veri-ardışık işlem sırasında otomatik hata taraması ile birleştiğinde bile, zaman zaman paha biçilmez olan ilgili dosya konumları kullanılarak hızlı bir şekilde tanımlanabilir ve elektronik olarak bulunabilir. Veri kümesi zaman içinde değiştirilse bile, en iyi yöntem, sorunların oluşması veya eski sürümlerin denetlenilmesi gerektiğinde tüm geçmiş dosyaların tutulmasını içerir. Yıkıcı olmayan bir şekilde çalışmak ve eski sürümleri veri ardışık alan içinde tutmak, artıklık yoluyla güvenlik oluşturur ve daha iyi sorun giderme sağlar.

Aynı veri-ardışık sistem gereksinimleri için kullanılabilecek kodlama dilleri kombinasyonu sayısız ilişkisel veritabanı yönetim sistemleri vardır. En uygun seçimler, kullanılan verilere ve içeriğe son derece bağlıdır; bazı uygulamalar ölçeklenebilirlik, esneklik, güvenilirlik ve diğer öncelikler⁹en iyi excel. Veritabanları hala teknik olarak sınırlı ölçekte olmasına rağmen, bellek sınırlarına ulaşmak çoğu bilimsel laboratuvarın kapsamı dışında kalır. Örneğin, bir MS Access veritabanı, veri ve alan sayısına bağlı olarak yüz binlerce ila milyonlarca giriş sırasına göre bir veri kümesi olacak 2 GB bellek boyutu sınırına sahiptir. Çoğu laboratuvarbu büyüklükte deneysel ihtiyaçları asla, ama onlar daha sonra elektronik tablo yazılımı zaten kendi etkili sınırlarının çok ötesinde olurdu. Buna karşılık, iş düzeyinde ilişkisel veritabanı yönetim sistemleri aynı anda²⁹işlemleri milyonlarca işlerken büyük büyüklükleri veri kümeleri işleyebilir. Veritabanlarının bilimsel laboratuvarlarda yaygın olarak kullanılmamasının bir nedeni de, geçmiş deneylerin nadiren bu tür veri büyüklüklerinin ihtiyaçlarını nitüre etmesi, bu nedenle kullanımı kolay elektronik tablo lama yazılımlarının yaygınlaşmasıdır. Ancak, bu yöntemlerin işlevini yerine getirmesi için gereken önemli bir yatırım, veri ardışık hattını planlamak ve veritabanlarını kullanmak için SQL öğrenmek için gereken zamandır kullanılan zamandır(Şekil 3 ve Şekil 4). Kodlama deneyimi işlemi büyük ölçüde hızlandırsa da, çoğu sıfırdan SQL öğrenmek gerekir. Dokümantasyon zenginliği geliştiriciler tarafından kapsamlı belgeler aracılığıyla online olarak kullanılabilir, yanı sıra Codecademy, W3Schools ve SQLBolt^10,¹¹^,¹²gibi ücretsiz SQL öğreticiler . Abonelik gerektiren bazı alternatifler var, ancak, program öğretim web sitesi Lynda³⁸gibi; veritabanı temelleri hakkında daha fazla okuma online bulunabilir. Akademik bir ortamda, iyi bir laboratuvar buy-in ve sağlam sistemler yaratıcıları daha uzun ömürlü ve birden fazla öğrenci arasında projelerin uzun yıllar kolaylaştırmak yardımcı olabilir. Bu, kurulum sırasında yönergeler ve uygulama adımları oluşturulması yla gerçekleştirilebilir. Gerçekten de, iyi işleyen bir ortak veri boru hattı ve veritabanı sistemine sahip tüm araştırmacılar için yüksek bir değer vardır.

Bu metodolojinin diğer yararları arasında ham verileri yapılandırılmış biçimlere dönüştürmek için otomatik yöntemler kullanabilme, veritabanında depolandıktan sonra kullanım kolaylığı ve veri kümelerinin sürekli olarak yeniden güncellenmesi ve yeniden toplanması yer almaktadır(Şekil 3). İstendiğinde birden çok değişkendeğerinde bilgiyi tek bir veri dosyasından çekmek ve veri ardışık hattını otomatikleştirmek de mümkündür. Gösterilen bağlamda, pahalı ve niş yazılım paketleri işlevsel bir veritabanı elde etmek için zorunlu olmadığını gösteren sonuçlar elde etmek için yaygın olarak kullanılabilir ve ekonomik yazılım kullanılmıştır. Çoğu laboratuvarın araştırma fonlarının sınırlı erişimi göz önüne alındığında, veritabanı yönetiminin verimliliğini artırma yeteneği paha biçilmez bir emtiadır.

Sonuç olarak, bilimsel veri setleri daha karmaşık hale geldikçe, veritabanları bilim dünyası için giderek daha önemli hale gelir ve veriler için mevcut yaygın elektronik tablo kullanımından daha yaygın ve daha etkili olma potansiyeline sahiptir. Depolama. Veri kümeleri boyut ve karmaşıklık olarak büyümeye devam ettikçe, veri verileri ve otomatik veri boru hattı yöntemlerinin daha yaygın benimsenmesinin önemini vurgulayarak, bilimde veri şeffaflığı ve çoğaltma ile ilgili sorunlar gelecekte de genişlemeye devam edecektir. şimdi ve gelecekte genel bilimsel ihtiyaçlar.

Referans Numarası	Dosya Adı	Türü
1	KonumPointer.m	Boru Hattı Kodu
2	YerPointerCompile.m	Boru Hattı Kodu
3	LocationPointer_Remove_Duplicates.m	Boru Hattı Kodu
4	BadPointerCheck.m	Boru Hattı Kodu
5	LocationPointer_Check.m	Boru Hattı Kodu
6	Manual_Pointer_Removal.00	Boru Hattı Kodu
7	Database_Generate.00	Boru Hattı Kodu
8	Cell_Lines.csv	Yardımcı Tablo
9	Data_Types.csv	Yardımcı Tablo
10	Pattern_Types.csv	Yardımcı Tablo
11	DataLocation_Comp_2018_6_26_10_01.csv	Örnek Veri Konum Dosyası
12	DataValues_2018_6_26_10_02.csv	Örnek Veri Değerleri Dosyası
13	Database_Queries.accdb	Örnek Veritabanı

Tablo 1: Protokolü çalıştırmak için yüklenebilecek tüm örnek dosyaların listesi.

Dosya Seçili	Değişken
Özet.mat	Kusurlu ÇekirdekLerin Oranı
	Tüm Çekirdek Ler Alanı Ortalaması (μm2)
	Arızalı Çekirdek Alanı Ortalaması (3m2)
	Normal Çekirdek Alanı Ortalaması (3m2)
	Tüm Çekirdek eksantriklik ortalaması
	Arızalı Çekirdek Eksantriklik Ortalaması
	Normal Çekirdek Eksantriklik Ortalaması
	Tüm Çekirdekler MNC Ortalaması
	Arızalı Çekirdekmit MNC Ortalaması
	Normal Çekirdekmin MNC Ortalaması
Act_OOP.mat	Aktin OOP
Act_OOP.mat	Actin OOP Direktörü Açı
Fibro_OOP.mat	Fibronectin OOP
Fibro_OOP.mat	Fibronectin OOP Direktörü Açısı
Nuc_OOP.mat	Çekirdek OOP
Nuc_OOP.mat	Nuclei OOP Direktörü Açısı

Tablo 2: Hücre çekirdeği ölçümlerinin veya fibroblast yapısal (OOP) verilerinin farklı değişkenlerine karşılık gelen listelenmiş seçili dosyalar.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarların açıklayacak bir şeyi yok.

Acknowledgments

Bu çalışma Ulusal Kalp, Akciğer ve Kan Enstitüsü tarafından Ulusal Sağlık Enstitüleri, hibe numarası R01 HL129008 tarafından desteklenir. Yazarlar özellikle lmna gen mutasyonu aile üyeleri çalışmaya katılımları için teşekkür ederiz. Ayrıca Linda McCarthy'ye hücre kültürü ve laboratuvar alanlarını koruma, nasam Chokr'a hücre görüntüleme ve çekirdek veri analizine katılımı ve Michael A. Grosberg'e ilk Microsoft Access veritabanımızı kurma ve diğer teknik soruları yanıtlama konusunda verdiği önemli tavsiye için teşekkür ederiz.

Materials

Name	Company	Catalog Number	Comments
4',6'-diaminodino-2-phenylinodole (DAPI)	Life Technologies, Carlsbad, CA
Alexa Fluor 488 Phalloidin	Life Technologies, Carlsbad, CA
Alexa Fluor 750 goat anti-rabbit	Life Technologies, Carlsbad, CA
digital CCD camera ORCAR2 C10600-10B	Hamamatsu Photonics, Shizuoka Prefecture, Japan
fibronectin	Corning, Corning, NY
IX-83 inverted motorized microscope	Olympus America, Center Valley, PA
Matlab R2018b	Mathworks, Natick, MA
MS Access	Microsoft, Redmond, WA
paraformaldehyde (PFA)	Fisher Scientific Company, Hanover Park, IL
polycloncal rabbit anti-human fibronectin	Sigma Aldrich Inc., Saint Louis, MO
polydimethylsiloxane (PDMS)	Ellsworth Adhesives, Germantown, WI
Prolong Gold Antifade	Life Technologies, Carlsbad, CA
rectangular glass coverslips	Fisher Scientific Company, Hanover Park, IL
Triton-X	Sigma Aldrich Inc., Saint Louis, MO

DOWNLOAD MATERIALS LIST

References

Cavin, R. K., Lugli, P., Zhirnov, V. V. Science and engineering beyond Moore's law. Proceedings of the IEEE. 100, Special Centennial Issue 1720-1749 (2012).
Mast, F. D., Ratushny, A. V., Aitchison, J. D. Systems cell biology. The Journal of Cell Biology. 206 (6), 695-706 (2014).
Barone, L., Williams, J., Micklos, D. Unmet needs for analyzing biological big data: A survey of 704 NSF principal investigators. PLoS Computational Biology. 13 (10), 1005755 (2017).
Gandomi, A., Haider, M. Beyond the hype: Big data concepts, methods, and analytics. International Journal of Information Management. 35 (2), 137-144 (2015).
Siddiqa, A., et al. A survey of big data management: Taxonomy and state-of-the-art. Journal of Network and Computer Applications. 71, 151-166 (2016).
Anderson, C. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. Wired Magazine. , (2008).
Broman, K. W., Woo, K. H. Data Organization in Spreadsheets. The American Statistician. 72 (1), 2-10 (2018).
Lee, H., et al. How I do it: a practical database management system to assist clinical research teams with data collection, organization, and reporting. Academic Radiology. 22 (4), 527-533 (2015).
Bassil, Y. A comparative study on the performance of the Top DBMS systems. Journal of Computer Science & Research. 1 (1), 20-31 (2012).
Learn SQL - Codeacademy. , Available from: https://www.codecademy.com/learn/learn-sql (2018).
SQL Tutorial - w3schools.com. , Available from: https://www.w3schools.com/sql (2018).
Introduction to SQL - SQLBolt. , Available from: https://sqlbolt.com (2018).
Pedersen, T. B., Jensen, C. S. Multidimensional database technology. Computer. 34 (12), 40-46 (2001).
Győrödi, C., Gyorodi, R., Sotoc, R. A Comparative Study of Relational and Non-Relational Database Models in a Web- Based Application. International Journal of Advanced Computer Science and Applications. 6 (11), 78-83 (2015).
Nayak, A., Poriya, A., Poojary, D. Type of NOSQL databases and its comparison with relational databases. International Journal of Applied Information Systems. 5 (4), 16-19 (2013).
Lei, C., Feng, D., Wei, C., Ai-xin, Z., Zhen-hu, C. The application of multidimensional data analysis in the EIA database of electric industry. Procedia Environmental Sciences. 10, 1210-1215 (2011).
Soranno, P. A., et al. Building a multi-scaled geospatial temporal ecology database from disparate data sources: fostering open science and data reuse. GigaScience. 4, 28 (2015).
Edwards, P. Questionnaires in clinical trials: guidelines for optimal design and administration. Trials. 11, 2 (2010).
Richards, M. A., et al. MediaDB: A Database of Microbial Growth Conditions in Defined Media. PLoS ONE. 9 (8), 103548 (2014).
Core, J. Q., et al. Age of heart disease presentation and dysmorphic nuclei in patients with LMNA mutations. PLoS ONE. 12 (11), 0188256 (2017).
Drew, N. K., Johnsen, N. E., Core, J. Q., Grosberg, A. Multiscale Characterization of Engineered Cardiac Tissue Architecture. Journal of Biomechanical Engineering. 138 (11), 111003 (2016).
Zaragoza, M. V., et al. Exome Sequencing Identifies a Novel LMNA Splice-Site Mutation and Multigenic Heterozygosity of Potential Modifiers in a Family with Sick Sinus Syndrome, Dilated Cardiomyopathy, and Sudden Cardiac Death. PLoS ONE. 11 (5), 0155421 (2016).
Zaragoza, M., Nguyen, C., Widyastuti, H., McCarthy, L., Grosberg, A. Dupuytren's and Ledderhose Diseases in a Family with LMNA-Related Cardiomyopathy and a Novel Variant in the ASTE1 Gene. Cells. 6 (4), 40 (2017).
Zaragoza, M. V., Hakim, S. A., Hoang, V., Elliott, A. M. Heart-hand syndrome IV: a second family with LMNA-related cardiomyopathy and brachydactyly. Clinical Genetics. 91 (3), 499-500 (2017).
Eriksson, M., et al. Recurrent de novo point mutations in lamin A cause Hutchinson-Gilford progeria syndrome. Nature. 423 (6937), 293-298 (2003).
Drew, N. K., Eagleson, M. A., Baldo, D. B., Parker, K. K., Grosberg, A. Metrics for Assessing Cytoskeletal Orientational Correlations and Consistency. PLoS Computational Biology. 11 (4), 1004190 (2015).
Hamley, I. W. Introduction to Soft Matter: Synthetic and Biological Self-Assembling Materials. , John Wiley & Sons. Hoboken, NJ. (2013).
Grosberg, A., Alford, P. W., McCain, M. L., Parker, K. K. Ensembles of engineered cardiac tissues for physiological and pharmacological study: Heart on a chip. Lab Chip. 11 (24), 4165-4173 (2011).
Hey, T., Trefethen, A. The Data Deluge: An e-Science Perspective. Grid Computing: Making the Global Infrastructure a Reality. Berman, F., Fox, G., Hey, A. J. G. , John Wiley & Sons. Hoboken, NJ. Ch. 36 (2003).
Wardle, M., Sadler, M. How to set up a clinical database. Practical Neurology. 16 (1), 70-74 (2016).
Kerr, W. T., Lau, E. P., Owens, G. E., Trefler, A. The future of medical diagnostics: large digitized databases. The Yale Journal of Biology and Medicine. 85 (3), 363 (2012).
Laulederkind, S. J., et al. The Rat Genome Database curation tool suite: a set of optimized software tools enabling efficient acquisition, organization, and presentation of biological data. Database. 2011, (2011).
Harris, P. A., et al. Research electronic data capture (REDCap)--a metadata-driven methodology and workflow process for providing translational research informatics support. Journal of Biomedical Informatics. 42 (2), 377-381 (2009).
Panko, R. R. What we know about spreadsheet errors. Journal of Organizational and End User Computing (JOEUC). 10 (2), 15-21 (1998).
Ziemann, M., Eren, Y., El-Osta, A. Gene name errors are widespread in the scientific literature. Genome Biology. 17 (1), 177 (2016).
Enhancing Reproducibility through Rigor and Transparency. NIH. , Available from: https://grants.nih.gov/reproducibility/index.htm (2018).
Hofseth, L. J. Getting rigorous with scientific rigor. Carcinogenesis. 39 (1), 21-25 (2017).
SQL Training and Tutorials - Lynda.com. , Available from: https://www.lynda.com/SQL-training-tutorials/446-0.html (2018).

Bioengineering

Doku Mühendisliğinde Orta Ölçekli, Düşük Hız, Çok Boyutlu Verileri Verimli Bir Şekilde Yönetecek Veritabanları

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.