Summary

Desen tabanlı arama Epigenomic verileri GeNemo kullanarak

Published: October 08, 2017
doi:

Summary

DNA dizisi verileri farklı olarak, epigenomic verileri kolayca metin tabanlı aramaları için tabi değil. Burada sunan GeNemo, bir web tabanlı Biyoinformatik aracı, yükseltilmiş sürüm desen tabanlı aramalar için benzerlikler epigenomic veri ansiklopedi DNA ile öğeler dahil olmak üzere kullanılabilir çevrimiçi veritabanları karşılaştırma yapmak için kullanılabilecek yordamları vardır kullanıcının veri.

Abstract

Güçlü metin tabanlı arama araçları için ile karşılaştırıldığında genomik veya veri sıralama RNA, desen tabanlı aramalar epigenomic ve diğer fonksiyonel genomik veri için geçerli yöntemleri çok sınırlıdır. GeNemo bu hedefe gerçekleştirir ilk online arama aracıdır. Kullanıcılar tarayıcı Genişletilebilir veri (yatak), tepeler ve önemli biçimleri onların fonksiyonel genomik veri giriş ve herhangi bir üç biçimden verileri için arama yapabilirsiniz. Kullanıcılar online veri kümeleri, çeşitli ansiklopedi ve DNA öğeleri (farklı epigenomic işaretleri, transkripsiyon faktörü bağlayıcı siteleri ve Kromatin temsil eden KODLA ile) seçerek karşı arama için veri türlerini belirtebilirsiniz hypersensitivities veya eriþebilirlik belirli hücre tipleri ve gelişim dönemleri ya da kısa ömürlü tür (fare veya insan). GeNemo desen tarayıcıda görüntülenebilir yanı sıra yatak dosya biçiminde indirilen giriş veri eşleme ile genomik bölgelerin listesini döndürür. Yükseltilmiş GeNemo grafik ekran geliştirdi, daha sağlam bir arayüze sahip ve artık hataları Kaliforniya Üniversitesi, Santa Cruz (UCSC) genom tarayıcı değişiklikler nedeniyle eğilimli değildir. Genel sorunlar için sorun giderme adımları ele alınmıştır. İşlevsel genomik veri miktarını katlanarak büyüyor gibi geliştirmek ve GeNemo gibi yeni bioinformatic araçları veri analizi ve yorumu için rafine bir kritik gerek yoktur.

Introduction

Son teknolojik gelişmeler epigenomic veya biyolojik anlayışlar ayıklamak için ilgili analitik araçlar geliştirme outpaced fonksiyonel genomik veri yatırım hızlı bir genişleme için izin vermiş. Kullanıcı tarafından oluşturulan veri veri yatırım ve özellikle de yeni bilgi için yol açabilecek desen eşleştirme için DNA ansiklopedi öğelerini (kodlama)1 projelerden karşı aramak için epigenomic verileri çözümlemek için önemli yollarından biridir. Örneğin, genom arasında benzerlikler tanımlanmış loci, iki farklı epigenomic işaretlerinin şekillerindeki tanımlayan Kromatin uyum ve transkripsiyon yönetmelik2 farklı moleküler oyuncular tarafından eylem koordine gösterebilir ,3,4.

DNA dizisi, epigenomic veri ağırlıklı olarak yoğunluklarda veya fonksiyonel genomik bölgeleri biçiminde var için geleneksel metin tabanlı arama motorları bu konuda etkisiz. Gene Nemo (Finding Nemo), olduğu gibi ayakta GeNemo, desen tabanlı aramalar5kullanarak bu karşılanmamış ihtiyaç gidermek üzere geliştirilmiştir. Kendi algoritması Markov zinciri Monte Carlo maksimizasyonu işlemi5kullanır. Kullanıcıların kendi veri almak veya yatırım ve arama online epigenomic veri dizisi benzerlikler desen tanımlamak için bir veri kümesi indirilen.

GeNemo geçerli sürümünü güncelleştirilmiş bir görüntü, daha sağlam ile University of California, Santa Cruz (UCSC) genom tarayıcı6, arabirimleri ve ikinci değişimler nedeniyle oluşan sorunları için daha az duyarlı. Özellikle, GeNemo’nın sonuçları sayfası UCSC Genom tarayıcı arayüzü dayalı için kullanılan, GeNemo geçerli sürümünü kendi sonuçları sayfası destekler ve sonuç olarak artık olumsuz UCSC Genom tarayıcı yapısal değişikliklerden etkilenir. GeNemo olarak bilinen veri kümelerinden büyük konsorsiyumlar arasında colocalized/benzer parçaları bulmak amacıyla bir sorgu protein bağlayıcı, Histon modifiye, Kromatin erişilebilirlik, topolojik etki alanları ve benzeri dahil olmak üzere herhangi bir genomik sinyal kullanabilirsiniz. Bu nedenle, farklı epigenomic veri ilgi ve büyük ölçekli genomik projelerinde oluşturulan bilinen veri arasındaki ilişkiyi araştırmayı önemli bir araçtır.

Protocol

Not: protokol her yerde duraklatıldı. 1. temel kurulum elde edilir bir yatak tepeleri biçimi veya genom girişine verileri içeren önemli 7 dosya. Dosya uzantısı adı olması gerekir " Yatak ", " broadpeaks " " narrowpeaks ", veya " önemli " sırasıyla. ​ Not: Bu tür dosyaları sıkıştırılmış sürümleri de çalışacak. İçin genemo.org gitmek için bir Internet tarayıcısı kullanın. Herhangi bir işletim sistemi en yaygın internet tarayıcıları çalıştırabilen GeNemo kullanmak mümkün olmalıdır. Hangi tür açılır menüsünü kullanarak karşı aramak için seçin. Şu anda kullanılabilir türler ve insan içerir fare. Bir url veya doğrudan yükleme kullanarak upload kullanıcı dosyası. Önemli iş sadece url upload yöntemi ile dosyaları. YATAK ve tepeler format dosyaları iş (kıpırdatmak dosyaları yüklenemiyor bugün itibariyle ana veri olarak) her iki yöntem ile. 2. İsteğe bağlı kurulum sağlamak e-posta adresi arama yapıldığında arama sonuçları e-posta ile almak için ilgili kutudaki. ​ Not: genom kopyası ve/veya çok sayıda parça (aşağıya bakın) karşı büyük bir bölümü ararken, arama uzun sürebilir bu yana seçtiğin bu kullanıcı e-posta, kullanıcı sağlar önerilir. Örneğin, 100 megabase arama yaklaşık 15 alır s. Arama sonuçları için bir bağlantı sağlanan Arama tamamlandığında e-posta adresinize gönderilecektir. Bir ara tamamlanmasından sonra 7 gün içinde link tarihi:. Önemli dosya sağlamak veya esneklik görüntü dosyasının bir URL’den olabilir. Bu görüntü dosyasının sonuçları etkilemez; yalnızca sonuçları gösterilir. Karşılık gelen kutusunda (kromozom ve baz çifti pozisyonları dahil olmak üzere) bir arama aralığı belirtin. Kromozom listelemek, baz çifti başlangıç ve bitiş baz çifti. Kullanım ' chrN ' kromozom format için nerede ' N ' kromozom sayısı/mektup (1, 2, … X veya Y). Baz çifti için sadece sayı olarak yazın. Tüm üç giriş arasında boşluk veya Kromozom sayısı ve ilk baz çifti ve/veya kısa iki baz çifti arasındaki çizgi arasında iki nokta (:) içerir. Örneğin: chr1:1000000-2000000, chr1 1000000 2000000, chr1 1000000-2000000, chr1:1000000 2000000. Not: İsteğe bağlı adımları 2.1 2.3. Resim 1 : GeNemo ' s ön sayfa doldurduğu gerekli alanları ile. Bir kullanıcı türleri, dosya arama ve arama aralığı girip o karşı aramak istiyor parça seçmek gerekiyor. E-posta adresi ve dosya görüntülemek isteğe bağlıdır. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. 3. veri seçimi Şekil 2 : parça seçimi penceresi. Bu tıklatarak ortaya konulmuştur " veri Seçimi " düğme ön sayfasında. Burada, kullanıcıların giriş dosyası karşı aramak için parçaları seçin. Bazı parçaları önceden varsayılan. tarafından seçilmiştir Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Veri seçim düğmesini tıklattıktan sonra hangi tip-in parça (sorguya eklemek için Yani,) karşı aramak için seçin. Parça koleksiyon Labs dünyanın dört bir yanından birçok farklı veri kümeleri içerir. Parça listesi oldukça uzun olduğu için kullanıcılar filtre düğmesini (üstte) parça seçimleri kolaylaştırmak için kullanmak isteyebilirsiniz. Parça deney, doku, hücre ve/veya Lab. tarafından filtre Parça seçimi yürütmek amacıyla altta beş düğme vardır: Tümünü Seç, hiçbirini seçme, ekleme, filtre, Exclude. Tümünü Seç " ve " hiçbirini seçme " kendi kendini açıklayıcı vardır. " Ekle " düğmesi seçili parça sorguya ekler. Mantık kapısı olarak hizmet verdiği " ya da ". Yukarıda (örneğin, bazı deneyler, doku, hücre hatları veya Labs) filtreleri seçerek otomatik olarak karşılık gelen parça arama sorgusuna olduğunu not eklemez. Kullanıcıların gerekir ilk parça (örneğin, beyin, karaciğer doku altında) seçin ve tıklatın " Ekle " düğme-e doğru onları sorguya ekleyin. Parça seçerken, yalnızca filtreler filtre penceresinde açılan sekmede belirtilen arama sorgusuna uygulanacağını unutmayın. Seçimleri diğer sekmelerdeki filtre penceresinde kaydedilmiş ama arama sorgusuna uygulanmadı. " Filtre " düğmesi yalnızca sorgu Filtresi penceresinde seçili parça türlerini korur ve tüm diğer tip-in parça kaldırır. Mantık kapısı olarak hizmet veren " ve ". Esasen, " filtre " parça (örneğin, bazı dokularda belirli Labs ile) iki kategorileri arasındaki etkileşimin seçimi sağlar. Dikkat edin " filtre " sorguda değil zaten olmaları durumunda parça seçili tür sorguya eklemez. " Dışlama " düğmesini kaldırır tüm tip-in an Sorgu Filtresi penceresinde seçili olan parça. Mantık kapısı olarak hizmet verdiği " değil ", muhalif için " filtre " işlev. Yine, " hariç " şu anda sorguya filtre penceresinde seçili değil herhangi bir parça eklemek değil. şekil 3 : Filtre penceresini . Bu tıklatarak ortaya konulmuştur " filtre " parça seçimi penceresi düğmesini. Burada, kullanıcı-ebilmek seçme ile göreli kolaylığı. aynı anda birçok parça Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. şekil 4 : Filtre işlevini kullanmak için. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. istenen parça sorguya ekledikten sonra tıklayın " güncelleştirme " düğmesini sağ alt. Bu verileri seçmek için iki şekilde karşılamak için gereklidir: tek tek veri parçaları seçerek veya filtreleme/hariç. " Görünümü sıfırlamak " düğme gen ifade yönetmelikte insan/fare embriyonik kök hücre ile ilgili varsayılan parçaları için sorgu sıfırlar. Not: karşı üzerinden aranması için parça seçme " veri Seçimi " isteğe bağlıdır, ancak önerilen olmakVarsayılan arama parça vardır büyük olasılıkla kullanıcıya uygun değil neden ' s ihtiyaçlarını. 4. Arama ve sonuçları tıklayın " arama " düğmesi veri seçimden sonra. Arama biraz zaman alabilir. Arama işlemi tamamlandıktan sonra , kullanıcı-ecek görmek sonuçları sayfasında çeşitli kutular. Bir kullanıcı bir bölümü genom kopyası her kutusunu temsil eden ' s veri dosyası bir veya daha fazla kullanıcı sorgulanan parça yakından eşleşen bir desenle vardır. Daha tip-in parça arama veya arama aralığı ile aynı giriş dosyası daha büyük yapma kutuları görünür, denemek yok ise . Her şeyi yineleme olmadan bunu yapmak için kolay bir yol tıklayarak " ☰ " düğmesini logosunun yanında görüntülenir. Bu kullanıcının arama değiştirmek bir kenar çubuğu kadar açar. Sonuçları yanında tıkırtı üstünde yatak dosyası olarak verilmesi " yatak dosya indir " sonuç sayfasının alt düğmesini. Üst Visualize düğmesini hemen her kutusunun sonuçları görselleştirmek için. İçinde görselleştirme panelde değil, birden çok şeyler kullanıcı giriş dosyası, bir parça, eşleşen girilmiş Eğer görüntü dosyası birleştirir verileri de dahil olmak üzere görüntülenir ve bazı varsayılan izler. Test sonuçlarına göre kullanıcı daha fazla araştırma yapılması için sağlanan veri kümesi karşı bilinen KODLA veri kümeleri karşılaştırın. Kullanıcı da sorgu sonuçlarını bağlamında görmek için UCSC genler anlamlara gelebilir. Birden çok hücre hatları/doku parçaları seçtiyseniz, kullanıcı bu sonuçlar ilgili belirli veri kümesi ve KODLA veri kümeleri arasındaki benzerlikleri doku özgüllüğü hakkında bilgi sahibi olmak kullanabilirsiniz. On sonuçları sayfası, kullanıcı herhangi bir parça aşağı veya yukarı taşımak için sürükleyin genomu; fare imleç koordinatları üzerinde olduğunda kullanıcı fare tekerleğini kullanın ve/veya yakınlaştırma ve uzaklaştırma. şekil 5 : sonuçları sayfası. Bu belirli arama 363 eşleşen bölgeleri döndürdü. İlk eşleşen bölgesi görüntülemesini-ebilmek kılınmak yanında tıkırtı " gösteri " elde edilen her bölge kutusunun alt sol butonuna. Görüntüleme penceresinin sol tarafında iki veri dosyaları (giriş ve seçili parça) sinyal gücü desen. içinde benzer görülebilir tıklayınız Burada bu rakam daha büyük bir sürümünü görüntülemek için.

Representative Results

Burada şekil 5 ‘ te gösterilen bir simüle arama ‘s. İnsan türü seçildi ve karşılık gelen örnek dosya giriş veri dosyası olarak kullanıldı. Buna ek olarak, şekil 3’ te görüldüğü gibi varsayılan parçaları seçildi. Bölge eşleme 363 toplam vardı ve ilk bölgesine görüntü sayfasında gösterilir. Yoğunluk modeli gelen Kromozom 1 giriş dosyası için üzerinde 17036000-17038000 temel ve seçili parça çok benzer görülebilir.

Discussion

Epigenome kapsamlı bir anlayış tam potansiyelini yeni biyolojik anlayışlar8sağlanmasında insan genomu sıralama elde etmek için gereklidir. Şu anda sadece yolu online epigenomic veri kümeleri veri açıklama ve başlık (örneğin, meta veriler)1aramak için vardır. Bu ciddi bir epigenomic veri ile yapabilirsiniz arama türlerini sınırlar. Epigenomic veriler için desen tabanlı arama araçları için yeni biyolojik yorumlara neden olabilir farklı epigenomic işaretleri arasındaki ilişkiyi keşfetmek için gereklidir. Tarafından değil meta veriler ve veri içeriğini arar, GeNemo okuduğunuzda, yayımlanmış yatırım gibi kullanıcı tarafından oluşturulan KODLA veritabanıyla epigenomic verileri karşılaştırmak için kendi türünde ilk hizmet veya veri kümesi5indirilen. Bu metin tabanlı dizi arama aracı 1990’larda yaygın olarak kullanılabilir hale geldi gibi yaygın olarak dünyanın sadece araştırmacılar için erişilebilir olan bir epigenomic arama aracı kullanılabilirliği başlangıcı işaretler. Şu anda GeNemo dışındaki epigenomic veriler için desen tabanlı online arama araçları için hiçbir alternatifi vardır.

GeNemo kullanarak bir potansiyel ortak görünen Histon modifikasyonları ve transkripsiyon faktörü E2F6 epigenetik diğer işaretleriyle insan embriyonik kök hücreleri (bir örnek E2F6 bağlama sinyal dosyası kodlama veri portal ya da kullanılabilir içinde aranacağı örnektir https://sysbio.UCSD.edu/public/xcao3/ENCODESample/ENCFF001UBC.Bed). Bu dosya sorgu olarak KODLA veri kümelerini H1-hESC karşı aramak için kullanarak, GeNemo E2F6 bağlama sinyal ağır H3K4me1, H3K4me2, H3K4me3 ve E2F6 bazı genler ile düzenleyen gösterilen mevcut araştırma kabul eder H3K27me3 ile zenginleştirilmiş gösterecektir metilasyon H3K279. Öte yandan, aynı aile, E2F710bir faktör etkileşimli olarak bilinen colocalization E2F6 ve CtBP2 bağlama siteleri, görünüyor. Bu sonuçlar için tüm genom epigenetik işaretleri, transkripsiyon faktörü bağlama sinyalleri ve diğer sinyalleri KODLA içinde dahil çok sayıda karşı oldukça kolay tüm potansiyel hedefler daha fazla çözümleme için sağlayabilir GeNemo ile elde edilebilir.

İlk yayın5 / epigenomic web tabanlı veri arama aracı olarak GeNemo beri GeNemo’nın ön sayfa ile eşleşen bir görünüm için GeNemo sonuçları bölümü güncelleştirildi. Eski sonuçları bölümü yakından UCSC Genom tarayıcı sonuçları bölümü yansıtılmış ve görüntü için uzak UCSC sunucuda büyük ölçüde bağımlı. (Veri hala uzaktan getirilen) ile yeni arayüz, GeNemo daha kullanıcı dostu ve artık UCSC Genom sunucunun bağımlı olmasına rağmen. Bu GeNemo daha sağlam ve daha az UCSC sunucuda duruma sorunları kod değişikliği nedeniyle getirir. Ayrıca, GeNemo yeni, daha hızlı polimer arabiriminin görselleştirmek ve veri desenleri analiz etmek için daha fazla araçlara kullanıcı verir.

Önemli adımlar uygun giriş dosyayı sağlayan ve karşı arama için veri parça seçme içerir. Kullanıcı are güçlü çeşitli ile deneme için teşvik seçim süreci ve nasıl farklı komutlar ile bilgi sahibi olmak için parça seçimi işlevleri hedeflenen sonuca ulaşmak için kombine edilebilir. Özellikle, “Ekle” fonksiyonu “Filtre” veya “Dışarıda” mantık kapısı komut olarak kullanılabilir süre sorgu için seçilen istenen parça eklemek için gereken Not “Ve” ve “Ya da”, anılan sıraya göre. “Update” işlevini arama uygulamadan önce tüm seçimleri etkiler için gereklidir. Hiçbir sonuç döndürülmediğinde bir kullanıcı giriş veri dosyasını kontrol, daha fazla parça arama veya arama aralığı artırın. Bir hata olduğunda, hatanın tam olarak ne olduğunu tanımlama haşhaş bir pencere olacaktır. Belirsiz bazı hatalar, though. Örneğin, pencere ‘ hiçbir dosya karşıya olduğunu’ dediğinde, ya hayır eğe tarih oldu, ya da yüklenen dosya kabul edilebilir bir biçimde değildi ve, sonuç olarak, program doğru okumak mümkün değildi. Kabul edilebilir dosya biçimleri dosya yükleme için yatak ve tepeler biçim dosyası için hem yükleme yöntemleri ve önemli için online bağlantı upload sadece içerir. Bu dosya biçimleri sıkıştırılmış sürümleri de kabul edilir.

Bu yaklaşımın geçerli sınırlamaları algoritmaları henüz-için–optimize edilebilir ve GeNemo içinde istihdam işlevleri içerir. GeNemo henüz herhangi bir veri kümeleri döndürülen yorumu üzerinde herhangi bir rehberlik sağlayamaz. Bu kullanıcılar kadar önemli bilgi ve Biyoloji genom ve epigenome uzmanlık gerektiren bir görevdir. Ayrıca, başka bir geçerli kullanıcıların arama duyarlılık ve gürültü düzeyini değiştiremezsiniz kısıtlamadır. Biz geliştirmek ve GeNemo arama yetenekleri ve veri koleksiyon gelecekte onun izi genişletmek devam etmek için bekliyoruz.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Bu eser NIH tarafından desteklenen DP1HD087990 NICHD, NHGRI üzerinden R01HG008135 üzerinden de dahil olmak üzere verir. Üyeler Zhong laboratuarının değerli geribildirim için teşekkür ederiz.

Yazar katkıları:
X.C. ve A.T.Z. GeNemo yeni arayüzü ve özellikleri tarafından kodlama güncelleme; A.T.Z. içi örnek video üretilen; A.T.Z., X.C ve S.Z. kağıt yazdı.

Materials

GENEMO https://www.genemo.org Comparative Epigenome Browser

References

  1. The ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature. 489, 57-74 (2012).
  2. Barski, A., et al. High-Resolution Profiling of Histone Methylations in the Human Genome. Cell. 129 (4), 823-837 (2007).
  3. Meaney, M. J., Ferguson-Smith, A. C. Epigenetic regulation of the neural transcriptome: the meaning of the marks. Nature Neuroscience. 13, 1313-1318 (2010).
  4. Roh, T. -. Y., Cuddapah, S., Cui, K., Zhao, K. The genomic landscape of histone modifications in human T cells. PNAS. 103 (43), 15782-15787 (2006).
  5. Zhang, Y., Cao, X., Zhong, S. GeNemo: a search engine for web-based functional genomic data. Nucleic Acids Res. 44, W122-W127 (2016).
  6. Fujita, P. A., Rhead, B., Zweig, A. S., Hinrichs, A. S., Karolchik, D., Cline, M. S., Goldman, M., Barber, G. P., Clawson, H., Coelho, A., et al. The UCSC Genome Browser database: update 2011. Nucleic Acids Res. 39, 876-882 (2011).
  7. Neph, S., Vierstra, J., Stergachis, A. B., Reynolds, A. P., Haugen, E., Vernot, B., Thurman, R. E., John, S., Sandstrom, R., Johnson, A. K., et al. An expansive human regulatory lexicon encoded in transcription factor footprints. Nature. 489, 83-90 (2012).
  8. Sarda, S., Hannenhalli, S. Next-generation sequencing and epigenomics research: a hammer in search of nails. Genomics Inform. 12 (1), 2-11 (2014).
  9. Storre, J., et al. Silencing of the Meiotic Genes SMC1β and STAG3 in Somatic Cells by E2F6. J Biol Chem. 280, 41380-41386 (2005).
  10. Liu, B., Shats, I., Angus, S. P., Gatza, M. L., Nevins, J. R. Interaction of E2F7 Transcription Factor with E2F1 and C-terminal-binding Protein (CtBP) Provides a Mechanism for E2F7-dependent Transcription Repression. J Biol Chem. 288, 24581-24589 (2013).

Play Video

Cite This Article
Zheng, A., Cao, X., Zhong, S. Pattern-based Search of Epigenomic Data Using GeNemo. J. Vis. Exp. (128), e56136, doi:10.3791/56136 (2017).

View Video