We present a strategic plan and protocol for identifying non-coding genetic variants affecting transcription factor (TF) DNA binding. A detailed experimental protocol is provided for electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genotype-dependent TF DNA binding.
Population and family-based genetic studies typically result in the identification of genetic variants that are statistically associated with a clinical disease or phenotype. For many diseases and traits, most variants are non-coding, and are thus likely to act by impacting subtle, comparatively hard to predict mechanisms controlling gene expression. Here, we describe a general strategic approach to prioritize non-coding variants, and screen them for their function. This approach involves computational prioritization using functional genomic databases followed by experimental analysis of differential binding of transcription factors (TFs) to risk and non-risk alleles. For both electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genetic variants, a synthetic DNA oligonucleotide (oligo) is used to identify factors in the nuclear lysate of disease or phenotype-relevant cells. For EMSA, the oligonucleotides with or without bound nuclear factors (often TFs) are analyzed by non-denaturing electrophoresis on a tris-borate-EDTA (TBE) polyacrylamide gel. For DAPA, the oligonucleotides are bound to a magnetic column and the nuclear factors that specifically bind the DNA sequence are eluted and analyzed through mass spectrometry or with a reducing sodium dodecyl sulfate polyacrylamide gel electrophoresis (SDS-PAGE) followed by Western blot analysis. This general approach can be widely used to study the function of non-coding genetic variants associated with any disease, trait, or phenotype.
Sıralama ve genom çapında ilişkilendirme çalışmaları (GWAS), aday odağı çalışmaları da dahil olmak üzere genotiplendirme dayalı çalışmalar, ve derin sıralama çalışmaları, istatistiksel bir hastalık, özellik veya fenotip ile ilişkili birçok genetik varyantlar belirledik. Erken tahminler aksine, bu varyantlar (85-93%) en kodlayıcı olmayan bölgelerinde bulunur ve protein 1,2 amino asit dizisini değiştirmezler. Bu kodlayıcı olmayan varyantları işlevini yorumlama ve ilişkili hastalık onları bağlayan biyolojik mekanizmaları belirleyen özellik veya fenotip 3-6 zorlu kanıtlanmıştır. gen ifadesinin – Biz önemli bir ara fenotip için varyantları bağlantı moleküler mekanizmaları tanımlamak için genel bir strateji geliştirdik. Bu boru hattı, özellikle genetik varyantlar bağlama TF modülasyonu belirlemek için tasarlanmıştır. Bu strateji tahmin etmek amaçlanmıştır hesaplama yaklaşımları ve moleküler biyoloji teknikleri birleştirenBiyolojik siliko aday varyantları etkileri ve doğrulamak için şu tahminler ampirik (Şekil 1).
Şekil 1:.. Gri gölgeli bu yazının ilişkili detaylı protokolde yer almayan kodlayıcı olmayan genetik varyantları Adımlar analizi için stratejik yaklaşım bu rakamın daha büyük bir versiyonunu görmek için lütfen buraya tıklayınız.
Bir çok durumda, her bir istatistiksel bağlantılı varyantı ile, yüksek bir bağlantı-dengesizliği (LD) tüm bu dahil varyantların listesini genişleterek başlaması önemlidir. LD R2 istatistik 7 ile ölçülebilir iki farklı kromozom konumlarda allel rastgele olmayan federasyonu, bir ölçüsüdür. R2 lin bir ölçüsüdüriki modeli arasında bir r 2 = 1 belirten mükemmel bağlantı ile iki modeli arasındaki kage dengesizlik. yüksek LD alleller atalarının popülasyonlar arasında kromozom üzerindeki ortak ayırmak bulunmuştur. Güncel genotiplendirme dizileri insan genomu bilinen tüm varyasyonları dahil değildir. Bunun yerine, onlar insan genomunun içinde LD istismar ve LD 8 belirli bir bölgedeki diğer varyantları için temsilci olarak vekaleten oy bilinen çeşitleri bir alt kümesini içerir. anlamlı bir biyolojik etki ile nedensel varyantı-varyantı ile LD çünkü Böylece herhangi bir biyolojik sonucu olmayan bir varyant, belirli bir hastalık ile ilişkili olabilir. Prosedürel, 1,000 genomları son sürümü plink 10,11, tüm genom dernek analizi için bir açık kaynak aracı ile uyumlu ikili dosyaları içine 9 varyant çağrı dosyalarını (vcf) proje dönüştürmek için tavsiye edilir. Daha sonra, her giriş genetik va ile LD r 2> 0.8 ile diğer tüm genetik varyantlarRiant adayları olarak tespit edilebilir. Bir varyant Avrupa kökenli kişilerde, benzer kökenli konularda veri LD genişlemesi için kullanılması gerektiğini tespit edilmiştir eğer, bu üvey örneğin için uygun referans nüfusu kullanmak önemlidir.
LD genişletme genellikle aday türevleri onlarca neden olur ve sadece küçük bir fraksiyonu bir hastalık mekanizmasına katkıda bulunması olasıdır. Genellikle, deneysel bireysel bu varyantların her incelemek için olanaksız olduğunu. Varyantlar öncelik filtre olarak kamuya açık fonksiyonel genomik veri setleri binlerce kaldıraç nedenle faydalıdır. Örneğin, şifreleme konsorsiyum 12, örneğin, DNase seq 13 ATAC olarak teknolojilerden kromatin erişilebilirlik verileri ile birlikte, bağlamlarda çeşitli yonga-DİZ TFs bağlanmasını tarif eden deneyler ve ko-faktörler, ve histon işaretleri binlerce yürüttü -DİZ 14 ve FAIRE seq 15. databBöyle UCSC Genom Tarayıcı 16, Yol Haritası Epigenomics 17, Blueprint epigenom 18 Cistrome 19 ve eşleştirmek 20 olarak ases ve web sunucuları hücre tipleri ve koşullar geniş bir yelpazede bu ve diğer deneysel tekniklerle üretilen verilere ücretsiz erişim sağlar. Deneysel olarak incelemek için pek çok çeşidi vardır, bu veri, ilgili hücre ve doku tiplerinde olası düzenleyici bölgeler içinde yer alan bu öncelik için kullanılabilir. Bundan başka, bir varyantı belirli bir protein için bir çip DİZİ zirve içinde olduğu durumlarda, bu veriler, belirli bir TF (ler) olan ya da etki olabilir bağlama ko-faktör olarak potansiyel neden sağlayabilir.
Sonraki, öncelik ortaya çıkan varyantları EMSA 21,22 kullanarak bağlama tahmin genotip-bağımlı protein doğrulamak için deneysel taranmaktadır. EMSA bir indirgeyici olmayan TBE jeli üzerinde oligo geçiş değişimi ölçer. Floresan etiketli oligo kuluçkalanırNükleer lizat ve nükleer faktörlerin bağlayıcı jel üzerinde oligo hareketini geciktirir. Bu şekilde, tarama sırasında daha güçlü bir floresan sinyal olarak sunacak daha fazla nükleer faktörler bağlı olan oligo içinde. Özellikle, EMSA bağlayıcı etkilenir spesifik protein ilgili tahminlerde gerektirmez.
varyantlar tahmin düzenleyici bölgeler içinde yer alan ve farklı şekilde bağlayıcı nükleer faktörlerin yeteneğine sahip olduğu tespit edildikten sonra, hesaplama yöntemleri olan onlar etkileyebilecek bağlayıcı belirli TF (ler) tahmin etmek istihdam edilmektedir. Biz BDT-BP 23,24, RegulomeDB 25, UniProbe 26 ve Jaspar 27 kullanmayı tercih eder. Aday TF'ler belirlendikten sonra, bu öngörüler özellikle bu TFs (EMSA-Süper kaymalar ve DAPA-Batılıların) karşı antikorlar kullanılarak test edilebilir. Bir EMSA-süperkayma nükleer lizat ve oligo bir TF-özgü antikorun eklenmesini kapsamaktadır. Bir EMSA-süperkayma bir pozitif sonuç repr olduğunuEMSA bandında bir kayma ya da grubun bir kayıp olarak esented (referans 28'de incelenmiştir). Tamamlayıcı DAPA, varyant ve yan nükleotidlerini 20 baz çifti ihtiva eden bir 5'-biyotinlenmiş oligo dupleks spesifik oligolar bağlama nükleer faktörü yakalamak için uygun bir hücre tipinde (ler) den, nükleer lizatı ile inkübe edilir. Oligo dubleks nükleer faktör kompleksi manyetik sütunda mikroboncuklarm streptavidin tesbit edilir. Bağlı nükleer faktörler elüsyon 29,48 doğrudan tahsil edilir. Bağlanma tahminler daha sonra proteine özel antikorlar kullanılarak bir Western blot ile tespit edilebilir. sonradan kullanılarak valide edilebilir hiçbir belirgin tahminler, ya da çok fazla tahminler, kütle-spektrometresi kullanılarak aday TFs belirlemek için bir proteomik çekirdeğe gönderilebilir DAPA deneyleri varyant aşağı açılır menüden elüsyon olduğu durumlarda, bu daha önce açıklanan yöntemleri.
articl kalanındae, genetik varyantları EMSA ve DAPA analizi için detaylı bir protokol sağlanır.
sıralama ve genotiplendirme teknolojilerindeki gelişmeler büyük ölçüde hastalıkla ilgili genetik varyantları tanımlamak için kapasitemizi gelişmiş olmasına rağmen, bu varyantlar etkilenen fonksiyonel mekanizmaları anlamak için yeteneğimizi kalıyor. Sorunun ana kaynağı olasılıkla gen ekspresyonunu kontrol zor-arası tahmin mekanizmaları etkileyen ilgili kodlama genomunun bölgeler birçok hastalıkla ilişkili varyantları n yer olmasıdır. Burada, biz büyük olasılıkla çok kodlayıcı …
The authors have nothing to disclose.
We thank Erin Zoller, Jessica Bene, and Lindsey Hays for input and direction in protocol development. MTW was supported in part by NIH R21 HG008186 and a Trustee Award grant from the Cincinnati Children’s Hospital Research Foundation. ZHP was supported in part by T32 GM063483-13.
Custom DNA Oligonucleotides | Integrated DNA Technologies | http://www.idtdna.com/site/order/oligoentry | |
Potassium Chloride | Fisher Scientific | BP366-500 | KCl, for CE buffer |
HEPES (1M) | Fisher Scientific | 15630-080 | For CE and NE buffer |
EDTA (0.5M), pH 8.0 | Life Technologies | R1021 | For CE, NE, and annealing buffer |
Sodium Chloride | Fisher Scientific | BP358-1 | NaCl, for NE buffer |
Tris-HCl (1M), pH 8.0 | Invitrogen | BP1756-100 | For annealing buffer |
Phosphate Buffered Saline (1X) | Fisher Scientific | MT21040CM | PBS, for cell wash |
DL-Dithiothreitol solution (1M) | Sigma | 646563 | Reducing agent |
PMSF | Thermo Scientific | 36978 | Protease Inhibitor |
Phosphatase Inhibitor Cocktail | Thermo Scientific | 78420 | Prevents dephosphorylation of TFs |
Nonidet P-40 Substitute | IBI Scientific | IB01140 | NP-40, for nuclear extraction |
BCA Protein Assay Kit | Thermo Scientific | 23225 | For measuring protein concentration |
Odyssey EMSA Buffer Kit | Licor | 829-07910 | Contains all necessary EMSA buffers |
TBE Gels, 6%, 12 Wells | Invitrogen | EC6265BOX | For EMSA |
TBE Buffer (10X) | Thermo Scientific | B52 | For EMSA |
FactorFinder Starting Kit | Miltenyi Biotec | 130-092-318 | Contains all necessary DAPA buffers |
Licor Odyssey CLx | Licor | Recommended scanner for DAPA/EMSA | |
Antibiotic-Antimycotic | Gibco | 15240-062 | Contains 10,000 units/mL of penicillin, 10,000 µg/mL of streptomycin, and 25 µg/mL of Fungizone® Antimycotic |
Fetal Bovine Serum | Gibco | 26140-079 | FBS, for culture media |
RPMI 1640 Medium | Gibco | 22400-071 | Contains L-glutamine and 25mM HEPES |