Burada, 1) bilinen ve yeni miRNA’ları daha doğru bir şekilde tanımlayabilen ve 2) tam otomatik ve serbestçe kullanılabilen yeni ve tam otomatik bir miRNA boru hattı olan mirMachine’i sunuyoruz. Kullanıcılar artık tam otomatik mirMachine işlem hattını çalıştırmak için kısa bir gönderme komut dosyası yürütebilir.
Farklı tipte kodlamayan RNA’lardan, mikroRNA’lar (miRNA’lar) son on yılda tartışmasız bir şekilde spot ışığında olmuştur. Gen ekspresyonunun transkripsiyon sonrası düzenleyicileri olarak, miRNA’lar, kuraklık ve hastalıklar gibi a / biyotik strese hem gelişim hem de yanıt dahil olmak üzere çeşitli hücresel yollarda kilit roller oynamaktadır. Yüksek kaliteli referans genom dizilerine sahip olmak, miRNA dizilerinin yüksek oranda korunduğu çeşitli bitki türlerinde miRNA’ların tanımlanmasını ve ek açıklamasını mümkün kılmıştır. Hesaplamalı miRNA tanımlama ve ek açıklama süreçleri çoğunlukla hataya eğilimli süreçler olduğundan, homoloji tabanlı tahminler tahmin doğruluğunu arttırır. Son on yılda, o zamandan beri çeşitli bitki genomları için kullanılan miRNA ek açıklama boru hattı SUmir’i geliştirdik ve geliştirdik.
Bu çalışma, (i) ikincil yapı tahminlerine ek bir filtreleme adımı ekleyerek, (ii) tamamen otomatik hale getirerek ve (iii) homolojiye dayalı bilinen miRNA’yı veya önceki boru hattını kullanarak küçük RNA dizileme okumalarına dayanan yeni miRNA’ları tahmin etmek için yeni seçenekler sunarak tam otomatik, yeni bir miRNA boru hattı olan mirMachine (miRNA Makinesi) sunmaktadır. Yeni miRNA boru hattı mirMachine, Arabidopsis Bilgi Kaynağı, TAIR10, Arabidopsis genomunun salınması ve Uluslararası Buğday Genomu Dizileme Konsorsiyumu (IWGSC) buğday referans genomu v2 kullanılarak test edildi.
Yeni nesil dizileme teknolojilerindeki ilerlemeler, RNA yapılarının ve düzenleyici elementlerin anlaşılmasını genişletmiş ve işlevsel olarak önemli kodlamayan RNA’ları (ncRNA’lar) ortaya çıkarmıştır. Farklı ncRNA tipleri arasında, mikroRNA’lar (miRNA’lar), bitkilerde 1,2 nükleotid arasında bir uzunluğa sahip küçük RNA’ların temel bir düzenleyici sınıfını oluşturur 1,2. Nematodda Caenorhabditis elegans3’te ilk miRNA’nın keşfedilmesinden bu yana, miRNA’ların varlığı ve işlevleri hayvan ve bitki genomlarında da 4,5,6 kapsamlı bir şekilde incelenmiştir. miRNA’lar, bölünme veya translasyonel baskı için mRNA’ları hedefleyerek işlev görür7. Biriken kanıtlar ayrıca miRNA’ların bitkilerde büyüme ve gelişme8, kendi kendine biyogenez9 ve çeşitli biyotik ve abiyotik stres yanıtları10 dahil olmak üzere çok çeşitli biyolojik süreçlerde yer aldığını göstermiştir.
Bitkilerde, miRNA’lar başlangıçta pri-miRNA’lar11 adı verilen uzun birincil transkriptlerden işlenir. Çekirdeğin içindeki RNA polimeraz II tarafından üretilen bu pri-miRNA’lar, kusurlu bir katlanır arka yapı oluşturan uzun transkriptlerdir12. Pri-miRNA’lar daha sonra pre-miRNA’lar11 olarak adlandırılan miRNA’ların endojen tek iplikçikli (ss) saç tokası öncüllerini üretmek için bir bölünme işlemine tabi tutulur. Pre-miRNA, bir miRNA dubleksini (miRNA / miRNA *) çıkarmak için tek bir ipliğin çift sarmallı bir yapıya katlandığı saç tokası benzeri bir yapı oluşturur13. Dicer benzeri protein, miRNA / miRNA * dubleksin her iki ipliğini de keser ve 2-nükleotid 3′-çıkıntıları14,15 bırakır. MiRNA dubleksi, miRNA’nın 3′-ucunu bozunma ve idrar aktivitesinden koruyan çekirdeğin içinde metillenir16,17. Bir helikaz, ihracattan sonra metillenmiş miRNA dubleksini çözer ve olgun miRNA’yı sitosol18’deki RNA kaynaklı susturma kompleksine (RISC) maruz bırakır. Dupleksiyonun bir ipliği RISC’ye dahil edilmiş olgun miRNA’dır, diğer iplikçik ise miRNA * bozulur. MiRNA-RISC kompleksi hedef diziye bağlanır ve tam tamamlayıcılık durumunda mRNA bozunmasına veya kısmi tamamlayıcılık durumunda translasyonel baskıya yol açar13.
İfade ve biyogenez özelliklerine dayanarak, miRNA ek açıklaması için kılavuzlar15,19 olarak tanımlanmıştır. Tanımlanan kılavuzlarla Lucas ve Budak, 9 numaralı bitkilerde homoloji tabanlı bir in silico miRNA tanımlaması gerçekleştirmek için SUmir boru hattını geliştirdi. SUmir boru hattı iki komut dosyasından oluşuyordu: SUmirFind ve SUmirFold. SUmirFind, Ulusal Biyoteknoloji Bilgi Merkezi (NCBI) Temel Yerel Hizalama Arama Aracı (BLAST) taraması yoluyla, yalnızca 2 veya daha az uyumsuzluğa sahip isabetleri içerecek ve daha kısa isabetlere (blastn-short -ungapped -penalty -1 -reward 1) yönelik önyargıyı önlemek için değiştirilmiş parametrelerle bilinen miRNA veri kümelerine karşı benzerlik aramaları gerçekleştirir. SUmirFold, UNAfold21 kullanarak BLAST20 sonuçlarından varsayılan miRNA dizilerinin ikincil yapısını değerlendirir. SUmirFold, saç tokası yapısının özelliklerini tanımlayarak miRNA’ları küçük müdahale eden RNA’lardan ayırır. Ayrıca, miRNA’ları tRNA ve rRNA gibi diğer ssRNA’lardan parametreleri, minimum katlama enerjisi indeksi > 0.67 ve GC içeriği% 24-71 ile ayırır. Bu boru hattı yakın zamanda (i) duyarlılığı artırmak, (ii) ek açıklama doğruluğunu artırmak ve (iii) öngörülen miRNA genlerinin genomik dağılımını sağlamak için iki ek adım eklenerek güncellendi22. Bitki miRNA dizilerinin23 yüksek korunumu göz önüne alındığında, bu boru hattı başlangıçta homoloji tabanlı miRNA tahmini için tasarlanmıştır. Bununla birlikte, yeni miRNA’lar, yakından ilişkili türler arasındaki miRNA’ların dizi korunumuna büyük ölçüde dayandığı için bu biyoinformatik analizle doğru bir şekilde tanımlanamamıştır.
Bu makale, 1) bilinen ve yeni miRNA’ları daha doğru bir şekilde tanımlayabilen (örneğin, boru hattı artık sRNA-seq tabanlı yeni miRNA tahminlerinin yanı sıra homoloji tabanlı miRNA tanımlamasını da kullanıyor) ve 2) tamamen otomatik ve serbestçe kullanılabilen yeni ve tam otomatik bir miRNA boru hattı olan mirMachine’i sunmaktadır. Çıktılar ayrıca tahmin edilen miRNA’ların genomik dağılımlarını da içermektedir. mirMachine, buğday ve Arabidopsis genomlarında hem homoloji tabanlı hem de sRNA-seq tabanlı tahminler için test edildi. Başlangıçta özgür yazılım olarak piyasaya sürülmesine rağmen, UNAfold son on yılda ticari bir yazılım haline geldi. Bu yükseltmeyle, ikincil yapı tahmin aracı UNAfold’dan RNAfold’a değiştirildi, böylece mirMachine serbestçe kullanılabilir. Kullanıcılar artık tam otomatik mirMachine işlem hattını çalıştırmak için kısa bir gönderme komut dosyası yürütebilir (örnekler https://github.com/hbusra/mirMachine.git verilmiştir).
MiRNA boru hattımız SUmir, son on yıldır birçok bitki miRNA’sının tanımlanması için kullanılmaktadır. Burada, yeni, tam otomatik ve serbestçe kullanılabilen bir miRNA tanımlama ve ek açıklama boru hattı olan mirMachine’i geliştirdik. Ayrıca, önceki boru hattı da dahil ancak bunlarla sınırlı olmamak üzere bir dizi miRNA tanımlama boru hattı, bir zamanlar serbestçe kullanılabilir olmasına rağmen, zamanla ticari bir yazılım haline gelen UNAfold yazılımı21’e bağı…
https://www.ncbi.nlm.nih.gov/books/NBK279671/ | Blast+ | ||
https://github.com/hbusra/mirMachine.git | mirMachine submission script | ||
https://www.perl.org/get.html | Perl | ||
https://www.tbi.univie.ac.at/RNA/ | RNAfold | ||
Arabidopsis TAIR10 | |||
Triticum aestivum (wheat, IWGSC RefSeq v2) |