Bir biyoinformatik boru hattı, yani miRDeep-P2 (kısaca miRDP2), güncellenmiş bitki miRNA kriterleri ve elden algoritması ile, doğru ve verimli bitkilerde mikroRNA transkripsiyon analiz edebilir, özellikle karmaşık ve büyük genomları olan türler için.
MikroRNA’lar (miRNA’lar) 20-24 nükleotit (nt) endojen küçük RNA’lar (sRNA’lar) gen ekspresyonunun transkripsiyon sonrası düzeyde düzenlenmesinde güçlü rol oynayan bitki ve hayvanlarda yaygın olarak mevcuttur. Son on yılda miRNA transkripsiyonlarını tanımlamak ve analiz etmek için sRNA kitaplıklarının Yeni Nesil Sıralama (NGS) yöntemlerine göre sıralanması yaygın olarak kullanılmıştır ve bu da miRNA keşfinde hızlı bir artışa yol açmıştır. Bununla birlikte, sıralı sRNA kütüphanelerinin derinliğinin artmasının yanı sıra bitki genomlarının büyüklüğü ve karmaşıklığı nedeniyle bitki miRNA ek açıklamalarında iki büyük zorluk ortaya çıkar. İlk olarak, sRNA’ların diğer birçok türü, özellikle, sRNA kütüphanelerinden kısa müdahale rna’lar (siRNA’lar) hatalı bir şekilde birçok hesaplama aracı tarafından miRNA olarak eklenmiştir. İkinci olarak, büyük ve karmaşık genomlara sahip bitki türlerinde miRNA transkripsiyonlarının analizi için son derece zaman alan bir süreç haline gelir. Bu zorluklarıaşmak için miRDeep-P’yi (miRNA transkriptom analizleri için popüler bir araç) miRDeep-P2’ye (kısaca miRDP2) yeni bir filtreleme stratejisi uygulayarak, puanlama algoritmasını elden geçirerek ve yeni güncellenen bitki miRNA’sını birleştirerek yükselttik. ek açıklama kriterleri. MiRDP2’yi Arabidopsis, pirinç, domates, mısır ve buğday dahil olmak üzere genomik karmaşıklığı artan beş temsili bitkide sıralı sRNA popülasyonlarına karşı test ettik. Sonuçlar, miRDP2’nin bu görevleri çok yüksek verimlilikle işledi. Buna ek olarak, miRDP2 duyarlılık ve doğruluk ile ilgili diğer tahmin araçları geride. Birlikte ele alındığında, sonuçlarımız miRDP2 bitki miRNA transkriptomları analiz etmek için hızlı ve doğru bir araç olarak göstermek, bu nedenle toplumun daha iyi bitkilerde miRNA’lar açıklama yardımcı yararlı bir araçtır.
Biyolojide son yirmi yılda yapılan en heyecan verici keşiflerden biri, sRNA türlerinin genom1’inçeşitli işlevlerini düzenlemedeki çoğalan rolüdür. Özellikle miRNA’lar ökaryotlarda 20 ila 24-nt sRNA’ların önemli bir sınıfını oluşturur ve esas olarak transkripsiyon sonrası düzeyde yaşam döngüsü gelişim aşamalarında belirgin gen düzenleyicileri olarak işlev görürler, ayrıca uyarıcı ve stres yanıtlarında2,3. Bitkilerde miRNA’lar pri-miRNA adı verilen birincil transkriptlerden kaynaklanmaktadır, bunlar genellikle RNA polimeraz II tarafından bireysel transkripsiyon üniteleri4,5olarak yazılır. Evrimsel olarak korunmuş hücresel makineler (hayvanlarda Drosha RNase III, bitkilerde DICER benzeri) tarafından işlenen pri-miRNA’lar, moleküler kök-döngü yapılarını oluşturan dizileri içeren miRNA öncüleri, pre-miRNA’lariçineboşaltılır. Pre-miRNA’lar daha sonra çift iplikli ara lara, yani miRNA dublekslere, fonksiyonel iplikçik, olgun miRNA ve daha az sık fonksiyonel ortak olan miRNA*2,8’denoluşan olarak işlenir. RNA kaynaklı susturma kompleksine (RISC) yüklendikten sonra, olgun miRNA’lar dizi tamamlayıcılığına dayalı olarak mRNA hedeflerini tanıyabilir ve bu da olumsuz bir düzenleyici fonksiyon2,8ile sonuçlanır. miRNA’lar ya hedef transkriptlerini bozabilir ya da hedef çevirisini engelleyebilir ler ama eski şekilde bitkilerde hakimdir8,9.
Nematod Caenorhabditis elegans10ilk miRNA tesadüfi keşfinden bu yana,11, çok araştırma miRNA tanımlama ve fonksiyonel analizi, özellikle NGS yönteminin kullanılabilirliğinden sonra taahhüt edilmiştir. NGS yönteminin geniş uygulaması, miRNA’ların benzersiz özelliğini yakalamak için tasarlanmış hesaplama araçlarının kullanımını büyük ölçüde teşvik etmiştir, örneğin öncüllerin kök-döngü yapısı ve olgun miRNA ve miRNA*’da okunan sıraların tercihli birikimi gibi. Sonuç olarak, araştırmacılar çeşitli türlerde miRNA’ları belirlemede kayda değer bir başarı elde etmişler. Daha önce açıklanan olasılık modeli12dayanarak , biz miRDeep-P13geliştirdi , HANGI NGS verilerinden bitki miRNA’ları keşfetmek için ilk hesaplama aracı oldu. miRDeep-P özellikle daha değişken öncüuzunluğu ve büyük paralogous aileler13,14,15içeren bitki miRNA’ları çözme zorlukları fethetmek amaçlandı . Yayımlanmasından sonra, bu program binlerce kez indirildi ve 40’tan fazla bitki türleri16miRNA transkriptomes açıklama için kullanılır. miRDeep-P gibi NGS tabanlı araçlar tarafından tahrik, kamu miRNA depo miRBase17kayıtlı miRNA sayısında dramatik bir artış olmuştur , 38.000 miRNA öğeleri şu anda barındırılan nerede (sürüm 22.1) sadece ~ 500 miRNA öğeleri (sürüm 2.0) ile karşılaştırıldığında 200818.
Ancak, bitki miRNA ek açıklama iki yeni sorunlar ortaya çıkmıştır. İlk olarak, yanlış pozitif lerin yüksek oranları aşağıdaki nedenlerle bitki miRNA ek açıklamaları16,19 kalitesini büyük ölçüde etkilemıştır: 1) NGS sRNA kütüphanelerinden endojen kısa müdahale RNA’ların (siRNA’lar) bir tufanı, katı bir miRNA açıklama kriterinin olmaması nedeniyle hatalı bir şekilde miRNA olarak anons edildi; 2) priori miRNA bilgisi olmayan türler için NGS verilerine dayalı olarak öngörülen yanlış pozitifleri ortadan kaldırmak zordur. Örnek olarak miRBase’i kullanan Taylor ve ark.20, 21numaralı kamu deposundaki bitki miRNA girişlerinin üçte birinin ikna edici destekleyici kanıtlardan yoksun olduğunu ve hatta bitki miRNA ailelerinin dörtte üçünün bile şüpheli olduğunu buldular. İkinci olarak, büyük ve karmaşık genomları16ile bitki miRNA’ları tahmin etmek için son derece zaman alıcı bir süreç haline gelir. Bu zorluklarıaşmak için miRDeep-P’yi yeni bir filtreleme stratejisi ekleyerek, puanlama algoritmasını elden geçirerek ve tesis miRNA ek açıklamaiçin yeni kriterleri entegre ederek güncelledik ve yeni miRDP2 sürümünü yayınladık. Buna ek olarak, miRDP2’yi NGS sRNA veri setlerini kullanarak test ettik ve giderek artan genom boyutları na sahipolduk: Arabidopsis, pirinç, domates, mısır ve buğday. Diğer beş yaygın olarak kullanılan araçlar ve eski sürümü ile karşılaştırıldığında, miRDP2 bu sRNA verileri ayrıştırılmış ve geliştirilmiş doğruluk ve hassasiyet ile daha hızlı miRNA transkripsiyonu analiz.
miRDP2 paketinin içeriği
MiRDP2 paketi, hazırlanan bash komut dosyası tarafından sırayla çalıştırılması gereken altı belgelenmiş Perl komut dosyasından oluşur. Altı komut dosyasından üçü(convert_bowtie_to_blast.pl, filter_alignments.pl, ve excise_candidate.pl) miRDeep-P’den miras kalır. Diğer komut dosyaları orijinal sürümden değiştirilir. Altı komut dosyasının işlevleri aşağıdaki şekilde açıklanmıştır:
preprocess_reads.pl filtreler giriş çok uzun veya çok kısa (25 nt) okumaları da dahil olmak üzere okur ve Rfam ncRNA dizileri ile ilişkili okur, yanı sıra RPM ile okur (Milyon Başına Okur) az 5. Komut dosyası daha sonra bilinen miRNA olgun dizileri ile ilişkili okur alır. Giriş dosyaları FASTA/FASTQ biçiminde orijinal okumalar ve miRNA ve ncRNA dizilerine eşleme okumanın bowtie2 çıktısI.
RPM hesaplama formülü aşağıdaki gibidir:
convert_bowtie_to_blast.pl bowtie biçimini BLAST-ayrıştı biçimine dönüştürür. BLAST-parsed biçimi standart NCBI BLASToutput biçiminden türetilen özel bir tabular ayrılmış biçimidir.
filter_alignments.pl derin sıralama okumalarının hizalamalarını bir genoma filtreler. Kısmi hizalamaları ve çok hizalı okumaları (kullanıcı tarafından belirtilen frekans kesme) filtreler. Temel giriş BLAST-parsed biçiminde bir dosyadır.
excise_candidate.pl, hizalanmış okumaları yönergeler olarak kullanarak bir başvuru dizisinden potansiyel öncül dizilerini keser. Temel giriş BLAST-parsed biçiminde bir dosya ve FASTA dosyasıdır. Çıktı FASTA formatında tüm potansiyel öncü dizileridir.
mod-miRDP.pl iki giriş dosyası, imza dosyası ve çekirdek miRDeep-P algoritmasından bitki özel parametreleri ile puanlama sistemi değiştirerek değiştirilir yapı dosyası gerekir. Giriş dosyaları nokta-köşeli öncül yapı dosyasıdır ve dağıtım imza dosyasını okur.
mod-rm_redundant_meet_plant.pl üç giriş dosyaları gerekir: chromosome_length, öncüleri ve original_prediction mod-miRDP.pl tarafından oluşturulan. Yeni güncellenen tesis miRNA ölçütlerine göre filtrelenmiş, gereksiz tahmin edilen ve öngörülen dosya olmak üzere iki çıktı dosyası oluşturur. Çıktı dosyasının biçimiyle ilgili ayrıntılar bölüm 1.4’te açıklanmıştır.
NGS gelişiyle, miRNA loci çok sayıda çeşitli türler de sRNA sıralama veri giderek artan miktarda tespit edilmiştir29,30. Merkezi topluluk veritabanı miRBase21,yatırılan miRNA öğeleri son on yılda neredeyse 100 kat artmıştır. Ancak, hayvanlarda miRNA’lara kıyasla, bitki miRNA’ları tanımlama/ek açıklamayı daha karmaşık hale getiren birçok benzersiz özelliğe sahiptir13,<sup class=…
The authors have nothing to disclose.
Bu çalışma Pekin Tarım ve Orman Bilimleri Akademisi (KJCX201917, KJCX20180425 ve KJCX20180204) tarafından XY ve Çin Ulusal Doğa Bilimleri Vakfı (31621001) ll’ye destek verilmiştir.
Computer/computing node | N/A | N/A | Perl is required; at least 8 GB RAM and 100 GB storage are recommended |