Summary

Eksiltici genomik tarafından roman sıra bulma

Published: January 25, 2019
doi:

Summary

Bu iletişim kuralının amacı bilinen yalnızca kısmen bir ortak arındırıcı serisinden kolayca ayrılamayan roman dizileri bulamadı bir arada hesaplamalı ve tezgah araştırma kullanmaktır.

Abstract

Eksiltici genomik hedefi gen, protein veya daha büyük bir genomik bağlamda katıştırılmış genel bölge sırasını tanımlamak için nerede herhangi bir araştırmada kullanılabilir. Eksiltici genomik faiz (T) bir hedef dizi kapsamlı sıralama ve bilinen genetik öğeleri (başvuru, R) çıkarılarak tarafından izole etmek bir araştırmacı sağlar. Yöntem mitokondri, kloroplast, virüs gibi roman serileri tanımlamak için kullanılan veya germline kromozomlar sınırlı ve T kapsamlı genomik veri ile (R + T), yöntem başlayan R. kolayca izole olamaz özellikle yararlıdır Temel yerel hizalama arama aracı (patlama) eşleşen bilinen dizileri (R), (T) hedef bırakarak kaldırmak için bir başvuru sırası veya dizileri, karşı kullanır. En iyi çalışacak şekilde çıkarma için R T. eksik nispeten tam bir taslak olmalıdır Çıkarma test sonra nicel polimeraz zincir reaksiyonu (qPCR) aracılığıyla kalan dizileri beri R yöntemin işe yaraması için tamamlanmış olması gerekmez. Biz gerektiği gibi tekrarlanır bir döngü içine deneysel adımlarla Hesaplamalı adımları sırayla birden fazla başvuru dizileri kaldırma ve T. için arama rafine link burada Eksiltici genomik avantajı tamamen yeni hedef sıra fiziksel arıtma zor, imkansız ya da pahalı olduğu durumlarda bile belirlenebilir olması. Yöntemin bir dezavantajı uygun bir başvuru için çıkarma bulma ve T-pozitif alma ve negatif qPCR sınama örnekleri. Bizim zebra finch germline tarafından kısıtlanmış kromozom gelen ilk gen tanımlaması yönteminde uygulanması açıklanmaktadır. Bu durumda üç başvuruları (R), sırayla üç devir kaldırıldı Hesaplamalı filtreleme söz konusu: bir eksik genomik derleme, ham genomik veri ve transcriptomic veri.

Introduction

Bu yöntemin amacı bir roman hedef (T) genomik serisinden, DNA veya RNA, genomik bağlam veya başvuru (R) (resim 1) belirlemektir. Hedef fiziksel olarak ayrı tutulamaz veya bunu yapmak için pahalı olacağını, yöntem en yararlı olur. Yani bizim Yöntem önemli bir yenilik içine referans kusurlu olduğunda hedef sıraları ayırmak araştırmacılar etkinleştirme bir döngüsü, ya da bir taslak tezgah yöntemleri ve hesaplama birleşimi yalnızca birkaç organizmaların mükemmel genleri çıkarma için bitirdikten bir sigara modeli organizmadan genom. Bir döngü sonunda, qPCR sınama daha fazla çıkarma gerekip gerekmediğini belirlemek için kullanılır. Doğrulanmış aday T sıra istatistiksel olarak daha büyük algılama qPCR tarafından bilinen T-pozitif örnekleri gösterir.

Ana bilgisayar homologs1,2,3,4 var mı yeni bakteri uyuşturucu hedefler keşfi ve kimliği roman virüslerden virüslü bilgisayarlardan yöntemi enkarnasyonları uygulanmıştır 5,6. T kimlik ek olarak, yöntem yöntem zebra finch başvuru genom 936 eksik genler ve salt germline kromozom (T)7yeni bir gen tanımlamak için son kullanılan R: artırabilirsiniz. Eksiltici genomik T bilinen dizileri son derece farklı olma olasılığı veya olduğu gibi zebra finch germline tarafından kısıtlanmış kromozom7T kimliğini geniş tanımsızdır özellikle değerlidir.

Önceden T olumlu tanımlaması gerektirmeyen bir anahtar Eksiltici genomik tarafsız avantajdır. Bir son çalışmada, Readhead ve ark. Alzheimer hastalığı ve viral bolluk içinde dört beyin bölgeleri arasındaki ilişki incelenmiştir. İçin viral tanımlama, Readhead ve ark. 515 virüs8ağır sınırlama yaptıkları çalışmada teşhis edebilir viral ajanlar, bir veritabanı oluşturdu. Eksiltici genomik sağlıklı ve Alzheimer genleri karşılaştırmak için ne olursa olsun onların benzerlik bilinen bulaşıcı hastalığı ile ilişkili olası roman virüslerden yalıtmak için kullanılabilirdi. 263 bilinen virüsler insan hedefleme iken, bu yaklaşık 1.67 milyon keşfedilmemiş viral tür var, 631,000-827,000 insanlar9bulaştırmak için bir potansiyele sahip biri ile tahmin edilmektedir.

Roman virüslerden işlemleri olan bir alandır hangi Eksiltici genomik özellikle etkilidir, ancak bazı çalışmalarda sıkı bir yöntem gerekmeyebilir. Örneğin, tanımlayıcı roman virüslerden ayıklamak ve ters ters transkripsiyon ve BLASTx için viral dizileri5 ardından tarafsız yüksek üretilen iş sıralama veya viral nükleik asitleri zenginleştirici kullanmış çalışmalar viral dizileri uyarlamak 6. bu çalışmalar de novo sıralama ve derleme ediyor hedef sıraları olumlu aracılığıyla patlama tespit edilmiştir çünkü çıkarma kullanılmadı. Eğer belgili tanımlık virüs tamamen Roman ve ilişkili olmayan (veya uzaktan ilgili) diğer virüs, Eksiltici genomik yararlı bir yöntem olurdu. Eksiltici genomik yararı tamamen yeni dizileri elde edilebilir olmasıdır. Canlı genomunun büyüklüğü biliniyorsa, o dışarı herhangi bir viral dizileri bırakmak düşülen. Örneğin, bizim orijinal niyet7değildi ama bizim yayınlanan çalışmada biz zebra finch Eksiltici genomik, üzerinden viral bir roman serisinden izole.

Eksiltici genomik da yararlı bakteri aşısı hedefleri, antibiyotik direnci1,2,3,4dramatik artış tarafından motive tanımlaması içinde kanıtlamıştır. Otoimmün reaksiyon riski en aza indirmek için homologs içinde insan sahibi herhangi bir protein çıkararak araştırmacılar potansiyel aşı hedefleri daralmış. Uyuşturucu hedefleri proteinler yan etkileri için önde gelen ana bilgisayarlar arasında etkilemeyeceği emin olmak için birkaç bakteriyel genom üzerinden çıkarma omurgalı ana bilgisayar genleri Corynebacterium pseudotuberculosis, arıyorum bir belirli çalışmada gerçekleştirilen 1. bu çalışmaların temel iş akışı bakteriyel Proteom indir, hayati proteinler belirlemek, gereksiz proteinler kaldırmak için gerekli proteinler yalıtmak için BLASTp ve BLASTp ana bilgisayar Proteom karşı herhangi bir protein ile ev sahibi homologs kaldırmak için kullanın etmektir 1 , 2 , 3 , 4. Bu durumda, Eksiltici genomik geliştirilen aşı ana bilgisayar1,2,3,4‘ te herhangi bir hedef kapalı etkisi olmayacaktır emin olun.

Biz Eksiltici genomik ilk protein kodlayıcı gen germlines içinde bulunan bir germline tarafından kısıtlanmış kromozom üzerinde (GRC) (Bu durumda, T), tanımlamak için kullanılan ancak ikisinden de değil somatik doku10cinsiyette. Bu çalışmada önce GRC hakkında bilinen sadece genomik bilgi bir yinelenen bölge11oldu. De novo derleme yumurtalık ve teste dokulardan (R + T) Yetişkin zebra finches üzerinden sıralı RNA üzerinde gerçekleştirildi. Dizileri Hesaplamalı ortadan kaldırılması yayımlanmış somatik (kas) genom dizisi (R1)12kullanarak gerçekleştirilen, onun ham (Sanger) veri (R2) ve somatik (beyin) transcriptome (R3)13okuyun. Üç başvurular sıralı kullanımı ek filtreleme gerekli gösterilen adımında her döngüsü (Şekil 2A), 5 test qPCR tarafından tahrik edildi. Keşfedilen α-ek gen DNA ve RNA ve klonlama ve sıralamanın üzerinden qPCR üzerinden teyit edildi. Biz örneğimizde bu yöntem esnektir gösterir: Bu çıkarma-ebilmek var olmak kılınmak ile başvuruları (R) bu derlemeleri veya ham okuma oluşmaktadır ve nükleik asit (DNA vs RNA) eşleşen üzerinde bağımlı değildir.

Protocol

1. de novo araya başlayarak sırası Not: derleme bu verilerden üretilebilir sürece herhangi bir yeni nesil sıralı (NGS) verileri, kullanılabilir. Illumina, PacBio, uygun giriş verileri içerir veya Oxford Nanopore bir fasta dosyaya monte okur. Concreteness için bu bölümde açıklanmaktadır bir Illumina tabanlı transcriptomic derleme belirli zebra finch bir çalışma biz gerçekleştirilen7; Ancak ayrıntıları projeye göre değişir unutmayın. Bi…

Representative Results

PATLAMA çalıştırdıktan sonra çıktı dosyasını sorgudan veritabanıyla eşleşmesi sýra bir listesi olacak. Python çıkarma sonra nonmatching dizileri bir dizi elde edilen ve qPCR tarafından test edilmiştir. Bu sonuçlar ve sonraki adımlar, aşağıda ele alınmıştır. Negatif sonuç. Patlamadan sonra başvuru sırasına görülebilir iki olası olumsuz sonuçları vardır. Toplam sıra herhangi b…

Discussion

Eksiltici genomik güçlü olmakla birlikte, özelleştirme birkaç önemli adımlar ve başvuru dizileri ve test örnekleri dikkatli seçimi gerektiren bir çerez kesici yaklaşım değildir. Sorgu derleme kalitesiz ise, adımları süzme yalnızca derleme eserler izole. Bu nedenle, iyice belirli proje için bir uygun doğrulama protokolü kullanılarak de novo derleme doğrulanması önemlidir. RNA-seq için yönergeleri Tarih teslis Web sitesi18 ve DNA’ın, REAPR23</s…

Declarações

The authors have nothing to disclose.

Acknowledgements

Yazarlar Michelle Biederman, Alyssa Pedersen ve Colin J. Saldanha çeşitli aşamalarında zebra finch genomik proje ile onların yardımını kabul edersiniz. Ayrıca Evgeny Bisk küme sistem yönetimi ve NIH grant 1K22CA184297 (için J.R.B.) ve NIH NS 042767 (C.J.S için) bilgi işlem için kabul.

Materials

Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

Referências

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer’s Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics’ GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).

Play Video

Citar este artigo
Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

View Video