Summary

होस्ट-रोगज़नक़ इंटरैक्शन की जांच के लिए उच्च-थ्रूपुट ट्रांसक्रिप्टोम विश्लेषण

Published: March 05, 2022
doi:

Summary

यहां प्रस्तुत प्रोटोकॉल आरएनए-अनुक्रमण ट्रांसक्रिप्टोम डेटा का विश्लेषण करने के लिए एक पूर्ण पाइपलाइन का वर्णन करता है कच्चे पठन से कार्यात्मक विश्लेषण तक, जिसमें गुणवत्ता नियंत्रण और उन्नत सांख्यिकीय विश्लेषणात्मक दृष्टिकोणों के लिए प्रीप्रोसेसिंग चरण शामिल हैं।

Abstract

रोगजनकों संक्रामक रोगों की एक विस्तृत विविधता का कारण बन सकता है। संक्रमण के जवाब में मेजबान द्वारा प्रेरित जैविक प्रक्रियाएं बीमारी की गंभीरता को निर्धारित करती हैं। इस तरह की प्रक्रियाओं का अध्ययन करने के लिए, शोधकर्ता उच्च-थ्रूपुट अनुक्रमण तकनीकों (आरएनए-सेक) का उपयोग कर सकते हैं जो संक्रमण, नैदानिक परिणामों या बीमारी की गंभीरता के विभिन्न चरणों में मेजबान ट्रांसक्रिप्टोम के गतिशील परिवर्तनों को मापते हैं। यह जांच बीमारियों की बेहतर समझ पैदा कर सकती है, साथ ही संभावित दवा लक्ष्यों और उपचारों को उजागर कर सकती है। यहां प्रस्तुत प्रोटोकॉल आरएनए-अनुक्रमण डेटा का विश्लेषण करने के लिए एक पूर्ण पाइपलाइन का वर्णन करता है जो कच्चे पठन से कार्यात्मक विश्लेषण तक है। पाइपलाइन को पांच चरणों में विभाजित किया गया है: (1) डेटा का गुणवत्ता नियंत्रण; (2) जीन का मानचित्रण और एनोटेशन; (3) विभेदक रूप से व्यक्त जीन और सह-व्यक्त जीन की पहचान करने के लिए सांख्यिकीय विश्लेषण; (4) नमूनों की गड़बड़ी की आणविक डिग्री का निर्धारण; और (5) कार्यात्मक विश्लेषण। चरण 1 तकनीकी कलाकृतियों को हटा देता है जो डाउनस्ट्रीम विश्लेषण की गुणवत्ता को प्रभावित कर सकते हैं। चरण 2 में, जीन को मानक लाइब्रेरी प्रोटोकॉल के अनुसार मैप और एनोटेट किया जाता है। चरण 3 में सांख्यिकीय विश्लेषण उन जीनों की पहचान करता है जो गैर-संक्रमित लोगों की तुलना में संक्रमित नमूनों में अलग-अलग रूप से व्यक्त या सह-व्यक्त किए जाते हैं। नमूना परिवर्तनशीलता और संभावित जैविक outliers की उपस्थिति चरण 4 में गड़बड़ी दृष्टिकोण की आणविक डिग्री का उपयोग करके सत्यापित कर रहे हैं। अंत में, चरण 5 में कार्यात्मक विश्लेषण रोग फेनोटाइप से जुड़े मार्गों का पता चलता है। प्रस्तुत पाइपलाइन का उद्देश्य मेजबान-रोगज़नक़ इंटरैक्शन अध्ययनों से आरएनए-सेक डेटा विश्लेषण के माध्यम से शोधकर्ताओं का समर्थन करना है और विट्रो या विवो प्रयोगों में भविष्य को ड्राइव करना है, जो संक्रमण के आणविक तंत्र को समझने के लिए आवश्यक हैं।

Introduction

Arboviruses, जैसे डेंगू, पीला बुखार, चिकनगुनिया, और जीका, व्यापक रूप से कई स्थानिक प्रकोपों के साथ जुड़े हुए हैं और पिछले दशकों में मनुष्यों को संक्रमित करने के लिए जिम्मेदार मुख्य रोगजनकों में से एक के रूप में उभरे हैं1,2 चिकनगुनिया वायरस (CHIKV) से संक्रमित व्यक्तियों को अक्सर बुखार, सिरदर्द, दाने, पॉलीआर्थ्राल्जिया और गठिया 3,4,5 होता है। वायरस सेल की जीन अभिव्यक्ति को नष्ट कर सकते हैं और विभिन्न मेजबान सिग्नलिंग मार्गों को प्रभावित कर सकते हैं। हाल ही में, रक्त ट्रांसक्रिप्टोम अध्ययनों ने आरएनए-सेक का उपयोग किया ताकि आरएनए-सेक का उपयोग किया जा सके जो कि तीव्र CHIKV संक्रमण से जुड़े विभेदक रूप से व्यक्त जीन (डीईजी) की पहचान करने के लिए है, जो कि convalescence6 या स्वस्थ नियंत्रण 7 की तुलना में है। CHIKV-संक्रमित बच्चों में अप-विनियमित जीन थे जो जन्मजात प्रतिरक्षा में शामिल होते हैं, जैसे कि वायरल आरएनए, जेएके / एसटीएटी सिग्नलिंग के लिए सेलुलर सेंसर से संबंधित, और टोल-जैसे रिसेप्टर सिग्नलिंग पाथवे 6। CHIKV से गंभीर रूप से संक्रमित वयस्कों ने भी जन्मजात प्रतिरक्षा से संबंधित जीनों का प्रेरण दिखाया, जैसे कि मोनोसाइट्स और डेंड्राइटिक सेल सक्रियण से संबंधित, और एंटीवायरल प्रतिक्रियाओं 7 से संबंधित। डाउन-विनियमित जीन के साथ समृद्ध सिग्नलिंग मार्गों में अनुकूली प्रतिरक्षा से संबंधित लोग शामिल थे, जैसे कि टी सेल सक्रियण और टी और बी कोशिकाओं में भेदभाव और संवर्धन।

मेजबान और रोगज़नक़ जीन के ट्रांसक्रिप्टोम डेटा का विश्लेषण करने के लिए कई तरीकों का उपयोग किया जा सकता है। अक्सर, आरएनए-सेक लाइब्रेरी की तैयारी परिपक्व पॉली-ए टेपों के संवर्धन के साथ शुरू होती है। यह चरण अधिकांश राइबोसोमल आरएनए (आरआरएनए) को हटा देता है और कुछ मामलों में वायरल / बैक्टीरियल आरएनए को हटा देता है। हालांकि, जब जैविक प्रश्न में रोगज़नक़ प्रतिलेख का पता लगाना शामिल होता है और आरएनए को पिछले चयन से स्वतंत्र अनुक्रमित किया जाता है, तो अनुक्रमण द्वारा कई अन्य अलग-अलग टेपों का पता लगाया जा सकता है। उदाहरण के लिए, subgenomic mRNA को बीमारियों की गंभीरता को सत्यापित करने के लिए एक महत्वपूर्ण कारक दिखाया गया है8। इसके अलावा, कुछ वायरस जैसे कि CHIKV और SARS-CoV-2 के लिए, यहां तक कि पॉली-ए समृद्ध पुस्तकालय वायरल रीड्स उत्पन्न करते हैं जिनका उपयोग डाउनस्ट्रीम विश्लेषण9,10 में किया जा सकता है। जब मेजबान ट्रांसक्रिप्टोम के विश्लेषण पर ध्यान केंद्रित किया जाता है, तो शोधकर्ता नमूनों में जैविक गड़बड़ी की जांच कर सकते हैं, विभेदक रूप से व्यक्त जीन और समृद्ध मार्गों की पहचान कर सकते हैं, और सह-अभिव्यक्ति मॉड्यूल 7,11,12 उत्पन्न कर सकते हैं। यह प्रोटोकॉल विभिन्न जैव सूचनात्मक दृष्टिकोणों (चित्रा 1 ए) का उपयोग करके चिकवी-संक्रमित रोगियों और स्वस्थ व्यक्तियों के ट्रांसक्रिप्टोम विश्लेषण पर प्रकाश डालता है। पहले प्रकाशित एक अध्ययन 7 से डेटा जिसमें 20 स्वस्थ और 39 CHIKV तीव्र रूप से संक्रमित व्यक्तियों को शामिल किया गया था, का उपयोग प्रतिनिधि परिणाम उत्पन्न करने के लिए किया गया था।

Protocol

इस प्रोटोकॉल में उपयोग किए जाने वाले नमूनों को साओ पाउलो विश्वविद्यालय में बायोमेडिकल साइंसेज संस्थान के माइक्रोबायोलॉजी विभाग और सर्गिप के संघीय विश्वविद्यालय (प्रोटोकॉल: 54937216.5.0000.5467 और 54835916.2.0000.5546, क्रम?…

Representative Results

ट्रांसक्रिप्टोम विश्लेषण के लिए कंप्यूटिंग वातावरण बनाया गया था और डॉकर प्लेटफ़ॉर्म पर कॉन्फ़िगर किया गया था। यह दृष्टिकोण शुरुआती लिनक्स उपयोगकर्ताओं को एक प्राथमिकता प्रबंधन ज्ञान के बिना लिनक?…

Discussion

अनुक्रमण पुस्तकालयों की तैयारी जैविक प्रश्नों का सर्वोत्तम संभव तरीके से उत्तर देने की दिशा में एक महत्वपूर्ण कदम है। अध्ययन की रुचि के टेपों का प्रकार मार्गदर्शन करेगा कि किस प्रकार के अनुक्रमण पुस…

Disclosures

The authors have nothing to disclose.

Acknowledgements

एचएन को FAPESP (अनुदान संख्या: #2017/50137-3, 2012/19278-6, 2018/14933-2, 2018/21934-5, और 2013/08216-2) और CNPq (313662/2017-7) द्वारा वित्त पोषित किया जाता है।

हम विशेष रूप से अध्येताओं के लिए निम्नलिखित अनुदानों के लिए आभारी हैं: ANAG (FAPESP प्रक्रिया 2019/13880-5), VEM (FAPESP प्रक्रिया 2019/16418-0), IMSC (FAPESP प्रक्रिया 2020/05284-0), APV (FAPESP प्रक्रिया 2019/27146-1) और, RLTO (CNPq प्रक्रिया 134204/2019-0)।

Materials

CEMiTool Computational Systems Biology Laboratory 1.12.2 Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs.
EdgeR Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au]) 3.30.3 Differential expression analysis of RNA-seq expression profiles with biological replication
EnhancedVolcano Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk]) 1.6.0 Publication-ready volcano plots with enhanced colouring and labeling
FastQC Babraham Bioinformatics 0.11.9 Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing
FeatureCounts Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.0.0 Assign mapped sequencing reads to specified genomic features
MDP Computational Systems Biology Laboratory 1.8.0 Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls
R R Core Group 4.0.3 Programming language and free software environment for statistical computing and graphics
STAR Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.7.6a Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments
Bowtie2 Johns Hopkins University 2.4.2 Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences
Trimmomatic THE USADEL LAB 0.39 Trimming adapter sequence tasks for Illumina paired-end and single-ended data
Get Docker Docker 20.10.2 Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/)
WSL2-Kernel Windows NA https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel
Get Docker Linux Docker NA https://docs.docker.com/engine/install/ubuntu/
Docker Linux Repository Docker NA https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository
MDP Website Computational Systems Biology Laboratory NA https://mdp.sysbio.tools
Enrichr Website MaayanLab NA https://maayanlab.cloud/Enrichr/
webCEMiTool Computational Systems Biology Laboratory NA https://cemitool.sysbio.tools/
gProfiler Bioinformatics, Algorithmics and Data Mining Group NA https://biit.cs.ut.ee/gprofiler/gost
goseq Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk]) NA http://bioconductor.org/packages/release/bioc/html/goseq.html
SRA NCBI study NCBI NA https://www.ncbi.nlm.nih.gov/bioproject/PRJNA507472/

References

  1. Weaver, S. C., Charlier, C., Vasilakis, N., Lecuit, M. Zika, Chikungunya, and Other Emerging Vector-Borne Viral Diseases. Annual Review of Medicine. 69, 395-408 (2018).
  2. Burt, F. J., et al. Chikungunya virus: an update on the biology and pathogenesis of this emerging pathogen. The Lancet. Infectious Diseases. 17 (4), 107-117 (2017).
  3. Hua, C., Combe, B. Chikungunya virus-associated disease. Current Rheumatology Reports. 19 (11), 69 (2017).
  4. Suhrbier, A., Jaffar-Bandjee, M. -. C., Gasque, P. Arthritogenic alphaviruses-an overview. Nature Reviews Rheumatology. 8 (7), 420-429 (2012).
  5. Nakaya, H. I., et al. Gene profiling of chikungunya virus arthritis in a mouse model reveals significant overlap with rheumatoid arthritis. Arthritis and Rheumatism. 64 (11), 3553-3563 (2012).
  6. Michlmayr, D., et al. Comprehensive innate immune profiling of chikungunya virus infection in pediatric cases. Molecular Systems Biology. 14 (8), 7862 (2018).
  7. Soares-Schanoski, A., et al. Systems analysis of subjects acutely infected with the Chikungunya virus. PLOS Pathogens. 15 (6), 1007880 (2019).
  8. Alexandersen, S., Chamings, A., Bhatta, T. R. SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nature Communications. 11 (1), 6059 (2020).
  9. Wang, D., et al. The SARS-CoV-2 subgenome landscape and its novel regulatory features. Molecular Cell. 81 (10), 2135-2147 (2021).
  10. Wilson, J. A. C., et al. RNA-Seq analysis of chikungunya virus infection and identification of granzyme A as a major promoter of arthritic inflammation. PLOS Pathogens. 13 (2), 1006155 (2017).
  11. Gonçalves, A. N. A., et al. Assessing the impact of sample heterogeneity on transcriptome analysis of human diseases using MDP webtool. Frontiers in Genetics. 10, 971 (2019).
  12. Russo, P. S. T., et al. CEMiTool: a Bioconductor package for performing comprehensive modular co-expression analyses. BMC Bioinformatics. 19 (1), 56 (2018).
  13. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12 (12), 0190152 (2017).
  14. Seyednasrollah, F., Laiho, A., Elo, L. L. Comparison of software packages for detecting differential expression in RNA-seq studies. Briefings in Bioinformatics. 16 (1), 59-70 (2015).
  15. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  16. Cheng, C. W., Beech, D. J., Wheatcroft, S. B. Advantages of CEMiTool for gene co-expression analysis of RNA-seq data. Computers in Biology and Medicine. 125, 103975 (2020).
  17. Cardozo, L. E., et al. webCEMiTool: Co-expression modular analysis made easy. Frontiers in Genetics. 10, 146 (2019).
  18. de Lima, D. S., et al. Long noncoding RNAs are involved in multiple immunological pathways in response to vaccination. Proceedings of the National Academy of Sciences of the United States of America. 116 (34), 17121-17126 (2019).
  19. Prada-Medina, C. A., et al. Systems immunology of diabetes-tuberculosis comorbidity reveals signatures of disease complications. Scientific Reports. 7 (1), 1999 (2017).
  20. Chen, E. Y., et al. Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool. BMC Bioinformatics. 14, 128 (2013).
  21. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  22. Raudvere, U., et al. g:Profiler: a web server for functional enrichment analysis and conversions of gene lists (2019 update). Nucleic Acids Research. 47, 191-198 (2019).
  23. Young, M. D., Wakefield, M. J., Smyth, G. K., Oshlack, A. Gene ontology analysis for RNA-seq: accounting for selection bias. Genome Biology. 11 (2), 14 (2010).
check_url/62324?article_type=t&slug=high-throughput-transcriptome-analysis-for-investigating-host

Play Video

Cite This Article
Aquime Gonçalves, A. N., Escolano Maso, V., Maia Santos de Castro, Í., Pereira Vasconcelos, A., Tomio Ogava, R. L., I Nakaya, H. High-Throughput Transcriptome Analysis for Investigating Host-Pathogen Interactions. J. Vis. Exp. (181), e62324, doi:10.3791/62324 (2022).

View Video