Summary

宿主と病原体の相互作用を調するためのハイスループットトランスクリプトーム解析

Published: March 05, 2022
doi:

Summary

ここで示すプロトコルは、高度な統計分析アプローチへの品質管理と前処理のステップを含む、生の読み取りから機能分析までのRNAシーケンシングトランスクリプトームデータを分析するための完全なパイプラインを説明しています。

Abstract

病原体は、多種多様な感染症を引き起こす可能性があります。感染に応答して宿主によって誘導される生物学的プロセスは、疾患の重症度を決定する。このようなプロセスを研究するために、研究者は、感染、臨床結果、または疾患重症度の異なる段階で宿主転写体の動的変化を測定するハイスループットシーケンシング技術(RNA-seq)を使用することができます。この調査は、病気のより良い理解につながるだけでなく、潜在的な薬物標的と治療を明らかにすることができます。ここで示すプロトコルは、生の読み取りから機能解析までの RNA シーケンシング データを分析するための完全なパイプラインを記述します。パイプラインは 5 つのステップに分けられます: (1) データの品質管理;(2)遺伝子のマッピングと注釈(3)遺伝子と共発現遺伝子の遺伝子を分化して同定する統計解析(4)サンプルの摂動の分子程度の決定;(5)機能分析。手順 1 では、下流解析の品質に影響を与える可能性のある技術的なアーティファクトを削除します。ステップ2では、遺伝子は標準ライブラリプロトコルに従ってマッピングされ、また、アポイントトされます。ステップ3の統計解析では、感染していないサンプルと比較して、感染したサンプルで差で発現または共発現している遺伝子を特定します。サンプルの変動性および潜在的な生物学的外れ値の存在は、ステップ4の摂動アプローチの分子程度を使用して検証される。最後に、ステップ5の機能解析は、疾患表現型に関連する経路を明らかにする。このパイプラインは、宿主と病原体の相互作用研究によるRNA-seqデータ分析を通じて研究者を支援し、感染の分子メカニズムを理解するために不可欠なインビトロ または インビボ実験の 未来を推進することを目的としています。

Introduction

デング熱、黄熱病、チクングニア、ジカなどのアルボウイルスは、いくつかの流行の流行に広く関連しており、過去数十年でヒトに感染する主な病原体の1つとして出現しました1,2。チクングニアウイルス(CHIKV)に感染した人は、発熱、頭痛、発疹、ポリアルーギー、関節炎を持つことがよくあります3,4,5ウイルスは、細胞の遺伝子発現を破壊し、様々な宿主シグナル伝達経路に影響を与える可能性があります。近年、血液転写酵素研究は、RNA-seqを利用して、回復期6または健康なコントロール7と比較して急性CHIKV感染に関連する微分発現遺伝子(DEG)を同定した。CHIKVに感染した小児は、ウイルスRNAの細胞センサー、JAK/STATシグナル伝達、TOLL様受容体シグナル伝達経路に関連するものなど、先天性免疫に関与する遺伝子を有していた。CHIKVに急性感染した成人は、単球および樹状細胞活性化に関連するもの、および抗ウイルス応答に関連するものなど、先天性免疫に関連する遺伝子の誘導も示したダウンレギュレーション遺伝子を豊富に含むシグナル経路には、T細胞の活性化やT細胞およびB細胞における分化および濃縮などの適応免疫に関連するものが含まれていた

宿主および病原体遺伝子のトランスクリプトームデータを分析するために、いくつかの方法を使用することができる。多くの場合、RNA-seqライブラリー調製は成熟したポリA転写物の濃縮から始まります。このステップは、リボソームRNA(rRNA)の大部分を除去し、いくつかのケースではウイルス/細菌RNAを除去する。しかし、生物学的な質問が病原体転写物検出を伴い、RNAが以前の選択とは無関係に配列化される場合、他の多くの異なる転写物はシーケンシングによって検出され得る。例えば、サブゲノムmRNAは、疾患の重症度を確認する重要な因子であることが示されている8。さらに、CHIKVやSARS-CoV-2のような特定のウイルスに対して、ポリA濃縮ライブラリでさえ、下流の分析で利用できるウイルス読み取りを生成します9,10。宿主転写体の分析に焦点を当てると、研究者はサンプル間の生物学的摂動を調べ、微分発現された遺伝子および濃縮経路を同定し、共発現モジュール7,11,12を生成することができます。このプロトコルは、異なるバイオインフォマティクスアプローチを用いたCHIKV感染患者および健常者の転写分析を強調する(図1A)。以前に発表された研究からのデータ7は、20人の健康な人と39人のCHIKV急性感染者からなるが、代表的な結果を生成するために使用された。

Protocol

このプロトコルで使用されるサンプルは、サンパウロ大学生物医学研究所の微生物学部門とセルジペ連邦大学の両方の倫理委員会によって承認されました(プロトコル:54937216.5.0000.5400.5467と54835916.2.0000.5546)。 1. Docker デスクトップのインストール 注: Docker 環境を準備する手順は、オペレーティング システム (OS) によって異なります。したが?…

Representative Results

トランスクリプトーム分析のコンピューティング環境は、Docker プラットフォームで作成および構成されました。このアプローチにより、初心者の Linux ユーザーは、事前管理知識を持たずに Linux 端末システムを使用できます。Docker プラットフォームは、ホスト OS のリソースを使用して、特定のユーザーのツールを含むサービス コンテナーを作成します (図 1B)。Linux OS U…

Discussion

シーケンシングライブラリの準備は、可能な限り最善の方法で生物学的な質問に答えするための重要なステップです。研究の関心のあるトランスクリプトの種類は、どのシーケンシングライブラリが選択されるかの指針となり、バイオインフォマティクス分析を推進します。例えば、病原体と宿主相互作用のシーケンシングから、シーケンシングの種類に応じて、ホストトランスクリプトの?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

HNはFAPESP(助成金番号:#2017/50137-3、2012/19278-6、2018/14933-2、2018/21934-5、2013/08216-2)およびCNPq(313662/2017-7)によって資金提供されています。

私たちは、フェローのための次の助成金に特に感謝しています: ANAG (FAPESPプロセス2019/13880-5), VEM (FAPESPプロセス2019/16418-0), IMSC (FAPESPプロセス2020/05284-0), APV (FAPESPプロセス2019/27146-1) RLTO (CNPq プロセス 134204/2019-0)。

Materials

CEMiTool Computational Systems Biology Laboratory 1.12.2 Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs.
EdgeR Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au]) 3.30.3 Differential expression analysis of RNA-seq expression profiles with biological replication
EnhancedVolcano Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk]) 1.6.0 Publication-ready volcano plots with enhanced colouring and labeling
FastQC Babraham Bioinformatics 0.11.9 Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing
FeatureCounts Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.0.0 Assign mapped sequencing reads to specified genomic features
MDP Computational Systems Biology Laboratory 1.8.0 Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls
R R Core Group 4.0.3 Programming language and free software environment for statistical computing and graphics
STAR Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.7.6a Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments
Bowtie2 Johns Hopkins University 2.4.2 Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences
Trimmomatic THE USADEL LAB 0.39 Trimming adapter sequence tasks for Illumina paired-end and single-ended data
Get Docker Docker 20.10.2 Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/)
WSL2-Kernel Windows NA https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel
Get Docker Linux Docker NA https://docs.docker.com/engine/install/ubuntu/
Docker Linux Repository Docker NA https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository
MDP Website Computational Systems Biology Laboratory NA https://mdp.sysbio.tools
Enrichr Website MaayanLab NA https://maayanlab.cloud/Enrichr/
webCEMiTool Computational Systems Biology Laboratory NA https://cemitool.sysbio.tools/
gProfiler Bioinformatics, Algorithmics and Data Mining Group NA https://biit.cs.ut.ee/gprofiler/gost
goseq Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk]) NA http://bioconductor.org/packages/release/bioc/html/goseq.html
SRA NCBI study NCBI NA https://www.ncbi.nlm.nih.gov/bioproject/PRJNA507472/

References

  1. Weaver, S. C., Charlier, C., Vasilakis, N., Lecuit, M. Zika, Chikungunya, and Other Emerging Vector-Borne Viral Diseases. Annual Review of Medicine. 69, 395-408 (2018).
  2. Burt, F. J., et al. Chikungunya virus: an update on the biology and pathogenesis of this emerging pathogen. The Lancet. Infectious Diseases. 17 (4), 107-117 (2017).
  3. Hua, C., Combe, B. Chikungunya virus-associated disease. Current Rheumatology Reports. 19 (11), 69 (2017).
  4. Suhrbier, A., Jaffar-Bandjee, M. -. C., Gasque, P. Arthritogenic alphaviruses-an overview. Nature Reviews Rheumatology. 8 (7), 420-429 (2012).
  5. Nakaya, H. I., et al. Gene profiling of chikungunya virus arthritis in a mouse model reveals significant overlap with rheumatoid arthritis. Arthritis and Rheumatism. 64 (11), 3553-3563 (2012).
  6. Michlmayr, D., et al. Comprehensive innate immune profiling of chikungunya virus infection in pediatric cases. Molecular Systems Biology. 14 (8), 7862 (2018).
  7. Soares-Schanoski, A., et al. Systems analysis of subjects acutely infected with the Chikungunya virus. PLOS Pathogens. 15 (6), 1007880 (2019).
  8. Alexandersen, S., Chamings, A., Bhatta, T. R. SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nature Communications. 11 (1), 6059 (2020).
  9. Wang, D., et al. The SARS-CoV-2 subgenome landscape and its novel regulatory features. Molecular Cell. 81 (10), 2135-2147 (2021).
  10. Wilson, J. A. C., et al. RNA-Seq analysis of chikungunya virus infection and identification of granzyme A as a major promoter of arthritic inflammation. PLOS Pathogens. 13 (2), 1006155 (2017).
  11. Gonçalves, A. N. A., et al. Assessing the impact of sample heterogeneity on transcriptome analysis of human diseases using MDP webtool. Frontiers in Genetics. 10, 971 (2019).
  12. Russo, P. S. T., et al. CEMiTool: a Bioconductor package for performing comprehensive modular co-expression analyses. BMC Bioinformatics. 19 (1), 56 (2018).
  13. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12 (12), 0190152 (2017).
  14. Seyednasrollah, F., Laiho, A., Elo, L. L. Comparison of software packages for detecting differential expression in RNA-seq studies. Briefings in Bioinformatics. 16 (1), 59-70 (2015).
  15. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  16. Cheng, C. W., Beech, D. J., Wheatcroft, S. B. Advantages of CEMiTool for gene co-expression analysis of RNA-seq data. Computers in Biology and Medicine. 125, 103975 (2020).
  17. Cardozo, L. E., et al. webCEMiTool: Co-expression modular analysis made easy. Frontiers in Genetics. 10, 146 (2019).
  18. de Lima, D. S., et al. Long noncoding RNAs are involved in multiple immunological pathways in response to vaccination. Proceedings of the National Academy of Sciences of the United States of America. 116 (34), 17121-17126 (2019).
  19. Prada-Medina, C. A., et al. Systems immunology of diabetes-tuberculosis comorbidity reveals signatures of disease complications. Scientific Reports. 7 (1), 1999 (2017).
  20. Chen, E. Y., et al. Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool. BMC Bioinformatics. 14, 128 (2013).
  21. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  22. Raudvere, U., et al. g:Profiler: a web server for functional enrichment analysis and conversions of gene lists (2019 update). Nucleic Acids Research. 47, 191-198 (2019).
  23. Young, M. D., Wakefield, M. J., Smyth, G. K., Oshlack, A. Gene ontology analysis for RNA-seq: accounting for selection bias. Genome Biology. 11 (2), 14 (2010).
check_url/62324?article_type=t

Play Video

Cite This Article
Aquime Gonçalves, A. N., Escolano Maso, V., Maia Santos de Castro, Í., Pereira Vasconcelos, A., Tomio Ogava, R. L., I Nakaya, H. High-Throughput Transcriptome Analysis for Investigating Host-Pathogen Interactions. J. Vis. Exp. (181), e62324, doi:10.3791/62324 (2022).

View Video