Summary

인 실리코 숙주-병원체 상호작용 중 circRNA의 식별 및 특성화

Published: October 21, 2022
doi:

Summary

여기에 제출된 프로토콜은 숙주-병원체 상호작용을 연구하는 RNA 시퀀싱 전사체 데이터에서 circRNA를 예측하고 기능적으로 특성화하는 데 필요한 완전한 인실리코 파이프라인을 설명합니다.

Abstract

원형 RNA(circRNA)는 역접합을 통해 형성되는 비암호화 RNA의 한 부류입니다. 이러한 circRNA는 다양한 생물학적 과정의 조절자로서의 역할에 대해 주로 연구됩니다. 특히, 새로운 증거는 숙주 circRNA가 병원체(예: 인플루엔자 및 코로나바이러스)에 감염될 때 차등적으로 발현(DE)될 수 있음을 보여주며, 이는 숙주 선천성 면역 반응을 조절하는 circRNA의 역할을 시사합니다. 그러나 병원성 감염 동안 circRNA의 역할에 대한 조사는 RNA 시퀀싱(RNA-seq) 데이터에서 DE circRNA를 식별하는 데 필요한 생물정보학적 분석을 수행하는 데 필요한 지식과 기술에 의해 제한됩니다. circRNA의 생물정보학 예측 및 식별은 검증에 앞서 중요하며, 비용과 시간이 많이 소요되는 습식 실험실 기술을 사용한 기능 연구도 중요합니다. 이 문제를 해결하기 위해 RNA-seq 데이터를 사용하여 circRNA의 in silico 예측 및 특성화에 대한 단계별 프로토콜이 이 원고에 제공됩니다. 프로토콜은 4 단계로 나눌 수 있습니다 : 1) CIRIquant 파이프 라인을 통한 DE circRNA의 예측 및 정량화; 2) circBase를 통한 주석 및 DE circRNA의 특성화; 3) Circr 파이프라인을 통한 CircRNA-miRNA 상호작용 예측; 4) 유전자 온톨로지(Gene Ontology, GO)와 교토 유전자 및 게놈 백과사전(Kyoto Encyclopedia of Genes and Genomes, KEGG)을 이용한 circRNA 모유전자의 기능적 농축 분석. 이 파이프라인은 숙주-병원체 상호작용에서 circRNA의 역할을 더욱 밝히기 위해 미래의 시험관 내 및 생체 내 연구를 추진하는 데 유용할 것입니다.

Introduction

숙주-병원체 상호작용은 병원체와 숙주 유기체 사이의 복잡한 상호작용을 나타내며, 이는 숙주의 선천적 면역 반응을 유발하여 결국 침입하는 병원체를 제거한다 1,2. 병원성 감염 동안, 다수의 숙주 면역 유전자는 병원체의 복제 및 방출을 억제하도록 조절된다. 예를 들어, 병원성 감염에 따라 조절되는 일반적인 인터페론 자극 유전자 (ISG)는 ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I 및 OASL 3,4를 포함한다. 단백질 코딩 유전자 외에도, 연구에서는 긴 비암호화 RNA(lncRNA), 마이크로 RNA(miRNA) 및 원형 RNA(circRNA)와 같은 비암호화 RNA도 병원성 감염동안 역할을 하고 동시에 조절된다고 보고했습니다 5,6,7. 단백질을 기능적 분자로 주로 암호화하는 단백질 코딩 유전자와 달리, 비암호화 RNA(ncRNA)는 전사 및 전사 후 수준에서 유전자의 조절자로서 기능하는 것으로 알려져 있습니다. 그러나 숙주의 면역 유전자를 조절하는 데 비암호화 RNA, 특히 circRNA의 참여와 관련된 연구는 단백질 코딩 유전자에 비해 잘 보고되지 않았습니다.

CircRNA는 백스플라이싱(back-splicing)이라고 하는 비정준 스플라이싱 프로세스를 통해 생성되는 공유 폐쇄 연속 루프 구조를 특징으로 한다8. 동족 선형 RNA의 스플라이싱 과정과 달리 역접합 과정은 다운스트림 기증자 부위를 업스트림 수용체 부위로 결찰하여 원형 구조를 형성하는 과정을 포함합니다. 현재, circRNA의 생물 발생을 위한 세 가지 다른 역접합 메커니즘이 제안되었습니다. 이들은 RNA 결합 단백질(RBP) 매개 순환화(intron-pairing-driven circularization) 9,10, 인트론-페어링-유도 순환화(intron-pairing-driven circularization) 11 및 라리아트-유도 순환화(lariat-driven circularization)12,13,14이다. circRNA가 원형 구조에서 종단 간 연결되어 있다는 점을 감안할 때, 이들은 정상적인 엑소뉴클레아제 소화에 자연적으로 내성을 갖는 경향이 있으며, 따라서 선형 대응물보다 더 안정적인 것으로 간주됩니다15. circRNAs에 의해 나타나는 또 다른 공통적인 특징은 숙주에서의 세포 또는 조직 유형-특이적 발현을 포함한다16.

독특한 구조와 세포 또는 조직 특이적 발현에서 알 수 있듯이 circRNA는 세포에서 중요한 생물학적 기능을 수행하는 것으로 밝혀졌습니다. 현재까지, circRNAs의 두드러진 기능 중 하나는 microRNA (miRNA) 스폰지로서의 역할이다17,18. circRNA의 이러한 조절 역할은 circRNA 뉴클레오티드와 miRNA의 종자 영역의 상보적 결합을 통해 발생합니다. 이러한 circRNA-miRNA 상호작용은 표적 mRNA에 대한 miRNA의 정상적인 조절 기능을 억제하여 유전자19,20의 발현을 조절합니다. 또한, circRNA는 RNA 결합 단백질(RBP)과 상호작용하고 RNA-단백질 복합체를 형성함으로써 유전자 발현을 조절하는 것으로도 알려져 있다21. circRNA는 비암호화 RNA로 분류되지만 circRNA가 단백질 번역을 위한 주형으로 작용할 수 있다는 증거도 있습니다22,23,24.

최근에, circRNA는 숙주-병원체 상호작용, 특히 숙주와 바이러스 사이의 상호작용을 조절하는 데 중추적인 역할을 하는 것으로 입증되었습니다. 일반적으로 숙주 circRNA는 침입하는 병원체를 제거하기 위해 숙주의 면역 반응을 조절하는 데 도움이 되는 것으로 가정합니다. 숙주 면역 반응을 촉진하는 circRNA의 예는 Guo et al.25에 의해 보고된 circRNA_0082633입니다. 이 circRNA는 A549 세포 내에서 I형 인터페론(IFN) 신호 전달을 향상시켜 인플루엔자 바이러스 복제를 억제하는 데 도움이 된다25. 또한, Qu et al. IFN-β26,27의 신호 변환기인 CREB 결합 단백질(CREBBP)의 발현을 조절하여 면역을 촉진하는 circRNA AIVR이라고 하는 인간 인트로닉 circRNA도 보고했습니다. 그러나, 감염 시 질병의 발병기전을 촉진하는 것으로 알려진 circRNA도 존재한다. 예를 들어, Yu 등은 최근 숙주 세포 자가포식의 억제를 통해 H1N1 바이러스 복제를 촉진하는 데 있어 2A 유전자(circGATAD2A)를 포함하는 GATA 징크 핑거 도메인에서 스플라이싱된 circRNA가 수행하는 역할을 보고했습니다(28).

circRNA를 효과적으로 연구하기 위해 일반적으로 게놈 차원의 circRNA 예측 알고리즘이 구현된 후 기능적 연구를 수행하기 전에 예측된 circRNA 후보의 인실리코 특성화가 수행됩니다. circRNA를 예측하고 특성화하기 위한 이러한 생물정보학 접근 방식은 비용이 적게 들고 시간 효율적입니다. 기능적으로 연구할 후보의 수를 구체화하는 데 도움이 되며 잠재적으로 새로운 발견으로 이어질 수 있습니다. 여기에서 우리는 숙주-병원체 상호 작용 동안 circRNA의 in silico 식별, 특성화 및 기능적 주석을 위한 상세한 생물정보학 기반 프로토콜을 제공합니다. 이 프로토콜에는 RNA 염기서열 분석 데이터 세트에서 circRNA의 식별 및 정량화, circBase를 통한 주석, circRNA 유형, 겹치는 유전자 수 및 예측된 circRNA-miRNA 상호 작용 측면에서 circRNA 후보의 특성화가 포함됩니다. 본 연구는 또한 유전자 온톨로지(Gene Ontology, GO)와 교토 유전자 및 게놈 백과사전(Kyoto Encyclopedia of Genes and Genomes, KEGG) 농축 분석을 통해 circRNA 부모 유전자의 기능적 주석을 제공한다.

Protocol

이 프로토콜에서는 인플루엔자 A 바이러스에 감염된 인간 대식세포에서 제조된 비식별화된 리보솜 RNA(rRNA)가 고갈된 RNA-seq 라이브러리 데이터 세트를 다운로드하여 유전자 발현 옴니버스(GEO) 데이터베이스에서 사용했습니다. circRNA의 예측에서 기능적 특성화에 이르는 전체 생물정보학 파이프라인은 그림 1에 요약되어 있습니다. 파이프라인의 각 부분은 아래 섹션에 자세히 …

Representative Results

이전 섹션에서 입대한 프로토콜은 Linux OS 시스템에 맞게 수정 및 구성되었습니다. 주된 이유는 circRNA 분석과 관련된 대부분의 모듈 라이브러리와 패키지가 Linux 플랫폼에서만 작동할 수 있기 때문입니다. 이 분석에서, 인플루엔자 A 바이러스에 감염된 인간 대식세포로부터 제조된 비식별화된 리보솜 RNA(rRNA)-고갈된 RNA-seq 라이브러리 데이터 세트를 GEO 데이터베이스(42 )로부터 다?…

Discussion

이 프로토콜의 유용성을 설명하기 위해, 인플루엔자 A 바이러스에 감염된 인간 대식세포로부터의 RNA-seq를 예로서 사용하였다. 숙주-병원체 상호작용에서 잠재적인 miRNA 스폰지로 기능하는 CircRNA와 숙주 내에서 GO 및 KEGG 기능적 농축을 조사했습니다. 온라인에서 사용할 수 있는 다양한 circRNA 도구가 있지만 각 도구는 서로 상호 작용하지 않는 독립형 패키지입니다. 여기에서는 circRNA 예측 및 정량화…

Disclosures

The authors have nothing to disclose.

Acknowledgements

저자는 이 원고에 대한 비판적 검토에 대해 Tan Ke En과 Dr. Cameron Bracken에게 감사를 표합니다. 이 작업은 기초 연구 보조금 제도(FRGS/1/2020/SKK0/UM/02/15) 및 말라야 대학교 임팩트 연구 보조금(UM. C/625/1/HIR/MOE/CHAN/02/07)입니다.

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/64565?article_type=t

Play Video

Cite This Article
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video