Summary

In Silico Identificatie en karakterisering van circRNA's tijdens gastheer-pathogeen interacties

Published: October 21, 2022
doi:

Summary

Het hier ingediende protocol verklaart de volledige in silico-pijplijn die nodig is om circRNA’s te voorspellen en functioneel te karakteriseren uit RNA-sequencing transcriptoomgegevens die gastheer-pathogeeninteracties bestuderen.

Abstract

Circulaire RNA’s (circRNA’s) zijn een klasse van niet-coderende RNA’s die worden gevormd via back-splicing. Deze circRNA’s worden voornamelijk bestudeerd voor hun rol als regulatoren van verschillende biologische processen. Met name opkomend bewijs toont aan dat gastheer circRNA’s differentieel tot expressie kunnen worden gebracht (DE) bij infectie met pathogenen (bijv. Influenza en coronavirussen), wat een rol suggereert voor circRNA’s bij het reguleren van aangeboren immuunresponsen van de gastheer. Onderzoek naar de rol van circRNA’s tijdens pathogene infecties wordt echter beperkt door de kennis en vaardigheden die nodig zijn om de noodzakelijke bioinformatische analyse uit te voeren om DE-circRNA’s te identificeren uit RNA-sequencing (RNA-seq) -gegevens. Bioinformatica voorspelling en identificatie van circRNA’s is cruciaal voor elke verificatie, en functionele studies met behulp van kostbare en tijdrovende wet-lab technieken. Om dit probleem op te lossen, wordt in dit manuscript een stapsgewijs protocol van in silico-voorspelling en karakterisering van circRNA’s met behulp van RNA-seq-gegevens verstrekt. Het protocol kan worden onderverdeeld in vier stappen: 1) Voorspelling en kwantificering van DE-circRNA’s via de CIRIquant-pijplijn; 2) Annotatie via circBase en karakterisering van DE circRNA’s; 3) CircRNA-miRNA interactie voorspelling via Circr pijplijn; 4) functionele verrijkingsanalyse van circRNA-oudergenen met behulp van Gene Ontology (GO) en Kyoto Encyclopedia of Genes and Genomes (KEGG). Deze pijplijn zal nuttig zijn bij het stimuleren van toekomstig in vitro en in vivo onderzoek om de rol van circRNA’s in gastheer-pathogeen interacties verder te ontrafelen.

Introduction

Gastheer-pathogeen interacties vertegenwoordigen een complex samenspel tussen de pathogenen en gastheerorganismen, dat de aangeboren immuunresponsen van de gastheren veroorzaakt die uiteindelijk resulteren in de verwijdering van binnendringende pathogenen 1,2. Tijdens pathogene infecties wordt een groot aantal immuungenen van de gastheer gereguleerd om de replicatie en afgifte van pathogenen te remmen. Gemeenschappelijke interferon-gestimuleerde genen (ISG’s) gereguleerd op pathogene infecties omvatten bijvoorbeeld ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I en OASL 3,4. Naast eiwitcoderende genen hebben studies ook gemeld dat niet-coderende RNA’s zoals lange niet-coderende RNA’s (lncRNA’s), microRNA’s (miRNA’s) en circulaire RNA’s (circRNA’s) ook een rol spelen en gelijktijdig worden gereguleerd tijdens pathogene infecties 5,6,7. In tegenstelling tot eiwitcoderende genen die voornamelijk coderen voor eiwitten als functionele moleculen, is het bekend dat niet-coderende RNA’s (ncRNA’s) functioneren als regulatoren van genen op transcriptionele en post-transcriptionele niveaus. Studies met de deelname van niet-coderende RNA’s, met name circRNA’s, bij het reguleren van de immuungenen van de gastheren zijn echter niet goed gerapporteerd in vergelijking met de eiwitcoderende genen.

CircRNA’s worden op grote schaal gekenmerkt door hun covalent gesloten continue lusstructuur, die wordt gegenereerd door een niet-canoniek splicingproces dat back-splicing8 wordt genoemd. Het proces van back-splicing, in tegenstelling tot het splicingproces van verwante lineaire RNA’s, omvat de ligatie van de downstream donorplaats naar de upstream acceptorplaats, waardoor een cirkelvormige structuur wordt gevormd. Momenteel zijn drie verschillende back-splicing mechanismen voor de biogenese van circRNA’s voorgesteld. Dit zijn RNA binding protein (RBP) gemedieerde circularisatie9,10, intron-pairing-gedreven circularisatie 11 en lariat-gedreven circularisatie12,13,14. Aangezien circRNA’s end-to-end verbonden zijn in een cirkelvormige structuur, hebben ze de neiging om van nature resistent te zijn tegen normale exonuclease-verteringen en worden ze daarom als stabieler beschouwd dan hun lineaire tegenhangers15. Een ander gemeenschappelijk kenmerk van circRNA’s omvat de cel- of weefseltypespecifieke expressie in gastheren16.

Zoals geïmpliceerd door hun unieke structuur en cel- of weefselspecifieke expressie, is ontdekt dat circRNA’s belangrijke biologische functies in cellen spelen. Tot op heden is een van de prominente functies van circRNA’s hun rol als microRNA (miRNA) sponzen17,18. Deze regulerende rol van circRNA’s vindt plaats door de complementaire binding van circRNA-nucleotiden met het zaadgebied van miRNA’s. Een dergelijke circRNA-miRNA-interactie remt de normale regulerende functies van de miRNA’s op doel-mRNA’s, waardoor de expressie van genenwordt gereguleerd 19,20. Bovendien is ook bekend dat circRNA’s genexpressie reguleren door interactie met RNA-bindende eiwitten (RBP’s) en het vormen van RNA-eiwitcomplexen21. Hoewel circRNA’s worden geclassificeerd als niet-coderende RNA’s, zijn er ook aanwijzingen dat circRNA’s kunnen fungeren als sjablonen voor eiwittranslatie22,23,24.

Onlangs is aangetoond dat circRNA’s een cruciale rol spelen bij het reguleren van de gastheer-pathogeen interacties, met name tussen de gastheren en virussen. Over het algemeen wordt aangenomen dat gastheercircRNA’s helpen bij het reguleren van de immuunresponsen van de gastheer om de binnendringende pathogenen te elimineren. Een voorbeeld van circRNA dat immuunresponsen van de gastheer bevordert, is circRNA_0082633, gerapporteerd door Guo et al.25. Dit circRNA verbetert type I interferon (IFN) signalering in A549-cellen, wat helpt om influenzavirusreplicatiete onderdrukken 25. Bovendien rapporteerden Qu et al. ook een humaan intronisch circRNA, circRNA AIVR genaamd, dat de immuniteit bevordert door de expressie van CREB-bindend eiwit (CREBBP), een signaaltransducer van IFN-β26,27, te reguleren. Er bestaan echter ook circRNA’s waarvan bekend is dat ze de pathogenese van ziekte bij infectie bevorderen. Yu et al. rapporteerden bijvoorbeeld onlangs de rol die een circRNA uit het GATA-zinkvingerdomein met het 2A-gen (circGATAD2A) speelt bij het bevorderen van de replicatie van het H1N1-virus door de remming van autofagie van de gastheercel28.

Om circRNA’s effectief te bestuderen, wordt meestal een genoombreed circRNA-voorspellingsalgoritme geïmplementeerd, gevolgd door een in silico-karakterisering van de voorspelde circRNA-kandidaten voordat functionele studies kunnen worden uitgevoerd. Een dergelijke bioinformatica-benadering om circRNA’s te voorspellen en te karakteriseren is minder kostbaar en tijdsefficiënter. Het helpt om het aantal kandidaten dat functioneel moet worden bestudeerd te verfijnen en kan mogelijk leiden tot nieuwe bevindingen. Hier bieden we een gedetailleerd op bioinformatica gebaseerd protocol voor de in silico-identificatie , karakterisering en functionele annotatie van circRNA’s tijdens de gastheer-pathogeen interacties. Het protocol omvat de identificatie en kwantificering van circRNA’s uit RNA-sequencing datasets, annotatie via circBase en de karakterisering van de circRNA-kandidaten in termen van circRNA-typen, aantal overlappende genen en voorspelde circRNA-miRNA-interacties. Deze studie biedt ook de functionele annotatie van de circRNA-oudergenen via Gene Ontology (GO) en de Kyoto Encyclopedia of Genes and Genomes (KEGG) verrijkingsanalyse.

Protocol

In dit protocol werden gedeïdentificeerde ribosomale RNA (rRNA)-uitgeputte RNA-seq bibliotheek datasets bereid uit de influenza A virus-geïnfecteerde menselijke macrofaagcellen gedownload en gebruikt uit de Gene Expression Omnibus (GEO) database. De volledige bioinformatica-pijplijn van voorspelling tot functionele karakterisering van circRNA’s is samengevat in figuur 1. Elk deel van de pijplijn wordt verder uitgelegd in de onderstaande secties. 1. Voorber…

Representative Results

Het protocol dat in de vorige sectie is ingeschakeld, is aangepast en geconfigureerd voor het Linux OS-systeem. De belangrijkste reden is dat de meeste modulebibliotheken en pakketten die betrokken zijn bij de analyse van circRNA’s alleen op het Linux-platform kunnen werken. In deze analyse werden gedeïdentificeerde ribosomale RNA (rRNA)-uitgeputte RNA-seq bibliotheekdatasets bereid uit de influenza A-virus-geïnfecteerde menselijke macrofaagcellen gedownload uit de GEO-database42 en gebruikt om …

Discussion

Om het nut van dit protocol te illustreren, werd RNA-seq van influenza A-virus-geïnfecteerde menselijke macrofaagcellen als voorbeeld gebruikt. CircRNA’s die functioneren als potentiële miRNA-sponzen in gastheer-pathogeen interacties en hun GO- en KEGG-functionele verrijking binnen een gastheer werden onderzocht. Hoewel er verschillende circRNA-tools online beschikbaar zijn, is elk van hen een op zichzelf staand pakket dat niet met elkaar communiceert. Hier hebben we enkele van de tools samengesteld die nodig zijn voor…

Disclosures

The authors have nothing to disclose.

Acknowledgements

De auteur wil Tan Ke En en Dr. Cameron Bracken bedanken voor hun kritische beoordeling van dit manuscript. Dit werk werd ondersteund door subsidies van Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) en University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/kr/64565?article_type=t

Play Video

Cite This Article
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video