Summary

I Silico Identifikation og karakterisering af circRNA'er under værtspatogeninteraktioner

Published: October 21, 2022
doi:

Summary

Den protokol, der indsendes her, forklarer den komplette in silico-pipeline , der er nødvendig for at forudsige og funktionelt karakterisere circRNA’er fra RNA-sekventeringstranskriptomdata, der studerer værtspatogeninteraktioner.

Abstract

Cirkulære RNA’er (circRNA’er) er en klasse af ikke-kodende RNA’er, der dannes via back-splejsning. Disse circRNA’er studeres overvejende for deres roller som regulatorer af forskellige biologiske processer. Især viser nye beviser, at værts-circRNA’er kan udtrykkes forskelligt (DE) ved infektion med patogener (f.eks. Influenza og coronavirus), hvilket tyder på en rolle for circRNA’er i reguleringen af værtsmedfødte immunresponser. Undersøgelser af circRNA’ers rolle under patogene infektioner er imidlertid begrænset af den viden og de færdigheder, der kræves for at udføre den nødvendige bioinformatiske analyse for at identificere DE-circRNA’er fra RNA-sekventeringsdata (RNA-seq). Bioinformatik, forudsigelse og identifikation af circRNA’er er afgørende før enhver verifikation og funktionelle undersøgelser ved hjælp af dyre og tidskrævende vådlaboratorieteknikker. For at løse dette problem findes en trinvis protokol for in silico-forudsigelse og karakterisering af circRNA’er ved hjælp af RNA-seq-data i dette manuskript. Protokollen kan opdeles i fire trin: 1) Forudsigelse og kvantificering af DE-circRNA’er via CIRIquant-pipelinen; 2) Annotation via circBase og karakterisering af DE circRNA’er; 3) CircRNA-miRNA-interaktionsforudsigelse gennem Circr-rørledning; 4) funktionel berigelsesanalyse af circRNA-forældregener ved hjælp af Gene Ontology (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG). Denne pipeline vil være nyttig til at drive fremtidig in vitro – og in vivo-forskning for yderligere at optrævle circRNA’ernes rolle i værtspatogeninteraktioner.

Introduction

Værtspatogeninteraktioner repræsenterer et komplekst samspil mellem patogenerne og værtsorganismerne, som udløser værternes medfødte immunrespons, der i sidste ende resulterer i fjernelse af invaderende patogener 1,2. Under patogene infektioner reguleres en lang række af værtsimmungenerne for at hæmme replikationen og frigivelsen af patogener. For eksempel omfatter almindelige interferonstimulerede gener (ISG’er), der reguleres af patogene infektioner, ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I og OASL 3,4. Udover proteinkodende gener har undersøgelser også rapporteret, at ikke-kodende RNA’er såsom lange ikke-kodende RNA’er (lncRNA’er), mikroRNA’er (miRNA’er) og cirkulære RNA’er (circRNA’er) også spiller en rolle og reguleres samtidigt under patogene infektioner 5,6,7. I modsætning til proteinkodende gener, der hovedsageligt koder for proteiner som funktionelle molekyler, er ikke-kodende RNA’er (ncRNA’er) kendt for at fungere som regulatorer af gener på transkriptionelle og posttranskriptionelle niveauer. Undersøgelser, der involverer deltagelse af ikke-kodende RNA’er, især circRNA’er, i reguleringen af værternes immungener, er imidlertid ikke godt rapporteret sammenlignet med de proteinkodende gener.

CircRNA’er er bredt karakteriseret ved deres kovalent lukkede kontinuerlige sløjfestruktur, som genereres gennem en ikke-kanonisk splejsningsproces kaldet back-splejsning8. Processen med back-splejsning, i modsætning til splejsningsprocessen af beslægtede lineære RNA’er, involverer ligering af nedstrøms donorstedet til opstrøms acceptorstedet, der danner en cirkulærformet struktur. I øjeblikket er der foreslået tre forskellige back-splejsningsmekanismer til biogenese af circRNA’er. Disse er RNA-bindende protein (RBP) medieret cirkularisering 9,10, intronparringsdrevet cirkularisering 11 og lariatdrevet cirkularisering12,13,14. I betragtning af at circRNA’er er forbundet ende-til-ende i en cirkulær struktur, har de tendens til at være naturligt resistente over for normale eksonukleasefordøjelser og anses derfor for at være mere stabile end deres lineære modstykker15. En anden fælles egenskab, der udvises af circRNA’er, inkluderer det celle- eller vævstypespecifikke udtryk i værter16.

Som antydet af deres unikke struktur og celle- eller vævsspecifikke ekspression er circRNA’er blevet opdaget at spille vigtige biologiske funktioner i celler. Til dato er en af de fremtrædende funktioner i circRNA’er deres rolle som microRNA (miRNA) svampe17,18. Denne regulatoriske rolle af circRNA’er forekommer gennem den komplementære binding af circRNA-nukleotider med frøområdet af miRNA’er. En sådan circRNA-miRNA-interaktion hæmmer miRNA’ernes normale regulatoriske funktioner på mål-mRNA’er og regulerer således ekspressionen af gener 19,20. Derudover er circRNA’er også kendt for at regulere genekspression ved at interagere med RNA-bindende proteiner (RBP’er) og danne RNA-proteinkomplekser21. Selvom circRNA’er er klassificeret som ikke-kodende RNA’er, er der også tegn på, at circRNA’er kan fungere som skabeloner til proteinoversættelse22,23,24.

For nylig har circRNA’er vist sig at spille afgørende roller i reguleringen af værtspatogeninteraktionerne, især mellem værterne og vira. Generelt antages værtscirklRNA’er at hjælpe med at regulere værtsens immunrespons for at eliminere de invaderende patogener. Et eksempel på circRNA, der fremmer værtsimmunresponser, er circRNA_0082633, rapporteret af Guo et al.25. Dette circRNA forbedrer type I interferon (IFN) signalering i A549-celler, hvilket hjælper med at undertrykke influenzavirusreplikation25. Desuden rapporterede Qu et al. også et humant intronisk circRNA, kaldet circRNA AIVR, der fremmer immunitet ved at regulere ekspressionen af CREB-bindende protein (CREBBP), en signaltransducer af IFN-β26,27. Imidlertid findes der også circRNA’er, der vides at fremme patogenesen af sygdom ved infektion. For eksempel rapporterede Yu et al. for nylig den rolle, som et circRNA splejset fra GATA-zinkfingerdomænet indeholdende 2A-genet (circGATAD2A) spiller for at fremme H1N1-virusreplikationen gennem hæmning af værtscelleautofagi28.

For effektivt at studere circRNA’er implementeres normalt en genom-wide circRNA-forudsigelsesalgoritme efterfulgt af en in silico-karakterisering af de forudsagte circRNA-kandidater, før der kan udføres funktionelle undersøgelser. En sådan bioinformatisk tilgang til at forudsige og karakterisere circRNA’er er billigere og mere tidseffektiv. Det hjælper med at forfine antallet af kandidater, der skal undersøges funktionelt, og kan potentielt føre til nye resultater. Her leverer vi en detaljeret bioinformatikbaseret protokol til in silico-identifikation , karakterisering og funktionel annotering af circRNA’er under værtspatogeninteraktionerne. Protokollen inkluderer identifikation og kvantificering af circRNA’er fra RNA-sekventeringsdatasæt, annotation via circBase og karakterisering af circRNA-kandidaterne med hensyn til circRNA-typer, antal overlappende gener og forudsagte circRNA-miRNA-interaktioner. Denne undersøgelse giver også den funktionelle annotering af circRNA-forældregenerne gennem genontologi (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG) berigelsesanalyse.

Protocol

I denne protokol blev de-identificerede ribosomale RNA (rRNA)-depleterede RNA-seq-biblioteksdatasæt fremstillet ud fra influenza A-virusinficerede humane makrofagceller downloadet og brugt fra Gene Expression Omnibus (GEO) databasen. Hele bioinformatikpipelinen fra forudsigelse til funktionel karakterisering af circRNA’er er opsummeret i figur 1. Hver del af rørledningen forklares yderligere i afsnittene nedenfor. 1. Forberedelse, download og opsætning f?…

Representative Results

Protokollen, der blev optaget i det foregående afsnit, blev ændret og konfigureret til at passe til Linux OS-systemet. Hovedårsagen er, at de fleste modulbiblioteker og pakker, der er involveret i analysen af circRNA’er, kun kan fungere på Linux-platformen. I denne analyse blev de-identificerede ribosomale RNA (rRNA)-depleterede RNA-seq-biblioteksdatasæt fremstillet ud fra de influenza A-virusinficerede humane makrofagceller downloadet fra GEO-databasen42 og brugt til at generere de repræsen…

Discussion

For at illustrere nytten af denne protokol blev RNA-seq fra influenza A-virusinficerede humane makrofagceller brugt som et eksempel. CircRNA’er, der fungerer som potentielle miRNA-svampe i værtspatogeninteraktioner, og deres GO- og KEGG-funktionelle berigelse inden for en vært blev undersøgt. Selvom der er en række circRNA-værktøjer tilgængelige online, er hver af dem en selvstændig pakke, der ikke interagerer med hinanden. Her sammensætter vi nogle af de værktøjer, der kræves til circRNA-forudsigelse og kvan…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Forfatteren vil gerne takke Tan Ke En og Dr. Cameron Bracken for deres kritiske gennemgang af dette manuskript. Dette arbejde blev støttet af tilskud fra Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) og University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/kr/64565?article_type=t

Play Video

Cite This Article
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video