Summary

I Silico Identifisering og karakterisering av circRNA under vertspatogeninteraksjoner

Published: October 21, 2022
doi:

Summary

Protokollen som er sendt inn her, forklarer den komplette silico-rørledningen som trengs for å forutsi og funksjonelt karakterisere circRNA fra RNA-sekvenseringstranskriptomdata som studerer vertspatogeninteraksjoner.

Abstract

Sirkulære RNA (circRNAer) er en klasse av ikke-kodende RNA som dannes via back-spleising. Disse sirkRNAene studeres hovedsakelig for deres roller som regulatorer av ulike biologiske prosesser. Spesielt viser nye bevis at vertscircRNA kan uttrykkes differensielt (DE) ved infeksjon med patogener (f.eks. Influensa og koronavirus), noe som tyder på en rolle for circRNA i regulering av vertens medfødte immunresponser. Imidlertid er undersøkelser av rollen til circRNA under patogene infeksjoner begrenset av kunnskapen og ferdighetene som kreves for å utføre den nødvendige bioinformatiske analysen for å identifisere DE-circRNA fra RNA-sekvensering (RNA-seq) data. Bioinformatikk prediksjon og identifisering av circRNA er avgjørende før verifisering, og funksjonelle studier ved hjelp av kostbare og tidkrevende våtlaboratorieteknikker. For å løse dette problemet er det gitt en trinnvis protokoll for in silico-prediksjon og karakterisering av circRNA ved bruk av RNA-seq-data i dette manuskriptet. Protokollen kan deles inn i fire trinn: 1) Prediksjon og kvantifisering av DE circRNA via CIRIquant-rørledningen; 2) Annotering via circBase og karakterisering av DE circRNAs; 3) CircRNA-miRNA-interaksjonsprediksjon gjennom Circr-rørledning; 4) funksjonell berikelsesanalyse av circRNA-foreldregener ved bruk av genontologi (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG). Denne rørledningen vil være nyttig for å drive fremtidig in vitro og in vivo forskning for ytterligere å avdekke rollen til circRNA i vert-patogen-interaksjoner.

Introduction

Vertspatogeninteraksjoner representerer et komplekst samspill mellom patogener og vertsorganismer, noe som utløser vertenes medfødte immunresponser som til slutt resulterer i fjerning av invaderende patogener 1,2. Under patogene infeksjoner reguleres en rekke vertsimmungener for å hemme replikasjon og frigjøring av patogener. For eksempel inkluderer vanlige interferonstimulerte gener (ISG) regulert ved patogene infeksjoner ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I og OASL 3,4. Foruten proteinkodende gener har studier også rapportert at ikke-kodende RNA som lange ikke-kodende RNA (lncRNA), mikroRNA (miRNA) og sirkulære RNA (sircRNA) også spiller en rolle og reguleres samtidig under patogene infeksjoner 5,6,7. I motsetning til proteinkodende gener som hovedsakelig koder for proteiner som funksjonelle molekyler, er ikke-kodende RNA (ncRNA) kjent for å fungere som regulatorer av gener på transkripsjonelle og posttranskripsjonelle nivåer. Imidlertid er studier som involverer deltakelse av ikke-kodende RNAer, spesielt sircRNAer, i regulering av vertenes immungener, ikke godt rapportert sammenlignet med proteinkodende gener.

CircRNA er bredt preget av deres kovalent lukkede kontinuerlige sløyfestruktur, som genereres gjennom en ikke-kanonisk skjøteprosess kalt back-splicing8. Prosessen med tilbakeskjøting, i motsetning til skjøteprosessen av kognitive lineære RNAer, involverer ligering av nedstrøms donorsted til oppstrøms akseptorsted, og danner en sirkulær formet struktur. For tiden er det foreslått tre forskjellige tilbakeskjøtingsmekanismer for biogenese av circRNA. Disse er RNA-bindende protein (RBP) mediert sirkularisering 9,10, intron-paringsdrevet sirkularisering 11 og lariatdrevet sirkularisering12,13,14. Gitt at sirkRNA er koblet ende-til-ende i en sirkulær struktur, har de en tendens til å være naturlig resistente mot normale eksonuklease fordøyelser og anses dermed å være mer stabile enn deres lineære kolleger15. En annen vanlig egenskap utstilt av circRNA inkluderer celle- eller vevstypespesifikt uttrykk i verter16.

Som antydet av deres unike struktur og celle- eller vevsspesifikke uttrykk, har circRNA blitt oppdaget å spille viktige biologiske funksjoner i celler. Til dags dato er en av de fremtredende funksjonene til circRNA deres rolle som mikroRNA (miRNA) svamper17,18. Denne regulatoriske rollen til circRNA skjer gjennom komplementær binding av circRNA-nukleotider med frøområdet av miRNAer. En slik circRNA-miRNA-interaksjon hemmer miRNAenes normale regulatoriske funksjoner på mål-mRNAer, og regulerer dermed ekspresjonen av gener 19,20. I tillegg er circRNA også kjent for å regulere genuttrykk ved å interagere med RNA-bindende proteiner (RBP) og danne RNA-proteinkomplekser21. Selv om circRNA er klassifisert som ikke-kodende RNA, er det også bevis på at circRNA kan fungere som maler for proteinoversettelse22,23,24.

Nylig har circRNA vist seg å spille sentrale roller i reguleringen av vertspatogeninteraksjonene, spesielt mellom vertene og virusene. Generelt antas vertscircRNA å hjelpe til med å regulere vertens immunresponser for å eliminere de invaderende patogenene. Et eksempel på circRNA som fremmer vertsimmunresponser er circRNA_0082633, rapportert av Guo et al.25. Dette circRNA forbedrer type I interferon (IFN) signalering i A549-celler, noe som bidrar til å undertrykke influensavirusreplikasjon25. Videre rapporterte Qu et al. også et humant intronisk circRNA, kalt circRNA AIVR, som fremmer immunitet ved å regulere ekspresjonen av CREB-bindende protein (CREBBP), en signaltransduser av IFN-β26,27. Imidlertid finnes det også circRNA som er kjent for å fremme patogenesen av sykdom ved infeksjon. For eksempel rapporterte Yu et al. nylig rollen spilt av et circRNA spleiset fra GATA sinkfingerdomenet som inneholder 2A-genet (circGATAD2A) for å fremme H1N1-virusreplikasjonen gjennom inhibering av vertscelleautofagi28.

For å effektivt studere circRNAer, implementeres vanligvis en genom-bred circRNA-prediksjonsalgoritme, etterfulgt av en in silico-karakterisering av de forutsagte circRNA-kandidatene før noen funksjonelle studier kan utføres. En slik bioinformatisk tilnærming til å forutsi og karakterisere sircRNA er mindre kostbar og mer tidseffektiv. Det bidrar til å avgrense antall kandidater som skal studeres funksjonelt og kan potensielt føre til nye funn. Her gir vi en detaljert bioinformatikkbasert protokoll for in silico identifikasjon, karakterisering og funksjonell annotasjon av circRNA under vertspatogeninteraksjonene. Protokollen inkluderer identifisering og kvantifisering av circRNA fra RNA-sekvenseringsdatasett, annotering via circBase og karakterisering av circRNA-kandidatene når det gjelder circRNA-typer, antall overlappende gener og forventede circRNA-miRNA-interaksjoner. Denne studien gir også funksjonell annotasjon av circRNA-foreldregenene gjennom genontologi (GO) og Kyoto Encyclopedia of Genes and Genomes (KEGG) anrikningsanalyse.

Protocol

I denne protokollen ble avidentifiserte ribosomale RNA (rRNA)-utarmede RNA-seq-bibliotekdatasett fremstilt fra influensa A-virusinfiserte humane makrofagceller lastet ned og brukt fra databasen Gene Expression Omnibus (GEO). Hele bioinformatikkrørledningen fra prediksjon til funksjonell karakterisering av circRNA er oppsummert i figur 1. Hver del av rørledningen er nærmere forklart i avsnittene nedenfor. 1. Forberedelse, nedlasting og oppsett før dataana…

Representative Results

Protokollen vervet i forrige avsnitt ble endret og konfigurert for å passe Linux OS-systemet. Hovedårsaken er at de fleste modulbiblioteker og pakker som er involvert i analysen av circRNAer, bare kan fungere på Linux-plattformen. I denne analysen ble avidentifiserte ribosomale RNA (rRNA)-utarmede RNA-seq-bibliotekdatasett fremstilt fra influensa A-virusinfiserte humane makrofagceller lastet ned fra GEO-databasen42 og brukt til å generere de representative resultatene. <p class="jove_conte…

Discussion

For å illustrere nytten av denne protokollen ble RNA-seq fra influensa A-virusinfiserte humane makrofagceller brukt som eksempel. CircRNA som fungerer som potensielle miRNA-svamper i vertspatogen-interaksjoner og deres GO og KEGG funksjonelle berikelse i en vert ble undersøkt. Selv om det finnes en rekke circRNA-verktøy tilgjengelig online, er hver av dem en frittstående pakke som ikke samhandler med hverandre. Her setter vi sammen noen av verktøyene som kreves for sircRNA-prediksjon og kvantifisering, circRNA-funks…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Forfatteren vil gjerne takke Tan Ke En og Dr. Cameron Bracken for deres kritiske gjennomgang av dette manuskriptet. Dette arbeidet ble støttet av tilskudd fra Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) og University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/kr/64565?article_type=t

Play Video

Cite This Article
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video