Summary

I Silico Identifiering och karakterisering av circRNA under värd-patogeninteraktioner

Published: October 21, 2022
doi:

Summary

Protokollet som lämnas in här förklarar den kompletta in silico-pipeline som behövs för att förutsäga och funktionellt karakterisera circRNA från RNA-sekvenseringstranskriptomdata som studerar värd-patogeninteraktioner.

Abstract

Cirkulära RNA (circRNA) är en klass av icke-kodande RNA som bildas via back-splitsning. Dessa circRNA studeras främst för deras roller som regulatorer av olika biologiska processer. I synnerhet visar nya bevis att värd-circRNA kan uttryckas differentiellt (DE) vid infektion med patogener (t.ex. influensa och koronavirus), vilket tyder på en roll för circRNA vid reglering av värdmedfödda immunsvar. Undersökningar av cirRNA: s roll under patogena infektioner begränsas emellertid av de kunskaper och färdigheter som krävs för att utföra den nödvändiga bioinformatiska analysen för att identifiera DE-circRNA från RNA-sekvenseringsdata (RNA-seq). Bioinformatisk förutsägelse och identifiering av circRNA är avgörande före någon verifiering och funktionella studier med kostsamma och tidskrävande våtlaboratorietekniker. För att lösa detta problem tillhandahålls ett steg-för-steg-protokoll för in silico-förutsägelse och karakterisering av circRNA med hjälp av RNA-seq-data i detta manuskript. Protokollet kan delas in i fyra steg: 1) Prediktion och kvantifiering av DE-circRNA via CIRIquant-pipelinen; 2) Annotering via circBase och karakterisering av DE-circRNA; 3) CircRNA-miRNA-interaktionsförutsägelse genom Circr-pipeline; 4) funktionell anrikningsanalys av circRNA-föräldragener med hjälp av Gene Ontology (GO) och Kyoto Encyclopedia of Genes and Genomes (KEGG). Denna pipeline kommer att vara användbar för att driva framtida in vitro – och in vivo-forskning för att ytterligare avslöja rollen av circRNA i värd-patogeninteraktioner.

Introduction

Värd-patogeninteraktioner representerar ett komplext samspel mellan patogenerna och värdorganismerna, vilket utlöser värdarnas medfödda immunsvar som så småningom resulterar i avlägsnande av invaderande patogener 1,2. Under patogena infektioner regleras en mängd av värdens immungener för att hämma replikation och frisättning av patogener. Vanliga interferonstimulerade gener (ISG) som regleras vid patogena infektioner inkluderar exempelvis ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I och OASL 3,4. Förutom proteinkodande gener har studier också rapporterat att icke-kodande RNA såsom långa icke-kodande RNA (lncRNA), mikroRNA (miRNA) och cirkulära RNA (circRNA) också spelar en roll och regleras samtidigt under patogena infektioner 5,6,7. I motsats till proteinkodande gener som huvudsakligen kodar för proteiner som funktionella molekyler, är icke-kodande RNA (ncRNA) kända för att fungera som regulatorer av gener på transkriptions- och posttranskriptionsnivåer. Studier som involverar deltagande av icke-kodande RNA, särskilt circRNA, i regleringen av värdarnas immungener är emellertid inte väl rapporterade jämfört med de proteinkodande generna.

CircRNA kännetecknas allmänt av deras kovalent slutna kontinuerliga slingstruktur, som genereras genom en icke-kanonisk skarvningsprocess som kallas back-splitsning8. Processen för back-splitsning, till skillnad från skarvningsprocessen av kognatlinjära RNA, innefattar ligering av nedströms givarplatsen till uppströms acceptorstället och bildar en cirkulärformad struktur. För närvarande har tre olika back-splitsningsmekanismer för biogenes av circRNA föreslagits. Dessa är RNA-bindande protein (RBP) medierad cirkularisering 9,10, intronparningsdriven cirkularisering 11 och lariatdriven cirkularisering12,13,14. Med tanke på att cirkulärRNA är anslutna från ände till ände i en cirkulär struktur tenderar de att vara naturligt resistenta mot normala exonukleasuppslutningar och anses därför vara mer stabila än deras linjära motsvarigheter15. En annan vanlig egenskap som uppvisas av circRNA inkluderar cell- eller vävnadstypspecifikt uttryck i värdar16.

Som antyds av deras unika struktur och cell- eller vävnadsspecifika uttryck har circRNA upptäckts spela viktiga biologiska funktioner i celler. Hittills är en av de framträdande funktionerna hos circRNA deras roll som mikroRNA (miRNA) svampar17,18. Denna reglerande roll av circRNA sker genom komplementär bindning av circRNA-nukleotider med fröregionen av miRNA. En sådan circRNA-miRNA-interaktion hämmar miRNA: s normala reglerande funktioner på mål-mRNA och reglerar därmed uttrycket av gener19,20. Dessutom är circRNA också kända för att reglera genuttryck genom att interagera med RNA-bindande proteiner (RBP) och bilda RNA-proteinkomplex21. Även om circRNA klassificeras som icke-kodande RNA, finns det också bevis för att circRNA kan fungera som mallar för proteinöversättning22,23,24.

Nyligen har circRNA visat sig spela avgörande roller för att reglera värd-patogeninteraktionerna, särskilt mellan värdarna och virusen. I allmänhet antas värd-circRNA hjälpa till att reglera värdens immunsvar för att eliminera de invaderande patogenerna. Ett exempel på circRNA som främjar värdens immunsvar är circRNA_0082633, rapporterat av Guo et al.25. Detta circRNA förbättrar typ I-interferon (IFN) signalering inom A549-celler, vilket hjälper till att undertrycka influensavirusreplikation25. Dessutom rapporterade Qu et al. också ett humant introniskt circRNA, kallat circRNA AIVR, som främjar immunitet genom att reglera uttrycket av CREB-bindande protein (CREBBP), en signalgivare av IFN-β26,27. Emellertid finns också circRNA som är kända för att främja patogenesen av sjukdom vid infektion. Till exempel rapporterade Yu et al. nyligen den roll som spelas av ett circRNA splitsat från GATA-zinkfingerdomänen innehållande 2A-genen (circGATAD2A) för att främja H1N1-virusreplikationen genom hämning av värdcellautofagi28.

För att effektivt studera circRNA implementeras vanligtvis en genomomfattande circRNA-prediktionsalgoritm, följt av en in silico-karakterisering av de förutsagda circRNA-kandidaterna innan några funktionella studier kan utföras. Ett sådant bioinformatiskt tillvägagångssätt för att förutsäga och karakterisera circRNA är billigare och mer tidseffektivt. Det bidrar till att förfina antalet kandidater som ska studeras funktionellt och kan potentiellt leda till nya fynd. Här tillhandahåller vi ett detaljerat bioinformatikbaserat protokoll för in silico-identifiering , karakterisering och funktionell annotering av circRNA under värd-patogeninteraktionerna. Protokollet inkluderar identifiering och kvantifiering av circRNAs från RNA-sekvenseringsdataset, annotering via circBase, och karakterisering av circRNA-kandidaterna i termer av circRNA-typer, antal överlappande gener och förutsagda circRNA-miRNA-interaktioner. Denna studie ger också funktionell annotering av de circRNA-föräldragenerna genom Gene Ontology (GO) och Kyoto Encyclopedia of Genes and Genomes (KEGG) anrikningsanalys.

Protocol

I detta protokoll laddades avidentifierade ribosomala RNA (rRNA)-utarmade RNA-seq-biblioteksdataset framställda från influensa A-virusinfekterade humana makrofagceller ner och användes från databasen Gene Expression Omnibus (GEO). Hela bioinformatikpipelinen från prediktion till funktionell karakterisering av circRNA sammanfattas i figur 1. Varje del av rörledningen förklaras närmare i avsnitten nedan. 1. Förberedelse, nedladdning och installation f…

Representative Results

Protokollet som anges i föregående avsnitt har modifierats och konfigurerats för att passa Linux OS-systemet. Den främsta anledningen är att de flesta modulbibliotek och paket som är involverade i analysen av circRNA bara kan fungera på Linux-plattformen. I denna analys laddades avidentifierade ribosomala RNA (rRNA)-utarmade RNA-seq-biblioteksdataset framställda från influensa A-virusinfekterade humana makrofagceller ner från GEO-databasen42 och användes för att generera de representat…

Discussion

För att illustrera nyttan av detta protokoll användes RNA-seq från influensa A-virusinfekterade humana makrofagceller som exempel. CircRNAs som fungerar som potentiella miRNA-svampar i värd-patogeninteraktioner och deras GO- och KEGG-funktionella anrikning inom en värd undersöktes. Även om det finns en mängd olika circRNA-verktyg tillgängliga online, är var och en av dem ett fristående paket som inte interagerar med varandra. Här sammanställer vi några av de verktyg som krävs för circRNA-förutsägelse oc…

Declarações

The authors have nothing to disclose.

Acknowledgements

Författaren vill tacka Tan Ke En och Dr. Cameron Bracken för deras kritiska granskning av detta manuskript. Detta arbete stöddes av bidrag från Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) och University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

Referências

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/pt/64565?article_type=t

Play Video

Citar este artigo
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video