Summary

In zona Silico Identificazione e caratterizzazione di circRNA durante le interazioni ospite-patogeno

Published: October 21, 2022
doi:

Summary

Il protocollo qui presentato spiega la pipeline completa in silico necessaria per prevedere e caratterizzare funzionalmente i circRNA dai dati del trascrittoma di sequenziamento dell’RNA che studiano le interazioni ospite-patogeno.

Abstract

Gli RNA circolari (circRNA) sono una classe di RNA non codificanti che si formano tramite back-splicing. Questi circRNA sono prevalentemente studiati per il loro ruolo di regolatori di vari processi biologici. In particolare, prove emergenti dimostrano che i circRNA dell’ospite possono essere espressi in modo differenziale (DE) dopo l’infezione da agenti patogeni (ad esempio, influenza e coronavirus), suggerendo un ruolo per i circRNA nella regolazione delle risposte immunitarie innate dell’ospite. Tuttavia, le indagini sul ruolo dei circRNA durante le infezioni patogene sono limitate dalle conoscenze e dalle competenze necessarie per effettuare le analisi bioinformatiche necessarie per identificare i circRNA DE dai dati di sequenziamento dell’RNA (RNA-seq). La previsione bioinformatica e l’identificazione dei circRNA è fondamentale prima di qualsiasi verifica e gli studi funzionali utilizzano tecniche di laboratorio umido costose e dispendiose in termini di tempo. Per risolvere questo problema, in questo manoscritto viene fornito un protocollo passo-passo di previsione in silico e caratterizzazione dei circRNA utilizzando i dati RNA-seq. Il protocollo può essere suddiviso in quattro fasi: 1) Predizione e quantificazione dei circRNA DE tramite la pipeline CIRIquant; 2) Annotazione tramite circBase e caratterizzazione di circRNA DE; 3) Predizione dell’interazione CircRNA-miRNA attraverso pipeline Circr; 4) analisi dell’arricchimento funzionale di geni parentali circRNA utilizzando Gene Ontology (GO) e Kyoto Encyclopedia of Genes and Genomes (KEGG). Questa pipeline sarà utile per guidare la futura ricerca in vitro e in vivo per svelare ulteriormente il ruolo dei circRNA nelle interazioni ospite-patogeno.

Introduction

Le interazioni ospite-patogeno rappresentano una complessa interazione tra i patogeni e gli organismi ospiti, che innesca le risposte immunitarie innate degli ospiti che alla fine si traducono nella rimozione dei patogeni invasori 1,2. Durante le infezioni patogene, una moltitudine di geni immunitari dell’ospite è regolata per inibire la replicazione e il rilascio di agenti patogeni. Ad esempio, i geni comuni stimolati dall’interferone (ISG) regolati sulle infezioni patogene includono ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I e OASL 3,4. Oltre ai geni codificanti proteine, gli studi hanno anche riportato che anche gli RNA non codificanti come gli RNA lunghi non codificanti (lncRNA), i microRNA (miRNA) e gli RNA circolari (circRNA) svolgono un ruolo e sono regolati contemporaneamente durante le infezioni patogene 5,6,7. A differenza dei geni codificanti proteine che codificano principalmente le proteine come molecole funzionali, gli RNA non codificanti (ncRNA) sono noti per funzionare come regolatori dei geni a livello trascrizionale e post-trascrizionale. Tuttavia, gli studi che coinvolgono la partecipazione di RNA non codificanti, in particolare circRNA, nella regolazione dei geni immunitari degli ospiti non sono ben riportati rispetto ai geni codificanti proteine.

I circRNA sono ampiamente caratterizzati dalla loro struttura ad anello continuo covalentemente chiusa, che viene generata attraverso un processo di splicing non canonico chiamato back-splicing8. Il processo di back-splicing, a differenza del processo di splicing di RNA lineari affini, comporta la legatura del sito donatore a valle al sito accettore a monte, formando una struttura di forma circolare. Attualmente sono stati proposti tre diversi meccanismi di back-splicing per la biogenesi dei circRNA. Si tratta della circolarizzazione mediata dalla proteina legante l’RNA (RBP) 9,10, della circolarizzazione guidata dall’intron-pairing 11 e della circolarizzazione guidata da lariat12,13,14. Dato che i circRNA sono collegati end-to-end in una struttura circolare, tendono ad essere naturalmente resistenti alle normali digestioni esonucleasi e, quindi, sono considerati più stabili delle loro controparti lineari15. Un’altra caratteristica comune esibita dai circRNA include l’espressione specifica del tipo di cellula o tessuto negli ospiti16.

Come implicato dalla loro struttura unica e dall’espressione specifica della cellula o del tessuto, è stato scoperto che i circRNA svolgono importanti funzioni biologiche nelle cellule. Ad oggi, una delle funzioni di spicco dei circRNA è il loro ruolo di spugne microRNA (miRNA)17,18. Questo ruolo regolatore dei circRNA avviene attraverso il legame complementare dei nucleotidi circRNA con la regione seme dei miRNA. Tale interazione circRNA-miRNA inibisce le normali funzioni regolatrici dei miRNA sugli mRNA bersaglio, regolando così l’espressione dei geni19,20. Inoltre, i circRNA sono anche noti per regolare l’espressione genica interagendo con le proteine leganti l’RNA (RBP) e formando complessi RNA-proteina21. Sebbene i circRNA siano classificati come RNA non codificanti, ci sono anche prove che i circRNA possono fungere da modelli per la traduzione proteica22,23,24.

Recentemente, è stato dimostrato che i circRNA svolgono un ruolo fondamentale nella regolazione delle interazioni ospite-patogeno, in particolare tra gli ospiti e i virus. Generalmente, si presume che i circRNA dell’ospite aiutino a regolare le risposte immunitarie dell’ospite per eliminare i patogeni invasori. Un esempio di circRNA che promuove le risposte immunitarie dell’ospite è circRNA_0082633, riportato da Guo et al.25. Questo circRNA migliora la segnalazione dell’interferone di tipo I (IFN) all’interno delle cellule A549, che aiuta a sopprimere la replicazione del virus dell’influenza25. Inoltre, Qu et al. hanno anche riportato un circRNA intronico umano, chiamato circRNA AIVR, che promuove l’immunità regolando l’espressione della proteina legante CREB (CREBBP), un trasduttore di segnale di IFN-β26,27. Tuttavia, esistono anche circRNA che sono noti per promuovere la patogenesi della malattia dopo l’infezione. Ad esempio, Yu et al. hanno recentemente riportato il ruolo svolto da un circRNA spliced dal dominio delle dita di zinco GATA contenente il gene 2A (circGATAD2A) nel promuovere la replicazione del virus H1N1 attraverso l’inibizione dell’autofagia28 della cellula ospite.

Per studiare efficacemente i circRNA, viene solitamente implementato un algoritmo di predizione del circRNA a livello di genoma, seguito da una caratterizzazione in silico dei candidati circRNA previsti prima che possano essere condotti studi funzionali. Tale approccio bioinformatico per prevedere e caratterizzare i circRNA è meno costoso e più efficiente in termini di tempo. Aiuta a perfezionare il numero di candidati da studiare funzionalmente e potrebbe potenzialmente portare a nuove scoperte. Qui, forniamo un protocollo dettagliato basato sulla bioinformatica per l’identificazione in silico , la caratterizzazione e l’annotazione funzionale dei circRNA durante le interazioni ospite-patogeno. Il protocollo include l’identificazione e la quantificazione di circRNA da set di dati di sequenziamento dell’RNA, l’annotazione tramite circBase e la caratterizzazione dei candidati circRNA in termini di tipi di circRNA, numero di geni sovrapposti e interazioni circRNA-miRNA previste. Questo studio fornisce anche l’annotazione funzionale dei geni parentali circRNA attraverso l’analisi dell’arricchimento di Gene Ontology (GO) e della Kyoto Encyclopedia of Genes and Genomes (KEGG).

Protocol

In questo protocollo, i set di dati della libreria RNA-seq impoveriti di RNA ribosomiale (rRNA) de-identificati preparati dalle cellule macrofagiche umane infette da virus dell’influenza A sono stati scaricati e utilizzati dal database Gene Expression Omnibus (GEO). L’intera pipeline bioinformatica dalla predizione alla caratterizzazione funzionale dei circRNA è riassunta nella Figura 1. Ogni parte della pipeline è ulteriormente spiegata nelle sezioni seguenti. <s…

Representative Results

Il protocollo arruolato nella sezione precedente è stato modificato e configurato per adattarsi al sistema operativo Linux. Il motivo principale è che la maggior parte delle librerie di moduli e dei pacchetti coinvolti nell’analisi dei circRNA possono funzionare solo sulla piattaforma Linux. In questa analisi, i set di dati della libreria RNA-seq impoveriti di RNA ribosomiale (rRNA) de-identificati preparati dalle cellule macrofagiche umane infette da virus dell’influenza A sono stati scaricati dal database GEO<sup cla…

Discussion

Per illustrare l’utilità di questo protocollo, è stato utilizzato come esempio RNA-seq da cellule macrofagiche umane infette da virus dell’influenza A. Sono stati studiati i circRNA che funzionano come potenziali spugne miRNA nelle interazioni ospite-patogeno e il loro arricchimento funzionale GO e KEGG all’interno di un ospite. Sebbene ci sia una varietà di strumenti circRNA disponibili online, ognuno di essi è un pacchetto autonomo che non interagisce tra loro. Qui, abbiamo messo insieme alcuni degli strumenti nece…

Declarações

The authors have nothing to disclose.

Acknowledgements

L’autore desidera ringraziare Tan Ke En e il Dr. Cameron Bracken per la loro recensione critica di questo manoscritto. Questo lavoro è stato sostenuto da sovvenzioni del Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) e dell’University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

Referências

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/pt/64565?article_type=t

Play Video

Citar este artigo
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video