Summary

À Silico Identification et caractérisation des ARNcirc au cours des interactions hôte-pathogène

Published: October 21, 2022
doi:

Summary

Le protocole soumis ici explique le pipeline in silico complet nécessaire pour prédire et caractériser fonctionnellement les circRNA à partir de données de transcriptome de séquençage de l’ARN étudiant les interactions hôte-pathogène.

Abstract

Les ARN circulaires (circRNA) sont une classe d’ARN non codants qui sont formés par épissage arrière. Ces circRNA sont principalement étudiés pour leurs rôles de régulateurs de divers processus biologiques. Notamment, de nouvelles preuves démontrent que les circRNA de l’hôte peuvent être exprimés de manière différentielle (DE) lors de l’infection par des agents pathogènes (p. ex. grippe et coronavirus), ce qui suggère un rôle pour les ARNcirc dans la régulation des réponses immunitaires innées de l’hôte. Cependant, les recherches sur le rôle des circRNA lors d’infections pathogènes sont limitées par les connaissances et les compétences requises pour effectuer l’analyse bioinformatique nécessaire pour identifier les circRNA DE à partir des données de séquençage de l’ARN (RNA-seq). La prédiction bioinformatique et l’identification des circRNA sont cruciales avant toute vérification et études fonctionnelles utilisant des techniques de laboratoire humide coûteuses et longues. Pour résoudre ce problème, un protocole étape par étape de prédiction et de caractérisation in silico des circRNA à l’aide de données RNA-seq est fourni dans ce manuscrit. Le protocole peut être divisé en quatre étapes : 1) Prédiction et quantification des circRNA DE via le pipeline CIRIquant ; 2) Annotation via circBase et caractérisation des circRNAs DE; 3) Prédiction de l’interaction CircRNA-miARN par pipeline Circr; 4) analyse de l’enrichissement fonctionnel des gènes parentaux circRNA à l’aide de l’ontologie génique (GO) et de l’Encyclopédie des gènes et des génomes de Kyoto (KEGG). Ce pipeline sera utile pour mener de futures recherches in vitro et in vivo afin de mieux comprendre le rôle des circRNA dans les interactions hôte-pathogène.

Introduction

Les interactions hôte-pathogène représentent une interaction complexe entre les agents pathogènes et les organismes hôtes, qui déclenche les réponses immunitaires innées des hôtes qui finissent par entraîner l’élimination des agents pathogènes envahisseurs 1,2. Au cours des infections pathogènes, une multitude de gènes immunitaires de l’hôte sont régulés pour inhiber la réplication et la libération d’agents pathogènes. Par exemple, les gènes communs stimulés par l’interféron (ISG) régulés sur les infections pathogènes comprennent ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I et OASL 3,4. Outre les gènes codant pour les protéines, des études ont également rapporté que les ARN non codants tels que les longs ARN non codants (ARNnc), les microARN (miARN) et les ARN circulaires (ARNcirc) jouent également un rôle et sont régulés simultanément lors d’infections pathogènes 5,6,7. Contrairement aux gènes codant pour des protéines qui codent principalement des protéines en tant que molécules fonctionnelles, les ARN non codants (ARNnc) sont connus pour fonctionner comme régulateurs des gènes aux niveaux transcriptionnel et post-transcriptionnel. Cependant, les études impliquant la participation d’ARN non codants, en particulier les circRNA, dans la régulation des gènes immunitaires des hôtes ne sont pas bien rapportées par rapport aux gènes codant pour les protéines.

Les circRNA sont largement caractérisés par leur structure de boucle continue fermée par covalence, qui est générée par un processus d’épissage non canonique appelé back-sprisage8. Le processus d’épissage arrière, contrairement au processus d’épissage des ARN linéaires apparentés, implique la ligature du site donneur en aval vers le site accepteur en amont, formant une structure de forme circulaire. Actuellement, trois mécanismes différents d’épissage inverse pour la biogenèse des circRNAs ont été proposés. Il s’agit de la circularisation médiée par la protéine de liaison à l’ARN(RBP) 9,10, de la circularisation induite par l’appariement d’introns 11 et de la circularisation induite par le lariat12,13,14. Étant donné que les circRNA sont connectés bout à bout dans une structure circulaire, ils ont tendance à être naturellement résistants aux digestions normales des exonucléases et, par conséquent, sont considérés comme plus stables que leurs homologues linéaires15. Une autre caractéristique commune présentée par les circRNA comprend l’expression spécifique au type de cellule ou de tissu chez les hôtes16.

Comme l’impliquent leur structure unique et leur expression spécifique à la cellule ou au tissu, on a découvert que les circRNA jouent des fonctions biologiques importantes dans les cellules. À ce jour, l’une des fonctions importantes des circRNA est leur rôle en tant qu’éponges de microARN (miARN)17,18. Ce rôle régulateur des circRNA se produit par la liaison complémentaire des nucléotides circRNA avec la région semencière des miARN. Une telle interaction circRNA-miARN inhibe les fonctions régulatrices normales des miARN sur les ARNm cibles, régulant ainsi l’expression des gènes19,20. De plus, les circRNA sont également connus pour réguler l’expression des gènes en interagissant avec les protéines de liaison à l’ARN (RBP) et en formant des complexes ARN-protéine21. Bien que les circRNA soient classés comme ARN non codants, il existe également des preuves que les circRNA peuvent servir de modèles pour la traduction des protéines22,23,24.

Récemment, il a été démontré que les circRNA jouent un rôle central dans la régulation des interactions hôte-pathogène, en particulier entre les hôtes et les virus. En général, les circRNA de l’hôte sont supposés aider à réguler les réponses immunitaires de l’hôte pour éliminer les agents pathogènes envahisseurs. Un exemple de circRNA qui favorise les réponses immunitaires de l’hôte est circRNA_0082633, rapporté par Guo et al.25. Ce circRNA améliore la signalisation de l’interféron de type I (IFN) dans les cellules A549, ce qui aide à supprimer la réplication du virus de la grippe25. De plus, Qu et al. ont également signalé un circRNA intronique humain, appelé circRNA AIVR, qui favorise l’immunité en régulant l’expression de la protéine de liaison CREB (CREBBP), un transducteur de signal de l’IFN-β26,27. Cependant, il existe également des circRNA connus pour favoriser la pathogenèse de la maladie lors de l’infection. Par exemple, Yu et al. ont récemment rapporté le rôle joué par un circRNA épissé à partir du domaine du doigt de zinc GATA contenant le gène 2A (circGATAD2A) dans la promotion de la réplication du virus H1N1 par l’inhibition de l’autophagie de la cellule hôte28.

Pour étudier efficacement les circRNA, un algorithme de prédiction circRNA à l’échelle du génome est généralement mis en œuvre, suivi d’une caractérisation in silico des candidats circRNA prédits avant que toute étude fonctionnelle puisse être réalisée. Une telle approche bioinformatique pour prédire et caractériser les circRNA est moins coûteuse et plus rapide. Il aide à affiner le nombre de candidats à étudier fonctionnellement et pourrait potentiellement conduire à de nouvelles découvertes. Ici, nous fournissons un protocole bioinformatique détaillé pour l’identification in silico , la caractérisation et l’annotation fonctionnelle des circRNA au cours des interactions hôte-pathogène. Le protocole comprend l’identification et la quantification des circRNA à partir d’ensembles de données de séquençage d’ARN, l’annotation via circBase et la caractérisation des candidats circRNA en termes de types circRNA, de nombre de gènes qui se chevauchent et d’interactions circRNA-miARN prévues. Cette étude fournit également l’annotation fonctionnelle des gènes parentaux circRNA par le biais de l’ontologie génique (GO) et de l’analyse d’enrichissement de l’Encyclopédie des gènes et des génomes de Kyoto (KEGG).

Protocol

Dans ce protocole, des ensembles de données de bibliothèque de séquençage d’ARN ribosomique (ARNr) appauvris en ARN dépersonnalisés, préparés à partir de cellules de macrophages humains infectées par le virus de la grippe A, ont été téléchargés et utilisés à partir de la base de données GEO (Gene Expression Omnibus). L’ensemble du pipeline bioinformatique, de la prédiction à la caractérisation fonctionnelle des circRNA, est résumé à la figure 1. Chaque partie du p…

Representative Results

Le protocole enrôlé dans la section précédente a été modifié et configuré pour s’adapter au système d’exploitation Linux. La raison principale est que la plupart des bibliothèques de modules et des paquets impliqués dans l’analyse des circRNA ne peuvent fonctionner que sur la plate-forme Linux. Dans cette analyse, des ensembles de données de bibliothèques de séquences d’ARN ribosomique (ARNr) appauvries en ARN dépersonnalisées préparées à partir des cellules de macrophages humains infectées pa…

Discussion

Pour illustrer l’utilité de ce protocole, le séquençage de l’ARN provenant de cellules de macrophages humains infectées par le virus de la grippe A a été utilisé comme exemple. Les circRNA fonctionnant comme des éponges miARN potentielles dans les interactions hôte-pathogène et leur enrichissement fonctionnel GO et KEGG au sein d’un hôte ont été étudiés. Bien qu’il existe une variété d’outils circRNA disponibles en ligne, chacun d’eux est un package autonome qui n’interagit pas les uns avec…

Disclosures

The authors have nothing to disclose.

Acknowledgements

L’auteur tient à remercier Tan Ke En et le Dr Cameron Bracken pour leur examen critique de ce manuscrit. Ce travail a été soutenu par des subventions du programme de subventions de recherche fondamentale (FRGS / 1 / 2020 / SKK0 / UM / 02/15) et de la subvention de recherche à fort impact de l’Université de Malaisie (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/64565?article_type=t&slug=in-silico-identification-characterization-circrnas-during-host

Play Video

Cite This Article
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video