Summary

In Silico Identificación y caracterización de circRNAs durante las interacciones huésped-patógeno

Published: October 21, 2022
doi:

Summary

El protocolo presentado aquí explica la tubería in silico completa necesaria para predecir y caracterizar funcionalmente circRNAs a partir de datos de transcriptoma de secuenciación de ARN que estudian las interacciones huésped-patógeno.

Abstract

Los ARN circulares (circRNAs) son una clase de RNAs no codificantes que se forman a través del retroempalme. Estos circRNAs se estudian predominantemente por su papel como reguladores de diversos procesos biológicos. En particular, la evidencia emergente demuestra que los circRNAs del huésped pueden expresarse diferencialmente (DE) tras la infección con patógenos (por ejemplo, influenza y coronavirus), lo que sugiere un papel para los circRNAs en la regulación de las respuestas inmunes innatas del huésped. Sin embargo, las investigaciones sobre el papel de los circRNAs durante las infecciones patogénicas están limitadas por el conocimiento y las habilidades necesarias para llevar a cabo el análisis bioinformático necesario para identificar los circRNAs DE a partir de datos de secuenciación de RNA (RNA-seq). La predicción bioinformática y la identificación de circRNAs es crucial antes de cualquier verificación, y estudios funcionales que utilizan técnicas de laboratorio húmedo costosas y que requieren mucho tiempo. Para resolver este problema, en este manuscrito se proporciona un protocolo paso a paso de predicción in silico y caracterización de circRNAs utilizando datos RNA-seq. El protocolo se puede dividir en cuatro pasos: 1) Predicción y cuantificación de circRNAs de DE a través del pipeline CIRIquant; 2) Anotación vía circBase y caracterización de circRNAs DE; 3) Predicción de la interacción CircRNA-miRNA a través de la tubería Circr; 4) análisis de enriquecimiento funcional de genes parentales circRNA utilizando Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG). Esta tubería será útil para impulsar futuras investigaciones in vitro e in vivo para desentrañar aún más el papel de los circRNAs en las interacciones huésped-patógeno.

Introduction

Las interacciones huésped-patógeno representan una interacción compleja entre los patógenos y los organismos huéspedes, lo que desencadena las respuestas inmunes innatas de los huéspedes que eventualmente resultan en la eliminación de patógenos invasores 1,2. Durante las infecciones patógenas, una multitud de genes inmunes del huésped se regula para inhibir la replicación y liberación de patógenos. Por ejemplo, los genes comunes estimulados por interferón (ISG) regulados por infecciones patógenas incluyen ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I y OASL 3,4. Además de los genes codificadores de proteínas, los estudios también han informado que los ARN no codificantes, como los ARN largos no codificantes (lncRNAs), los microARN (miRNAs) y los RNAs circulares (circRNAs) también juegan un papel y están regulados simultáneamente durante las infecciones patogénicas 5,6,7. A diferencia de los genes codificadores de proteínas que codifican principalmente proteínas como moléculas funcionales, se sabe que los ARN no codificantes (ncRNA) funcionan como reguladores de genes a nivel transcripcional y posttranscripcional. Sin embargo, los estudios que involucran la participación de ARN no codificantes, particularmente circRNAs, en la regulación de los genes inmunes de los huéspedes no están bien informados en comparación con los genes codificadores de proteínas.

Los CircRNAs se caracterizan ampliamente por su estructura de bucle continuo covalentemente cerrado, que se genera a través de un proceso de empalme no canónico llamado retroempalme8. El proceso de empalme posterior, a diferencia del proceso de empalme de ARN lineales afines, implica la ligadura del sitio donante aguas abajo al sitio aceptor aguas arriba, formando una estructura de forma circular. Actualmente, se han propuesto tres mecanismos diferentes de empalme posterior para la biogénesis de circRNAs. Estos son la circularización mediada por proteína de unión al ARN (RBP) 9,10, la circularización impulsada por el emparejamiento intrón 11 y la circularización impulsada por lariat12,13,14. Dado que los circRNAs están conectados de extremo a extremo en una estructura circular, tienden a ser naturalmente resistentes a las digestiones normales de exonucleasas y, por lo tanto, se consideran más estables que sus contrapartes lineales15. Otra característica común exhibida por circRNAs incluye la expresión específica del tipo de célula o tejido en los huéspedes16.

Como lo implica su estructura única y la expresión específica de células o tejidos, se ha descubierto que los circRNAs desempeñan importantes funciones biológicas en las células. Hasta la fecha, una de las funciones prominentes de los circRNAs es su papel como esponjas de microRNA (miRNA)17,18. Este papel regulador de los circRNAs ocurre a través de la unión complementaria de los nucleótidos circRNA con la región semilla de los miRNAs. Tal interacción circRNA-miRNA inhibe las funciones reguladoras normales de los miRNAs en los mRNAs diana, regulando así la expresión de genes19,20. Además, también se sabe que los circRNAs regulan la expresión génica interactuando con proteínas de unión a ARN (RBP) y formando complejos ARN-proteína21. Aunque los circRNAs se clasifican como RNAs no codificantes, también hay evidencia de que los circRNAs pueden actuar como plantillas para la traducción de proteínas22,23,24.

Recientemente, se ha demostrado que los circRNAs desempeñan un papel fundamental en la regulación de las interacciones huésped-patógeno, particularmente entre los huéspedes y los virus. En general, se supone que los circRNAs del huésped ayudan a regular las respuestas inmunes del huésped para eliminar los patógenos invasores. Un ejemplo de circRNA que promueve las respuestas inmunes del huésped es circRNA_0082633, reportado por Guo et al.25. Este circRNA mejora la señalización del interferón tipo I (IFN) dentro de las células A549, lo que ayuda a suprimir la replicación del virus de la influenza25. Además, Qu et al. también reportaron un circRNA intrónico humano, llamado circRNA AIVR, que promueve la inmunidad al regular la expresión de la proteína de unión a CREB (CREBBP), un transductor de señal de IFN-β26,27. Sin embargo, también existen circRNAs que se sabe que promueven la patogénesis de la enfermedad tras la infección. Por ejemplo, Yu et al. informaron recientemente el papel desempeñado por un circRNA empalmado del dominio del dedo de zinc GATA que contiene el gen 2A (circGATAD2A) en la promoción de la replicación del virus H1N1 a través de la inhibición de la autofagia de la célula huésped28.

Para estudiar eficazmente los circRNAs, generalmente se implementa un algoritmo de predicción de circRNA de todo el genoma, seguido de una caracterización in silico de los candidatos de circRNA predichos antes de que se puedan llevar a cabo estudios funcionales. Tal enfoque bioinformático para predecir y caracterizar circRNAs es menos costoso y más eficiente en el tiempo. Ayuda a refinar el número de candidatos a estudiar funcionalmente y podría conducir a nuevos hallazgos. Aquí, proporcionamos un protocolo detallado basado en bioinformática para la identificación, caracterización y anotación funcional in silico de circRNAs durante las interacciones huésped-patógeno. El protocolo incluye la identificación y cuantificación de circRNAs a partir de conjuntos de datos de secuenciación de RNA, anotación a través de circBase y la caracterización de los candidatos circRNA en términos de tipos de circRNA, número de genes superpuestos e interacciones circRNA-miRNA previstas. Este estudio también proporciona la anotación funcional de los genes parentales circRNA a través de Gene Ontology (GO) y el análisis de enriquecimiento de la Enciclopedia de Genes y Genomas de Kyoto (KEGG).

Protocol

En este protocolo, se descargaron y utilizaron conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A y se utilizaron de la base de datos Gene Expression Omnibus (GEO). Toda la línea de bioinformática desde la predicción hasta la caracterización funcional de circRNAs se resume en la Figura 1. Cada parte de la tubería se explica con más detalle en las seccio…

Representative Results

El protocolo alistado en la sección anterior se modificó y configuró para adaptarse al sistema operativo Linux. La razón principal es que la mayoría de las bibliotecas de módulos y paquetes involucrados en el análisis de circRNAs solo pueden funcionar en la plataforma Linux. En este análisis, los conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A se descargaron de la base de datos…

Discussion

Para ilustrar la utilidad de este protocolo, se utilizó como ejemplo el RNA-seq de células macrófagas humanas infectadas con el virus de la influenza A. Se investigaron los circRNAs que funcionan como posibles esponjas de miRNA en las interacciones huésped-patógeno y su enriquecimiento funcional GO y KEGG dentro de un huésped. Aunque hay una variedad de herramientas de circRNA disponibles en línea, cada una de ellas es un paquete independiente que no interactúa entre sí. Aquí, reunimos algunas de las herramient…

Declarações

The authors have nothing to disclose.

Acknowledgements

El autor desea agradecer a Tan Ke En y al Dr. Cameron Bracken por su revisión crítica de este manuscrito. Este trabajo fue apoyado por subvenciones del Plan de Becas de Investigación Fundamental (FRGS / 1/2020 / SKK0 / UM / 02/15) y la Beca de Investigación de Alto Impacto de la Universidad de Malaya (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

Referências

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).
check_url/pt/64565?article_type=t

Play Video

Citar este artigo
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video