Summary

Em Silico Identificação e caracterização de circRNAs durante interações patógeno-hospedeiro

Published: October 21, 2022
doi:

Summary

O protocolo apresentado aqui explica o pipeline in silico completo necessário para prever e caracterizar funcionalmente circRNAs a partir de dados de transcriptoma de sequenciamento de RNA estudando interações patógeno-hospedeiro.

Abstract

RNAs circulares (circRNAs) são uma classe de RNAs não-codificantes que são formados via back-splicing. Estes circRNAs são predominantemente estudados por seus papéis como reguladores de vários processos biológicos. Notavelmente, evidências emergentes demonstram que circRNAs do hospedeiro podem ser diferencialmente expressos (DE) após a infecção por patógenos (por exemplo, influenza e coronavírus), sugerindo um papel para circRNAs na regulação das respostas imunes inatas do hospedeiro. No entanto, as investigações sobre o papel dos circRNAs durante infecções patogênicas são limitadas pelo conhecimento e habilidades necessárias para realizar a análise bioinformática necessária para identificar circRNAs DE a partir de dados de sequenciamento de RNA (RNA-seq). A predição bioinformática e a identificação de circRNAs são cruciais antes de qualquer verificação, e estudos funcionais usando técnicas de laboratório úmido caras e demoradas. Para resolver essa questão, um protocolo passo-a-passo de predição e caracterização in silico de circRNAs usando dados de RNA-seq é fornecido neste manuscrito. O protocolo pode ser dividido em quatro etapas: 1) Predição e quantificação de circRNAs DE via pipeline CIRIquant; 2) Anotação via circBase e caracterização de circRNAs DE; 3) Predição da interação CircRNA-miRNA através do pipeline Circr; 4) análise de enriquecimento funcional de genes parentais de circRNA usando Ontologia Gênica (GO) e Enciclopédia de Genes e Genomas de Kyoto (KEGG). Este pipeline será útil na condução de futuras pesquisas in vitro e in vivo para desvendar ainda mais o papel dos circRNAs nas interações patógeno-hospedeiro.

Introduction

As interações patógeno-hospedeiro representam uma complexa interação entre os patógenos e os organismos hospedeiros, que desencadeia as respostas imunes inatas dos hospedeiros que, eventualmente, resultam na remoção de patógenos invasores 1,2. Durante infecções patogênicas, uma infinidade de genes imunes do hospedeiro é regulada para inibir a replicação e liberação de patógenos. Por exemplo, genes comuns estimulados por interferon (ISGs) regulados sobre infecções patogênicas incluem ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I e OASL 3,4. Além dos genes codificadores de proteínas, estudos também relataram que RNAs não codificantes, como RNAs longos não codificadores (lncRNAs), microRNAs (miRNAs) e circulares (circRNAs), também desempenham um papel e são regulados concomitantemente durante infecções patogênicas 5,6,7. Em contraste com os genes codificadores de proteínas que codificam principalmente proteínas como moléculas funcionais, RNAs não-codificantes (ncRNAs) são conhecidos por funcionar como reguladores de genes em níveis transcricionais e pós-transcricionais. No entanto, estudos envolvendo a participação de RNAs não-codificantes, particularmente circRNAs, na regulação dos genes imunes dos hospedeiros não são bem relatados em comparação com os genes codificadores de proteínas.

Os circRNAs são amplamente caracterizados por sua estrutura de loop contínuo covalentemente fechado, que é gerado através de um processo de splicing não-canônico chamado back-splicing8. O processo de back-splicing, ao contrário do processo de splicing de RNAs lineares cognatos, envolve a ligadura do sítio doador a jusante ao sítio receptor a montante, formando uma estrutura de forma circular. Atualmente, três diferentes mecanismos de back-splicing para a biogênese de circRNAs têm sido propostos. Estas são a circularização mediada por RNA binding protein (RBP) 9,10, a circularização conduzida por intron-pairing 11 e a circularização conduzida por lariat12,13,14. Dado que os circRNAs estão conectados de ponta a ponta em uma estrutura circular, eles tendem a ser naturalmente resistentes às digestãos normais de exonucleases e, portanto, são considerados mais estáveis do que seus equivalentes lineares15. Outra característica comum exibida pelos circRNAs inclui a expressão específica do tipo celular ou tecidual em hospedeiros16.

Como implicado por sua estrutura única e expressão célula ou tecido-específica, circRNAs foram descobertos para desempenhar funções biológicas importantes nas células. Até o momento, uma das funções proeminentes dos circRNAs é seu papel como esponjas de microRNA (miRNA)17,18. Este papel regulatório dos circRNAs ocorre através da ligação complementar dos nucleotídeos do circRNA com a região da semente dos miRNAs. Esta interação circRNA-miRNA inibe as funções regulatórias normais dos miRNAs sobre os RNAm-alvo, regulando assim a expressão de genes 19,20. Além disso, circRNAs também são conhecidos por regular a expressão gênica interagindo com proteínas ligadoras de RNA (RBPs) e formando complexos RNA-proteína21. Embora os circRNAs sejam classificados como RNAs não codificantes, também há evidências de que os circRNAs podem atuar como moldes para a tradução deproteínas22,23,24.

Recentemente, foi demonstrado que os circRNAs desempenham papéis fundamentais na regulação das interações patógeno-hospedeiro, particularmente entre os hospedeiros e os vírus. Geralmente, acredita-se que os circRNAs do hospedeiro auxiliem na regulação das respostas imunes do hospedeiro para eliminar os patógenos invasores. Um exemplo de circRNA que promove respostas imunes do hospedeiro é circRNA_0082633, relatado por Guo et al.25. Esse circRNA aumenta a sinalização do interferon tipo I (IFN) dentro das células A549, o que ajuda a suprimir a replicação do vírus influenza25. Além disso, Qu e col. também relataram um circRNA intrônico humano, denominado circRNA AIVR, que promove imunidade regulando a expressão da proteína ligadora de CREB (CREBBP), um transdutor de sinal de IFN-β26,27. No entanto, circRNAs que são conhecidos por promover a patogênese da doença após a infecção também existem. Por exemplo, Yu e col. relataram recentemente o papel desempenhado por um circRNA emendado do domínio dedo de zinco GATA contendo o gene 2A (circGATAD2A) na promoção da replicação do vírus H1N1 através da inibição da autofagia da célula hospedeira28.

Para estudar efetivamente circRNAs, um algoritmo de predição de circRNA genômico é geralmente implementado, seguido por uma caracterização in silico dos candidatos a circRNA previstos antes que qualquer estudo funcional possa ser realizado. Tal abordagem de bioinformática para prever e caracterizar circRNAs é menos dispendiosa e mais eficiente em termos de tempo. Isso ajuda a refinar o número de candidatos a serem estudados funcionalmente e pode potencialmente levar a novas descobertas. Aqui, nós fornecemos um protocolo detalhado baseado em bioinformática para a identificação, caracterização e anotação funcional in silico de circRNAs durante as interações patógeno-hospedeiro. O protocolo inclui a identificação e quantificação de circRNAs a partir de conjuntos de dados de sequenciamento de RNA, anotação via circBase e a caracterização dos candidatos de circRNA em termos de tipos de circRNA, número de genes sobrepostos e interações circRNA-miRNA previstas. Este estudo também fornece a anotação funcional dos genes parentais do circRNA através da análise de enriquecimento da Gene Ontology (GO) e da Enciclopédia de Genes e Genomas de Kyoto (KEGG).

Protocol

Neste protocolo, conjuntos de dados da biblioteca RNA-seq depletada de RNA-rribossomal desidentificados preparados a partir de células de macrófagos humanos infectadas pelo vírus influenza A foram baixados e usados do banco de dados Gene Expression Omnibus (GEO). Todo o pipeline de bioinformática, desde a predição até a caracterização funcional dos circRNAs, está resumido na Figura 1. Cada parte do gasoduto é explicada mais detalhadamente nas seções abaixo. <p class="jove_ti…

Representative Results

O protocolo alistado na seção anterior foi modificado e configurado para se adequar ao sistema operacional Linux. A principal razão é que a maioria das bibliotecas de módulos e pacotes envolvidos na análise de circRNAs só podem funcionar na plataforma Linux. Nesta análise, conjuntos de dados da biblioteca RNA-seq depletada de RNA-seq de RNA ribossomal não identificados, preparados a partir de células de macrófagos humanos infectadas pelo vírus Influenza A, foram baixados do banco de dados GEO<sup class="xref"…

Discussion

Para ilustrar a utilidade deste protocolo, RNA-seq de células de macrófagos humanos infectadas pelo vírus influenza A foi usado como exemplo. CircRNAs funcionando como potenciais esponjas de miRNA em interações patógeno-hospedeiro e seu enriquecimento funcional GO e KEGG dentro de um hospedeiro foram investigados. Embora haja uma variedade de ferramentas circRNA disponíveis on-line, cada uma delas é um pacote autônomo que não interage entre si. Aqui, reunimos algumas das ferramentas necessárias para predição…

Disclosures

The authors have nothing to disclose.

Acknowledgements

O autor gostaria de agradecer a Tan Ke En e ao Dr. Cameron Bracken pela revisão crítica deste manuscrito. Este trabalho foi apoiado por bolsas do Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) e University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materials

Bedtools GitHub https://github.com/arq5x/bedtools2/ Referring to section 4.1.2. Needed for Circr.
BWA Burrows-Wheeler Aligner http://bio-bwa.sourceforge.net/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr GitHub https://github.com/bicciatolab/Circr Referring to section 4. Use to predict the miRNA binding sites
CIRIquant GitHub https://github.com/bioinfo-biols/CIRIquant Referring to section 2.1.3. To predict circRNAs
Clusterprofiler GitHub https://github.com/YuLab-SMU/clusterProfiler Referring to section 7. For GO and KEGG functional enrichment
CPU Intel  Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)  Specifications used to run this entire protocol.
Cytoscape Cytoscape https://cytoscape.org/download.html Referring to section 5.2. Needed to plot ceRNA network
FastQC Babraham Bioinformatics https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ Referring to section 1.2.1. Quality checking on Fastq files
HISAT2 http://daehwankimlab.github.io/hisat2/ Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux Ubuntu 20.04.5 LTS (Focal Fossa) https://releases.ubuntu.com/focal/ Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda http://www.microrna.org/microrna/getDownloads.do Referring to section 4.1.2. Needed for Circr
Pybedtools pybedtools 0.8.2 https://pypi.org/project/pybedtools/ Needed for BED file genomic manipulation
Python Python 2.7 and 3.6 or abover https://www.python.org/downloads/ To run necessary library modules
R The Comprehensive R Archive Network https://cran.r-project.org/ To manipulate dataframes
RNAhybrid BiBiServ https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid Referring to section 4.1.2. Needed for Circr
RStudio RStudio https://www.rstudio.com/ A workspace to run R
samtools  SAMtools http://www.htslib.org/ Referring to section 2.1.2. Needed to run CIRIquant
StringTie Johns Hopkins University: Center for Computational Biology http://ccb.jhu.edu/software/stringtie/index.shtml Referring to section 2.1.2. Needed to run CIRIquant
TargetScan GitHub https://github.com/nsoranzo/targetscan Referring to section 4.1.2. Needed for Circr

References

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy – Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Play Video

Cite This Article
Ealam Selvan, M., Lim, K. S., Teo, C. H., Lim, Y. In Silico Identification and Characterization of circRNAs During Host-Pathogen Interactions. J. Vis. Exp. (188), e64565, doi:10.3791/64565 (2022).

View Video