Summary

mirMachine: Um balcão único para anotação de miRNA de planta

Published: May 01, 2021
doi:

Summary

Aqui, apresentamos um novo e totalmente automatizado pipeline de miRNA, mirMachine, que 1) pode identificar miRNAs conhecidos e novos com mais precisão e 2) é totalmente automatizado e disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado.

Abstract

De diferentes tipos de RNAs não codificantes, os microRNAs (miRNAs) têm estado indiscutivelmente no centro das atenções na última década. Como reguladores pós-transcricionais da expressão gênica, os miRNAs desempenham papéis-chave em várias vias celulares, incluindo o desenvolvimento e a resposta ao estresse a/biótico, como seca e doenças. Ter sequências genômicas de referência de alta qualidade permitiu a identificação e anotação de miRNAs em várias espécies de plantas, onde as sequências de miRNA são altamente conservadas. Como os processos computacionais de identificação e anotação de miRNA são principalmente processos propensos a erros, as previsões baseadas em homologia aumentam a precisão da previsão. Desenvolvemos e melhoramos o pipeline de anotação de miRNA, SUmir, na última década, que tem sido usado para vários genomas de plantas desde então.

Este estudo apresenta um novo pipeline de miRNA totalmente automatizado, mirMachine (Máquina de miRNA), (i) adicionando uma etapa de filtragem adicional nas previsões da estrutura secundária, (ii) tornando-o totalmente automatizado e (iii) introduzindo novas opções para prever miRNA conhecido com base em homologia ou novos miRNAs baseados em pequenas leituras de sequenciamento de RNA usando o pipeline anterior. O novo pipeline de miRNA, mirMachine, foi testado usando o Arabidopsis Information Resource, TAIR10, liberação do genoma Arabidopsis e o genoma de referência de trigo v2 do International Wheat Genome Sequencing Consortium (IWGSC).

Introduction

Os avanços nas tecnologias de sequenciamento de próxima geração ampliaram a compreensão das estruturas de RNA e dos elementos regulatórios, revelando RNAs não codificantes (ncRNAs) funcionalmente importantes. Dentre os diferentes tipos de ncRNAs, os microRNAs (miRNAs) constituem uma classe reguladora fundamental de pequenos RNAs com comprimento entre 19 e 24 nucleotídeos em plantas 1,2. Desde a descoberta do primeiro miRNA no nematoide Caenorhabditis elegans3, a presença e as funções dos miRNAs têm sido amplamente estudadas em genomas animais e vegetais, bem como4,5,6. Os miRNAs funcionam visando os mRNAs para clivagem ou repressão translacional7. Evidências acumuladas também mostraram que os miRNAs estão envolvidos em uma ampla gama de processos biológicos em plantas, incluindo crescimento e desenvolvimento8, autobiogênese9 e várias respostas bióticas e abióticas ao estresse10.

Em plantas, os miRNAs são inicialmente processados a partir de longos transcritos primários chamados pri-miRNAs11. Esses pri-miRNAs gerados pela RNA polimerase II dentro do núcleo são transcritos longos formando uma estrutura fold-back imperfeita12. Os pri-miRNAs mais tarde passam por um processo de clivagem para produzir precursores endógenos de fita simples (ss) de miRNAs chamados pré-miRNAs11. O pré-miRNA forma uma estrutura semelhante a um grampo de cabelo em que uma fita simples se dobra em uma estrutura de fita dupla para extirpar um duplex de miRNA (miRNA/miRNA*)13. A proteína tipo dícero corta ambas as cadeias do duplex miRNA/miRNA*, deixando 2-nucleotídeos 3′-saliências14,15. O duplex de miRNA é metilado no interior do núcleo, o que protege a extremidade 3′ do miRNA da degradação e da atividade de uridilação16,17. Uma helicase desenrola o duplex de miRNA metilado após a exportação e expõe o miRNA maduro ao complexo silenciador induzido por RNA (RISC) no citosol18. Uma fita do duplex é o miRNA maduro incorporado ao RISC, enquanto a outra fita, o miRNA*, é degradada. O complexo miRNA-RISC liga-se à sequência alvo, levando à degradação do mRNA em caso de complementaridade total ou à repressão translacional em caso de complementaridade parcial13.

Com base nas características de expressão e biogênese, diretrizes para anotação de miRNA têm sido descritas15,19. Com as diretrizes definidas, Lucas e Budak desenvolveram o pipeline SUmir para realizar uma identificação de miRNA in silico baseada em homologia em plantas9. O pipeline da SUmir era composto por dois scripts: SUmirFind e SUmirFold. O SUmirFind realiza pesquisas de similaridade em conjuntos de dados de miRNA conhecidos por meio da triagem da ferramenta de pesquisa de alinhamento local básico (BLAST) do National Center for Biotechnology Information (NCBI) com parâmetros modificados para incluir acertos com apenas 2 ou menos incompatibilidades e evitar viés para acertos mais curtos (blastn-short -ungapped -penalty -1 -reward 1). O SUmirFold avalia a estrutura secundária das supostas sequências de miRNA a partir dos resultados do BLAST20 usando o UNAfold21. O SUmirFold diferencia os miRNAs de pequenos RNAs interferentes pela identificação das características da estrutura do hairpin. Além disso, diferencia os miRNAs de outros ssRNAs, como tRNA e rRNA, pelos parâmetros, índice mínimo de energia de dobra > 0,67 e conteúdo de GC de 24-71%. Este pipeline foi recentemente atualizado adicionando duas etapas adicionais para (i) aumentar a sensibilidade, (ii) aumentar a precisão da anotação e (iii) fornecer distribuição genômica dos genes de miRNA previstos22. Dada a alta conservação das sequências de miRNA23 das plantas, este pipeline foi originalmente projetado para a previsão de miRNA baseada em homologia. Novos miRNAs, no entanto, não puderam ser identificados com precisão com esta análise de bioinformática, pois dependiam fortemente da conservação de sequências de miRNAs entre espécies intimamente relacionadas.

Este artigo apresenta um novo e totalmente automatizado pipeline de miRNA, mirMachine que 1) pode identificar miRNAs conhecidos e novos com mais precisão (por exemplo, o pipeline agora usa novas previsões de miRNA baseadas em sRNA-seq, bem como identificação de miRNA baseada em homologia) e 2) é totalmente automatizado e disponível gratuitamente. Os resultados também incluíram as distribuições genômicas dos miRNAs previstos. O mirMachine foi testado para previsões baseadas em homologia e sRNA-seq em genomas de trigo e Arabidopsis . Embora inicialmente lançado como software livre, UNAfold tornou-se um software comercial na última década. Com esta atualização, a ferramenta de previsão de estrutura secundária foi trocada de UNAfold para RNAfold para que o mirMachine possa estar disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado (exemplos são fornecidos em https://github.com/hbusra/mirMachine.git).

Protocol

1. Dependências e instalação de software Instale dependências de software de seu site doméstico ou usando conda.Baixe e instale o Perl, se ainda não estiver instalado, a partir de seu site inicial (https://www.perl.org/get.html).NOTA: Os resultados representados foram preditos usando Perl v5.32.0. Baixe o Blast+, um programa de alinhamento, de seu site (https://www.ncbi.nlm.nih.gov/books/NBK279671/) como executável e como código-fonte.NOTA: Os resultados representados foram pr…

Representative Results

O pipeline de miRNA, mirMachine, descrito acima foi aplicado aos dados de teste para a rápida avaliação do desempenho do pipeline. Apenas os miRNAs vegetais de alta confiança depositados na miRBase v22.1 foram rastreados contra o cromossomo 5A do genoma RefSeq de trigo IWGSC v224. mirMachine_find retornou 312 acertos para a lista não redundante de 189 miRNAs de alta confiança com um máximo de 1 incompatibilidade permitida (Tabela 1). mirMachine_fold classificaram 49 deles c…

Discussion

Nosso pipeline de miRNA, SUmir, tem sido usado para a identificação de muitos miRNAs de plantas na última década. Aqui, desenvolvemos um novo pipeline de identificação e anotação de miRNA totalmente automatizado e disponível gratuitamente, o mirMachine. Além disso, vários pipelines de identificação de miRNA, incluindo, mas não se limitando ao pipeline anterior, dependiam do software UNAfold21, que se tornou um software comercial ao longo do tempo, embora uma vez estivesse disponível…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Referências

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/pt/62430?article_type=t

Play Video

Citar este artigo
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video