Summary

Tutorial de análisis computacional para ARN quimérico pequeño no codificante: bibliotecas de secuenciación de ARN diana

Published: December 01, 2023
doi:

Summary

Aquí, presentamos un protocolo que demuestra la instalación y el uso de una tubería bioinformática para analizar los datos de secuenciación de ARN quimérico utilizados en el estudio de las interacciones ARN:ARN in vivo .

Abstract

En los últimos años se ha avanzado en la comprensión de las interacciones reguladoras génicas in vivo de los pequeños ARN no codificantes (sncRNA), como los microARN (miARN), con sus ARN diana mediante enfoques bioquímicos que utilizan la reticulación seguida de la ligadura para capturar interacciones entre el ARN y el ARN diana a través de la formación de ARN quiméricos y las bibliotecas de secuenciación posteriores. Si bien los conjuntos de datos de secuenciación de ARN quimérico proporcionan información de todo el genoma y sustancialmente menos ambigua que el software de predicción de miARN, destilar estos datos en información significativa y procesable requiere análisis adicionales y puede disuadir a los investigadores que carecen de una formación computacional. Este informe proporciona un tutorial para ayudar a los biólogos computacionales de nivel básico a instalar y aplicar una herramienta de software de código abierto reciente: Small Chimeric RNA Analysis Pipeline (SCRAP). Se proporcionan los requisitos de la plataforma, las actualizaciones y una explicación de los pasos de la canalización y la manipulación de las variables clave de entrada del usuario. Reducir una barrera para que los biólogos obtengan información de los enfoques de secuenciación de ARN quimérico tiene el potencial de impulsar investigaciones basadas en el descubrimiento de interacciones reguladoras entre el ARNnc y el ARN objetivo en múltiples contextos biológicos.

Introduction

Los pequeños ARN no codificantes están muy estudiados por sus funciones postranscripcionales en la coordinación de la expresión de conjuntos de genes en diversos procesos como la diferenciación y el desarrollo, el procesamiento de señales y la enfermedad 1,2,3. La capacidad de determinar con precisión las transcripciones diana de los pequeños ARN no codificantes (sncRNA) reguladores de genes, incluidos los microARN (miARN), es importante para los estudios de la biología del ARN tanto a nivel básico como traslacional. Los algoritmos bioinformáticos que explotan la complementariedad anticipada entre la secuencia de semillas de miARN y sus posibles dianas se han utilizado con frecuencia para la predicción de las interacciones entre el ARN y el ARN diana. Si bien estos algoritmos bioinformáticos han tenido éxito, también pueden albergar resultados falsos positivos y falsos negativos, como se ha revisado en otros lugares 4,5,6. Recientemente, se han diseñado e implementado varios enfoques bioquímicos que permiten la determinación inequívoca y semicuantitativa de las interacciones de vivo entre el ARNnc y el ARN diana mediante reticulación in vivo y la consiguiente incorporación de un paso de ligadura para unir físicamente el ARNnc a su diana para formar un único ARN quimérico 4,5,7,8,9,10 . La preparación posterior de bibliotecas de secuenciación a partir de los ARN quiméricos permite la evaluación de las interacciones entre el ARN snc y el ARN diana mediante el procesamiento computacional de los datos de secuenciación. Este vídeo proporciona un tutorial para instalar y utilizar una canalización computacional denominada canalización de análisis de ARN quimérico pequeño (SCRAP), que está diseñada para permitir un análisis robusto y reproducible de las interacciones entre el ARNnc y el ARN diana a partir de bibliotecas de secuenciación de ARN quimérico6.

Uno de los objetivos de este tutorial es ayudar a los investigadores a evitar la dependencia excesiva de algoritmos bioinformáticos puramente predictivos mediante la reducción de las barreras para el análisis de los datos generados a través de enfoques bioquímicos que proporcionan lecturas moleculares quiméricas de las interacciones entre el ARN y el ARN objetivo. Este tutorial proporciona pasos prácticos y consejos para guiar a los científicos computacionales de nivel básico a través del uso de una tubería, SCRAP, desarrollada para analizar datos de secuenciación de ARN quimérico, que pueden ser generados por varios protocolos bioquímicos existentes, incluida la reticulación, ligadura y secuenciación de híbridos (CLASH) y la ligadura covalente de ARN endógenos unidos a argonauta, reticulación e inmunoprecipitación (CLEAR-CLIP)7,9.

El uso de SCRAP ofrece varias ventajas para el análisis de datos de secuenciación de ARN quimérico, en comparación con otras tuberías computacionales6. Una ventaja destacada es su amplia anotación y la incorporación de llamadas a scripts bioinformáticos bien soportados y actualizados rutinariamente dentro de la canalización, en comparación con las canalizaciones alternativas que a menudo se basan en scripts personalizados y/o no admitidos para los pasos de la canalización. Esta característica le da estabilidad a SCRAP, lo que hace que valga más la pena que los investigadores se familiaricen con la canalización e incorporen su uso en su flujo de trabajo. También se ha demostrado que SCRAP supera a las canalizaciones alternativas en la llamada a los picos de las interacciones entre el ARNnc y el ARN diana y que tiene funcionalidad multiplataforma, como se detalla en una publicación anterior6.

Al final de este tutorial, los usuarios podrán (i) conocer los requisitos de la plataforma para SCRAP e instalar canalizaciones de SCRAP, (ii) instalar genomas de referencia y configurar parámetros de línea de comandos para SCRAP, y (iii) comprender los criterios de llamada de picos y realizar llamadas de picos y anotaciones de picos.

Este vídeo describirá en detalle práctico cómo los investigadores que estudian la biología del ARN pueden instalar y utilizar de forma óptima la tubería computacional, SCRAP, para analizar las interacciones del sncRNA con los ARN diana, como los ARN mensajeros, en los datos de secuenciación de ARN quimérico obtenidos a través de uno de los enfoques bioquímicos discutidos para la preparación de la biblioteca de secuenciación.

SCRAP es una utilidad de línea de comandos. Por lo general, siguiendo la guía que se indica a continuación, el usuario deberá (i) descargar e instalar SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) instalar genomas de referencia y ejecutar SCRAP, y (iii) realizar llamadas y anotaciones máximas.

Se pueden encontrar más detalles de los pasos computacionales de este procedimiento en https://github.com/Meffert-Lab/SCRAP. Este artículo proporcionará la configuración y la información básica para permitir a los investigadores con habilidades computacionales de nivel básico instalar, optimizar y usar SCRAP en conjuntos de datos de bibliotecas de secuenciación de ARN quimérico.

Protocol

NOTA: El protocolo comenzará con la descarga e instalación del software necesario para analizar las bibliotecas de secuenciación de ARN quimérico utilizando SCRAP. 1. Instalación Antes de instalar SCRAP, instale las dependencias Git y Miniconda en la máquina que se utilizará para los análisis. Es probable que Git ya esté instalado. En la plataforma Mac OSX, por ejemplo, verifique esto usando qué git para ver que la utilidad ” git ” está pr…

Representative Results

En la Figura 2 y en la Tabla 1 se muestran los resultados de sncRNA:ARN diana detectados por una versión modificada de SCRAP (versión 2.0 de SCRAP, que implementa modificaciones para el filtrado de ARNr) en conjuntos de datos de secuenciación publicados previamente preparados con CLEAR-CLIP9. Los usuarios pueden apreciar la disminución de las interacciones relativas de miARN de fracción con las regiones de intrones que se produce tras el aislamie…

Discussion

Este protocolo sobre el uso de la canalización SCRAP para el análisis de las interacciones entre el ARN y el ARN objetivo está diseñado para ayudar a los investigadores que se adentran en el análisis computacional. Se espera que la finalización del tutorial guíe a los investigadores con experiencia computacional de nivel básico o superior a través de los pasos necesarios para la instalación y el uso de esta tubería y su aplicación para analizar los datos obtenidos de las bibliotecas de secuenciación de ARN q…

Divulgations

The authors have nothing to disclose.

Acknowledgements

Agradecemos a los miembros del laboratorio Meffert por sus útiles discusiones, incluidos BH Powell y WT Mills IV, por sus comentarios críticos sobre la descripción de la instalación e implementación del gasoducto. Este trabajo fue apoyado por un premio de la Fundación Braude, el Programa de Lanzamiento del Fondo de Investigación de Células Madre de Maryland, el premio Blaustein Endowment for Pain Research and Education, y el RO1NS103974 del NINDS y el RO1MH129292 del NIMH a M.K.M.

Materials

Genomes UCSC Genome browser N/A https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux Linux Ubuntu 20.04 or 22.04 LTS recommended
Mac Apple Mac OSX (>11)
Platform setup GitHub N/A https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline GitHub N/A https://github.com/Meffert-Lab/SCRAP
Unix shell Unix operating system bash >=5.0
Unix shell Unix operating system zsh (5.9 recommended)
Windows Windows WSL Ubuntu 20.04 or 22.04 LTS

References

  1. Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
  2. Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
  3. Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
  4. Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
  5. Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
  6. Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
  7. Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
  8. Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
  9. Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
  10. Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
  11. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
  12. Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
  13. Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).
check_url/fr/65779?article_type=t

Play Video

Citer Cet Article
Eadara, S., Li, X., Eiss, E. A., Meffert, M. K. Computational Analysis Tutorial for Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries. J. Vis. Exp. (202), e65779, doi:10.3791/65779 (2023).

View Video