Waiting
Procesando inicio de sesión ...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Una tubería completa para aislar y secuenciar microRNAs, y analizarlos mediante herramientas de código abierto

Published: August 21, 2019 doi: 10.3791/59901

Summary

Aquí, describimos una estrategia paso a paso para aislar pequeños ARN, enriquecer para microARN y preparar muestras para la secuenciación de alto rendimiento. A continuación, describimos cómo procesar lecturas de secuencia y alinearlas con microRNAs, utilizando herramientas de código abierto.

Abstract

Se cree que la mitad de todas las transcripciones humanas están reguladas por microARN. Por lo tanto, la cuantificación de la expresión de microARN puede revelar mecanismos subyacentes en los estados de la enfermedad y proporcionar dianas terapéuticas y biomarcadores. Aquí, detallamos cómo cuantificar con precisión los microRNAs. Brevemente, este método describe el aislemiento de microARN, ligando a adaptadores adecuados para la secuenciación de alto rendimiento, la amplificación de los productos finales y la preparación de una biblioteca de muestras. A continuación, explicamos cómo alinear las lecturas de secuenciación obtenidas con horquillas microRNA, y cuantificar, normalizar y calcular su expresión diferencial. Versátil y robusto, este flujo de trabajo experimental combinado y análisis bioinformático permite a los usuarios comenzar con la extracción de tejidos y terminar con la cuantificación de microARN.

Introduction

Descubierto por primera vez en 19931, ahora se estima que casi 2000 microARN están presentes en el genoma humano2. Los MicroRNAs son ARN pequeños que no codifican y que suelen tener entre 21 y 24 nucleótidos de largo. Son reguladores post-transcripcionales de la expresión génica, a menudo uniéndose a sitios complementarios en la región 3 no traducida (3-UTR) de genes diana para reprimir la expresión de proteínas y degradar el ARNm. La cuantificación de los microARN puede proporcionar información valiosa sobre la expresión génica y se han desarrollado varios protocolos para este propósito3.

Hemos desarrollado un protocolo definido, reproducible y de larga data para la secuenciación de ARN pequeño, y para analizar lecturas normalizadas utilizando herramientas bioinformáticas de código abierto. Es importante destacar que nuestro protocolo permite la identificación simultánea de microARN endógenos y construcciones exógenas que producen especies similares a microARN, al tiempo que minimiza las lecturas que se asignan a otras especies de ARN pequeños, incluyendo ARN ribosomales ( rRNAs), transferir ARN pequeños derivados del ARN derivados del ARN (trnA), ARN pequeños derivados de repetición y productos de degradación de ARNm. Afortunadamente, los microRNAs son 5-fosforilados y 2-3 hidroxilados4, una característica que se puede aprovechar para separarlos de estos otros pequeños ARN y productos de degradación de ARNm. Existen varias opciones comerciales para la clonación y secuenciación de microARN que a menudo son más rápidas y fáciles de multiplexar; sin embargo, la naturaleza propietaria de los reactivos del kit y sus modificaciones frecuentes hace que comparar las corridas de muestras sea un reto. Nuestra estrategia optimiza la recolección de sólo el tamaño correcto de los microRNAs a través de pasos de purificación de gel de acrilamida y agarosa. En este protocolo, también se describe un procedimiento para alinear las lecturas de secuencia con los microRNAs mediante herramientas de código abierto. Este conjunto de instrucciones será especialmente útil para los usuarios de informática novato, independientemente de si se utiliza nuestro método de preparación de bibliotecas o un método comercial.

Este protocolo se ha utilizado en varios estudios publicados. Por ejemplo, se utilizó para identificar el mecanismo por el cual la enzima Dicer corta ARN de horquilla pequeña a una distancia de dos nucleótidos del bucle interno de la estructura de bucle de tallo - la llamada "regla de recuento de bucles"5. También seguimos estos métodos para identificar la abundancia relativa de ARN de horquilla pequeña (shRNA) entregados a partir de vectores virales adeno-asociados a la recombinante (RAAVs), para identificar el umbral de expresión de ARNS pequeños que se puede tolerar antes del hígado toxicidad asociada con el exceso de expresión de ARNH6. Utilizando este protocolo, también identificamos microARN en el hígado que responden a la ausencia de microARN-122 - un microARN hepático altamente expresado - al mismo tiempo que caracterizan el patrón de degradación de este microARN7. Debido a que hemos utilizado nuestro protocolo consistentemente en numerosos experimentos, hemos sido capaces de observar los preparativos de la muestra longitudinalmente, y ver que no hay efectos de lote discernibles.

Al compartir este protocolo, nuestro objetivo es permitir a los usuarios generar cuantificación reproducible de microRNAs de alta calidad en prácticamente cualquier tejido o línea celular, utilizando equipos y reactivos asequibles, y herramientas bioinformáticas gratuitas.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Los experimentos con animales fueron autorizados por el Comité Institucional de Cuidado y Uso de Animales de la Universidad de Washington.

Preparación de la biblioteca de ARN pequeño

1. Aislamiento de ARN

  1. Aísle el ARN de una fuente biológica utilizando un reactivo de aislamiento de ARN estándar, o un kit que enriquezca para los microARN. Para los tejidos, lo mejor es comenzar con muestras congeladas en nitrógeno líquido y molidas a un polvo utilizando un mortero preenfriado y un pestillo.
  2. Mida la integridad del ARN de cada muestra en un instrumento que pueda cuantificar el ARN y proporcionar un número de integridad de ARN (RIN). Los RIN deben ser >7.

2. 3' ligadura del adaptador

  1. Preparar una reacción de ligadura en tubos de tiras de PCR, combinando: 11 l de ARN (1-3 g, utilizando la misma cantidad para cada muestra), 1,5 l de búfer de reacción de ligasa de ARN 10x T4, libre de ATP, 1 l de poli-etilenglicol (PEG), y 0,5 l de 3'-linker (100 m de clonación de mirna universal de lin Ker).
    NOTA: La ausencia de ATP ayuda a enriquecer los MIRNAs y minimiza la clonación de productos de degradación de ARNm. PEG actúa como un agente de aglomeración molecular, mejorando el éxito de la ligadura. El vinculador de clonación de miRNA universal tiene un grupo de bloqueo de 3' (amina) para evitar la autoligación, la circularización y la ligadura al ARN en el extremo de 5'.
  2. Calentar las muestras a 95oC en un termociclador durante 30-40 s. Enfriar sobre hielo durante 1 min. Añadir 1 l de arn a D4 ligase 2 e incubar a temperatura ambiente durante 2 h. Preparar el gel (paso 2.3) mientras las muestras se están incubando.
    NOTA: La incubación a temperatura ambiente ayuda a evitar la ligadura eslador-eslabón. También hemos utilizado con éxito la ligasa de ARN T4 1.
  3. Preparar 30 ml de un gel de poliacrilamida 15% con urea de 8 M (para un gel de 20x20 cm): 14,4 g de urea, 3 ml de ácido etilendiaminetetraacético de 10x Tris tampón (TBE), 11,2 ml de 40% 19:1 acrilamida y H2O a 30 ml. La solución se disuelve mejor a 42 oC. Inmediatamente antes de la fundición, añadir 150 ml de 10% de persulfato de amonio (APS) y 30 l de tetrametiletilendiamina (TEMED) para la polimerización.
  4. Vierta entre placas de vidrio separadas de 0,8 mm en un peine de fundición de plástico e inserte. Una vez que el gel se solidifique (alrededor de 20 min), añadir 0,5x TBE al tanque y lavar los pozos de urea residual pipeteando vigorosamente.
  5. Pre-ejecutar el gel a una constante 375 V durante 25 minutos sin muestras para que la urea pueda entrar en el gel, luego lavar los pozos de nuevo.
    NOTA: Es posible que sea necesario reducir la cantidad de tensión en función del tipo de fuente de alimentación y del sistema de electroforesis que se utilice.
  6. Una vez que las muestras se realizan ligando, añadir 15 éC de tinte de carga de acrilamida a las muestras (para una proporción de 1:1), a continuación, desnaturalizar durante 5 minutos a 95 oC en un termociclador.
  7. Preparar 25 ng/L de marcadores de tamaño de 37 y 44 bp, diluidos con un tinte de carga de acrilamida de una parte. Las secuencias se enumeran en la Tabla1.
  8. Cargue las muestras en el gel de poliacrilamida, dejando al menos un carril entre cada muestra. Cargar 20 l de al menos dos conjuntos de marcadores, en un patrón asimétrico para realizar un seguimiento de la orientación del gel.
  9. Ejecute el gel a una constante de 375 V durante los primeros 15 minutos y luego aumente a una constante de 425 V para la carrera restante. Correr hasta que el azul bromofenol está a unos 1-4 cm de la parte inferior, que toma aproximadamente 2 h.
    NOTA: Si es necesario, el gel puede funcionar a una tensión constante más baja durante un período de tiempo más largo hasta que el azul bromofenol esté a unos 1-4 cm de la parte inferior.
  10. Retire el gel de las placas de vidrio con un separador de placas y coloque el gel en un protector de página de plástico. Diluir 5 ml de bromuro de etidio en 500 ml de agua destilada y pipetear en carriles de marcadores justo por encima del marcador azul claro superior (ver Figura 1A).
    ADVERTENCIA: Utilice guantes para bromuro de etidio y deseche los residuos de acuerdo con la normativa local. Dejar sentarse durante 5 min.
  11. Bajo la luz ultravioleta (UV), corte los geles de marcador superior a inferior en cada carril usando una cuchilla de afeitar limpia (ver Figura 1A). Pasar a un cuadrado de 4 x 4 cm de película de sellado de laboratorio, luego cortar el gel con unos 4 cortes horizontalmente y 3 verticalmente para producir 12 cuadrados pequeños (ver Figura 1B).
  12. Pipetear 400 l de 0,3 M NaCl en el cuadrado de la película de sellado, y embudo piezas de gel en tubos siliconizados de 1,5 ml (ver Figura 1C). Agitar las muestras en un nutator a 4 oC durante la noche.
    NOTA: Otros tubos de 1,5 ml de baja retención se pueden sustituir por tubos siliconizados.
  13. Después de al menos 12 h de agitación a 4oC, recuperar las muestras y ponerlas en hielo, junto con un tubo cónico de 100% etanol.
  14. Transfiera 400 ml de sobrenadante a un tubo nuevo, y luego agregue 1 ml de 100% de etanol y 1 l de 15 mg/ml de coprecio de glucógeno. Asegúrese de recoger la mayor cantidad posible de sobrenadantes, girando hacia abajo a 4 oC y pipeteando más como sea necesario. Colocar a -80 oC durante 1 h, o -20 oC durante 2 h o más. El coprecio de glucógeno mejora la visibilidad y recuperación de pellets.
  15. Girar a 4 oC a 17.000 x g durante 20-30 min. Retire todos los restos de etanol y deje que el pellet se seque al aire durante 5 min.

3. Ligación de eslabones de 5'

  1. Vuelva a suspender el pellet pipeteando en 6,5 ml de agua libre de nucleasas. Dejar que el pellet se siente en el agua durante unos minutos primero ayudará con la resuspensión.
  2. Después de girar el pellet y volver a cargar en agua, añadir 0,5 l de 100 m 5'-linker (con códigos de barras; ver tabla 1), 1 l de tampón de ligasa de ARN T4, 1 l de 10 mM de ATP y 1 l de PEG. Calentar a 90 oC durante 30 s, luego colocar sobre hielo. Añadir 1 l de ARN ligados 1 t4 y dejar incubar a temperatura ambiente durante 2 h.
  3. Añadir 400 l de NaCl de 0,3 M, seguido de 400 ml de ácido fenol/cloroformo. Vortex 30 s - 1 min (la solución se verá turbia), y luego girar a 4 oC durante 10-15 min a la velocidad máxima en una microcentrífuga (17.000 x g). Extraiga la capa superior y colóquela en un nuevo tubo de 1,5 ml.
    NOTA: Evite pipetear cualquiera de la capa inferior.
  4. Añadir 350 l de cloroformo, vórtice brevemente, y luego girar a 4 oC durante 10 minutos a la velocidad máxima (17.000 x g). Extraiga la parte superior más tarde y colóquela en un nuevo tubo de 1,5 ml. Añadir 1,5 ml de coprecio de glucógeno y 1 ml de etanol al 100%.
    NOTA: Una vez más, evite pipetear cualquiera de la capa inferior.
  5. Vortex brevemente, luego colocar a -80 oC durante al menos 1 h, o -20 oC durante la noche.

4. Transcripción inversa (RT)

  1. Encienda el bloque de calor de 42 oC. Gire las muestras a 4 oC y 17.000 x g durante 20-30 min. Retire todo el sobrenadante y deje que el pellet se seque al aire durante 5 min.
  2. Vuelva a suspender la muestra de peletización en 8,25 ml de agua libre de nucleasas y, a continuación, añadir: 0,5 ml de imprimación RT de 100 m (Tabla1), y 5 ml de mezcla de reacción de 2 x RT a partir de un kit de síntesis de ADNc. Incubar a 42oC durante 3 min.
  3. Añadir 1,5 ml de enzima RT de 10x a cada muestra e incubar a 42 oC durante 30 minutos en un termociclador. Colocar a -20oC o continuar con hidrólisis y neutralización.
    NOTA: Se pueden utilizar varios kits RT para los pasos 4.2 y 4.3.
  4. Realizar hidrólisis alcalina y neutralización: Hacer 1 mL de 150 mM de solución de hidróxido de potasio (KOH) (150 ml de KOH de 1 M, 20 ml de 1 M Tris Base pH 7.5, y 830 l de H2O) y 1 ml de ácido clorhídrico de 150 mM (HCl) (150 ol de 1 M H Y 500 ol y 850 ol de ácido clorhídrico (HCl) (150 ol de 1 M H y 850 ol de hclólvico) de H2O).
  5. Antes de añadir a las muestras, determine la cantidad de HCl necesaria para neutralizar la solución KOH. Generalmente, alrededor de 20-24 l de HCl neutralizará los 25 s de KOH. Compruebe la combinación en una tira de pH para asegurarse de que está en el rango correcto (pH 7.0 a 9.5).
  6. Hidrolizar las muestras añadiendo 25 sL de solución KOH de 150 mM e incubar durante 10 min a 95 oC.
  7. Neutralice las muestras añadiendo la cantidad de 150 mM de HCl determinada en el paso 4.4, para obtener un pH de muestra final entre 7.0 y 9.5.

5. Amplificación de PCR

  1. Después de la neutralización, prepare una reacción de PCR con: 29,5 l de agua, 5 l de tamp taq 10x, 1 l de dNTP, 2 l de imprimación directa de 25 m (Tabla1), 2 ml de imprimación inversa de 25 m (Tabla1), 0,5 l de Taq y 10 l del ADNC transcrito inverso del paso 4.6 .
  2. Ejecuta la siguiente reacción de PCR: 94oC durante 2 min, luego 20 ciclos de 94oC para 45 s, 50oC para 75 s y 72oC para 60 s.
  3. Ejecuta una segunda reacción de PCR de aproximadamente 2-4 ciclos más usando 5 l de producto del paso 5.2. Mezclar: 34,8 l de agua, 5 l de tampón Taq de 10x, 1 l de dNTP, 1 l de imprimación directa de 25 oM (Tabla1), 1 l de imprimación inversa de 25 m (Tabla1) y 0,2 ml de polimerasa Taq. Siga los mismos parámetros termocicladores descritos en el paso 5.2.
    NOTA: El propósito de hacer dos reacciones de PCR – con la primera para 20 ciclos y la segunda para sólo 2-4 más – es asegurar que la cantidad de ADNc amplificado está en un rango dinámico (es decir, no una cantidad saturada).

6. Purificación del gel de agarosa

  1. Prepara un gel de agarosa del 4% con agarosa de baja fusión. Cargue 40 l o más del producto PCR en el gel, junto con el tinte de carga. Cargue marcadores de tamaño de 100 bp y 25 bp.
    NOTA: La escalera de 25 bp ayuda a distinguir el producto amplificado de los productos de ligadura vinculador-vinculador. Los geles de agarosa de baja fusión deben ser fundidos con mayor cuidado que los geles de agarosa tradicionales, así que siga atentamente las instrucciones del fabricante.
  2. Para la extracción de gel, seleccione el número de ciclo que es visible en el gel pero no está saturado (generalmente 22–24 ciclos). Elija bandas de intensidad similares al ejecutar varias muestras.
  3. Corte la banda que está por encima de la banda de 125 bp (la banda más oscura en la escalera de 25 bp; véase la figura 1D). Usando un kit de extracción de gel, siga las instrucciones del fabricante para agregar tampón basado en un gel del 4%, luego agite para disolver la agarosa en el tampón a temperatura ambiente.
    NOTA: La disolución a 55 oC aumenta el potencial de ligadura vinculador-vinculador.
  4. Siga las instrucciones de extracción de gel del fabricante y elule en 30 l de tampón de elución o agua. Si el producto se veía débil en el gel, a continuación, reducir la elución a 20 L.
  5. Mida la concentración de ADNc utilizando una técnica sensible y prepare la biblioteca de muestras para la secuenciación. La preparación dependerá del tipo de secuenciación utilizada.
    NOTA: Los requisitos mínimos para una biblioteca de secuenciación suelen ser un volumen de 10 ml de producto de 10 m. Si las concentraciones son demasiado bajas, las muestras de piscina y etanol precipitan para llevar la biblioteca a la concentración deseada.
  6. Secuenciar las muestras utilizando el equipo disponible. Un ejemplo común sería ejecutar muestras utilizando un kit para lecturas individuales de 50 bp, para obtener aproximadamente 15-25 millones de lecturas en un formato de salida FASTQ.

Alineación de secuencias de ARN pequeños y bioinformática

7. Carga de datos

  1. Descargue los archivos FASTQ generados a partir de cada ejecución de secuenciación. Descargue una lista de secuencias de horquillas microRNA de miRbase.org8,9,10.
  2. Genere una cuenta Galaxy en www.usegalaxy.org y cargue un archivo FASTQ de lecturas de secuencia en esta cuenta.
  3. Cargue un archivo de texto de secuencias de código de barras en la cuenta Galaxy, como barcodes.txt, que está disponible como un archivo de texto (Tabla suplementaria 1).
  4. Sube un archivo FASTA de horquillas microRNA a la cuenta Galaxy desde una base de datos como miRBase.org. En la Tabla Suplementaria 2 y en la Tabla Suplementaria 3se proporcionan ejemplos de precursores de microARN (mousehairpins.fa) o humanos (humanhairpins.fa).

8. Eliminación del adaptador, clasificación de códigos de barras y ajuste

  1. En la pestaña izquierda, vaya a Manipulación de archivos genómica > FASTA/FASTQ > Secuenciasde adaptador de clip .
  2. En Archivo de entrada en formato FASTA o FASTQ, escriba el archivo FASTQ en la lista desplegable. Cambie Longitud mínima de secuencia a 18. Cambie Origen para introducir secuencia personalizada. Introduzca CTGTAGGC. Mantenga todos los demás parámetros predeterminados. Haga clic en Ejecutar.
    NOTA: Las lecturas de secuencia que son más cortas que 18 nucleótidos son difíciles de asignar de forma única a los microARN y contienen muchos productos de degradación.
  3. En la pestaña izquierda, vaya a Manipulación de archivos genómica > FASTA/FASTQ > Divisorde código de barras .
    NOTA: Las funciones y encabezados Galaxy se actualizan periódicamente, por lo que la función de búsqueda puede ser necesaria para encontrar una herramienta equivalente o su ubicación. Los kits comerciales que utilizan imprimaciones indexadas a menudo ya están ordenados por código de barras. Por lo tanto, este paso y el paso de ajuste del código de barras no son necesarios si se inicia desde un kit comercial.
  4. Para que los códigosde barras utilicen , apunte a barcodes.txt. Para que la biblioteca se divida,utilice Clip en el archivo de datos generado en el paso anterior. En Número de discrepancias permitidas, escriba 1. Haga clic en Ejecutar.
  5. Recorta los primeros 4 nucleótidos: navega a Manipulaciones de texto > Recortar caracteres iniciales o finales. En Conjunto de datosde entrada , haga clic en el icono de carpeta, que es una colección de conjuntos de datos. Seleccione el archivo por lotes de muestras, que incluye la etiqueta Divisor de códigode barras en los datos. En Recortar desde el principio hasta esta posición, escriba 5. En ¿Está el dataset de entrada en formato FASTQ? escriba . Haga clic en Ejecutar. La ejecución puede tardar varios minutos.

9. Alineación de lecturas a microRNAs

  1. En Galaxy, vaya a Análisis genómico > RNA-Seq > Cuantificación de transcripción sailfish11.
  2. Para la pregunta Seleccione un transcriptoma de referencia de su historial o utilice un índice integrado? seleccione Usar uno del historial. Introduzca el archivo cargado mousehairpins.fa en la lista desplegable. En el archivo FASTA/Q, haga clic en el icono de carpeta para utilizar una colección de conjuntos de datos y seleccione el archivo que incluye Recortar en la colección. Haga clic en Ejecutar. La ejecución puede tardar varios minutos.
  3. En la pestaña de historial de la derecha, haga clic en Sailfish en la colección... que es una lista con 19 artículos. Haga clic en cada archivo individual y haga clic en el icono de disco para guardarlo en el equipo local. Los archivos descargados individualmente primero deben descomprimirse. También es posible que deban volver a guardarse con una extensión .txt con el fin de importaren en una hoja de cálculo.
  4. Abra cada archivo de hoja de cálculo y vuelva a nombrar la columna NumReads a la condición de tratamiento. Combine las columnas para generar una matriz de microARN en la primera columna y recuentos de lectura por condición en columnas posteriores.
  5. Para calcular microARN expresados diferencialmente para cada condición de tratamiento, utilice el archivo con recuentos de lectura de microARN sin procesar como entrada para programas como DESeq212. DESeq2 está presente en Galaxy en la pestaña Análisis genómico > RNA-seq > DESeq2.
  6. Convierta lecturas sin procesar en recuentos de lectura de microRNA normalizados. Los recuentos se normalizan a la profundidad de secuencia de la biblioteca mediante el siguiente cálculo: [(lecturas en bruto/lecturas totales de microARN) * (1.000.000 – número de microRNAs contados) + 1].
    NOTA: Este cálculo proporciona una lectura normalizada por millón (RPM) microARN asignados que se pueden comparar entre conjuntos de datos y condiciones biológicas. La salida es un archivo delimitado por tabulaciones. Sailfish proporciona una columna de salida tpm, aunque este valor se normaliza por longitud de horquilla microRNA, lo que no es necesario en este contexto.
  7. Si procede, repita la alineación con secuencias de entrada personalizadas (por ejemplo, un vector) para identificar las lecturas que se asignan a construcciones entregadas, como shRNAs.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Esquema de los pasos involucrados en la preparación de la biblioteca
En la Figura 2se describe un esquema general de extracción, secuenciación y alineación de ARN pequeños.
Se recogieron muestras de hígado de un ratón macho y una hembra y se congelaron en nitrógeno líquido. El ARN total se extrajo y evaluó la calidad y la concentración.

La secuenciación de ARN pequeño produce suficiente ARN para la secuenciación
Se utilizaron 3 g de ARN a partir de dos extracciones de ARN independientes como material de partida para la secuenciación de ARN pequeño. Las muestras se ejecutaron en un gel de acrilamida y se cortaron entre marcadores de tamaño correspondientes a 17-28 nt de ARN (Figura1A). Las muestras se cortaron en fragmentos para el aislamiento de ARN (Figura1B)y se transfirieron a un tubo centrífugo de 1,5 ml de baja retención (Figura 1C). Los códigos de barras bc7 y bc17 (Tabla1)fueron ligados al extremo 5' del ARN pequeño. Las bibliotecas de ARN pequeñas se amplificaron mediante PCR utilizando 22 ciclos de PCR para producir productos de 8,0 y 11,2 ng/L, respectivamente. Las muestras se agruparon y se envió una muestra agrupada de 10 nM para la secuenciación de alto rendimiento utilizando una longitud de lectura de 50 bp.

MiR-122 es el microARN más abundante en el hígado del ratón
Después de la clasificación de códigos de barras, 851.931 lecturas contenían códigos de barras de la muestra de hígado 1 y 650.154 de la muestra de hígado 2. De las lecturas, el 83,5% y el 90,0% se asignan a microRNAs respectivamente, con la asignación de lecturas restantea a arNI (1,8% y 0,6% respectivamente), fragmentos de degradación de tRNAs y ARNm. Después de la alineación con las horquillas microRNA humanas, observamos una fuerte concordancia entre los recuentos de lectura de microARN en cada réplica (R2 a 0,998; Figura 3). Se detectaron un total de 306 especies de microARN, con el mayor número de lecturas que se asignaron a miR-122 (TablaSuplementaria 4). La abundancia de MicroRNA fue similar entre muestras de hígado masculino y femenino.

Figure 1
Figura 1. Extracción de pequeños ARN de un gel de acrilamida. (A) Gel de acrilamida y región que se corta correspondiente al tamaño de los microARN. (B) Piezas de gel antes y después de cortar en fragmentos más pequeños. (C) Proceso de transferencia de fragmentos de gel a tubos siliconizados. (D) reacción de PCR en gel de agarosa de baja fusión que demuestre el producto clonado correcto en comparación con el producto vinculador y muestras insaturadas (22 ciclos) frente a saturadas (24 ciclos). Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2. Esquema del protocolo. Una línea de tiempo que muestra los pasos principales involucrados en el procedimiento. Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3. Reproducibilidad de los resultados de dos extracciones independientes de ARN. La gráfica de dispersión de lectura de microARN cuenta a partir de un hígado de ratón masculino (eje X) en comparación con un hígado de ratón hembra (eje y) utilizando una escala basada en log10. Cada punto representa el recuento de microARN asignado según el millón (RPM) para cada microARN individual. Haga clic aquí para ver una versión más grande de esta figura.

Cartilla Secuencia
3' vinculador 1 rAppCTGTAGGCACCATCAAT–NH2
marcador de menor tamaño rArurcrcrcrarurGrcrcrgrurArArCrurArGGTAACCGCATCATGCGTC
marcador de tamaño superior rArArArurcrargrcrgrgrurGrcrarurGrarararcrgrurArcrarurarggGTAACCGCATCATGCGTC
código de barras1 /5AmMC6/ACGCTCTTCCGATCTrArGrCrG
código de barras2 /5AmMC6/ACGCTCTTCCGATCTrCrGrUrC
código de barras3 /5AmMC6/ACGCTCTTCCGATCTrCrUrGrG
código de barras4 /5AmMC6/ACGCTCTTCCGATCTrArCrurU
código de barras5 /5AmMC6/ACGCTCTTCCGATCTrGrGrGrU
código de barras6 /5AmMC6/ACGCTCTTCCGATCTrGrUrUrA
código de barras7 /5AmMC6/ACGCTCTTCCGATCTrUrArurG
código de barras8 /5AmMC6/ACGCTCTTCCGATCTrUrCrGrC
código de barras9 /5AmMC6/ACGCTCTTCCGATCTrGrCrarG
código de barras10 /5AmMC6/ACGCTCTTCCGATCTrArurArC
código de barras11 /5AmMC6/ACGCTCTTCCGATCTrUrUrCrU
código de barras12 /5AmMC6/ACGCTCTTCCGATCTrCrArArU
código de barras13 /5AmMC6/ACGCTCTTCCGATCTrArarGrA
código de barras14 /5AmMC6/ACGCTCTTCCGATCTrUrGrArArA
código de barras15 /5AmMC6/ACGCTCTTCCGATCTrGrGrGrG
código de barras16 /5AmMC6/ACGCTCTTCCGATCTrArurUrG
código de barras17 /5AmMC6/ACGCTCTTCCGATCTrUrCrArU
código de barras18 /5AmMC6/ACGCTCTTCCGATCTrGrUrArU
Imprimación RT ATTGATGGTGCCTACAG
Imprimación PCR F AATGATACGGCGACCACCACCGAGATCTCCTTTCCCTCCCCCCCTTCCGGATCT
PCR primer R CAAGCAGAAGAAGACGGCATACTCTTCCGATECTTTGATGGTGCCTACAG

Tabla 1. Lista de imprimaciones.

Tabla suplementaria 1. Lista de secuencias de códigos de barras. Haga clic aquí para descargar este archivo.

Tabla suplementaria 2. Lista curada de secuencias precursoras de microARN de ratón. Haga clic aquí para descargar este archivo.

Tabla suplementaria 3. Lista curada de secuencias precursoras de microARN humano. Haga clic aquí para descargar este archivo.

Tabla suplementaria 4. Cuenta la lectura de microRNA sin procesar y normalizada. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

A pesar de la identificación de microARN hace más de 20 años13, el proceso de secuenciación de microARN sigue siendo laborioso y requiere equipos especializados, impidiendo a los laboratorios adoptar rutinariamente protocolos internos14. Otras técnicas pueden evaluar simultáneamente los microARN, como microarrays de microARN y paneles de expresión multiplexados; sin embargo, estos enfoques son limitados en el que sólo cuantifican los microRNAs presentes en su conjunto de sondas. Debido a esto, se pierden características importantes de la secuenciación de ARN pequeño, como la identificación de nuevos microARN, y de microRNA isoformas - cambios de nucleósidos que pueden tener función biológica importante6,7,15 .

Al iniciar un nuevo experimento, el uso de un proveedor comercial suele ser más fácil porque ofrecen soporte técnico y facilidad de uso. Hay varias opciones comerciales disponibles para la secuenciación de microARN, que se pueden multiplexar para reducir la carga de trabajo al procesar grandes cantidades (>100) de muestras. Estos kits comerciales se están mejorando continuamente, lo que es a la vez una ventaja y una desventaja. Por un lado, las empresas que fabrican estos kits han desarrollado nuevos métodos de captura de microARN, por ejemplo, a través de la circularización de sus 5 y 3 extremos antes de la secuenciación o el uso de eslabones degenerados con secuencias aleatorias en cada extremo para reducir el sesgo de ligación. También han desarrollado métodos para eliminar los atenuadores de adaptadores, por ejemplo, mediante la ligadura de adaptadores de doble cadena o la hibridación de oligonucleótidos complementarios. Por otro lado, los kits comerciales recomiendan no modificar o alterar cualquier paso. Por lo tanto, si se realizan actualizaciones en un kit, es difícil o imposible comparar los datos derivados de versiones antiguas y nuevas de kits, así como los datos derivados de kits de diferentes proveedores comerciales. Aquí, hemos descrito un protocolo que tiene poder de permanencia frente a alternativas comerciales. Nuestro enfoque en los pasos de purificación de gel - mientras añaden tiempo al protocolo - permite la captura y reproducibilidad constante de microARN durante los muchos años que lo hemos utilizado. Se han realizado varias evaluaciones de la reproducibilidad entre los kits comerciales y los protocolos internos, y remitimos al lector a algunos de estos estudios16,17,18,19. Es importante destacar que los pasos que delineamos para el análisis bioinformático de los microARN se pueden emplear independientemente de la elección del kit o protocolo interno.

La secuenciación de microRNA a menudo se ve preocupada por la elección de códigos de barras: en algunos casos, la eficiencia de ligadura de los distintos códigos de barras puede no ser equivalente, lo que conduce a distribuciones sesgadas de secuencias en las muestras20. Ahora se recomienda utilizar bases degeneradas en los extremos 5 y 3 para minimizar los sesgos de ligadura de microRNAs21,22. En este protocolo, no hemos observado estos problemas de ligadura y hemos observado lecturas consistentes para réplicas técnicas y biológicas evaluadas con diferentes códigos de barras5,6,7,23, pero es importante ser consciente de ellos. Los métodos para evitar el sesgo de ligadura incluyen la incorporación de imprimaciones de índice en las imprimaciones PCR, o para añadir uno o más nucleósidos de ARN aleatorios en el extremo 3 de la secuencia del adaptador 5 (Tabla1). La introducción de uno o más ARN sintéticos, como el microARN24 C. elegans miR-39, también es una opción para fines de normalización, lo que es crítico para situaciones de bajo rendimiento, como la cuantificación de microARN a partir de exosomas. Del mismo modo, para la ligadura de ARN, hemos utilizado con éxito la ligadosa de ARN T4 1, pero la ligadura con menos sesgo se ha demostrado para una forma truncada de t4 ARN ligase 225. Por último, los Superscripts III y IV son enzimas alternativas de transcripción inversa que hemos utilizado sin problema.

La elección de la base de datos de microARN también puede influir en los resultados normalizados finales. Un desafío con la curación de bases de datos de microARN es que varios ARN pequeños nuevos enumerados como microARN son en realidad fragmentos de elementos repetidos y no microRNAs de buena fe 2. Se han hecho esfuerzos para retirar los microARN que no se ajustan a criterios estándar, de modo que la próxima versión de una base de datos de microARN sea más refinada; sin embargo, la siguiente iteración también contiene nuevos candidatos que necesitan confirmación. Cuando los microARN derivados de repetición se incluyen en las alineaciones, pueden sesgar los resultados y abrumar los datos de los microRNAs existentes. Por lo tanto, el uso de conjuntos de datos bien curados de microARN de diferentes especies es esencial26,27. Hemos experimentado la mayor reproducibilidad al alinear lecturas de secuenciación de ARN pequeñas con listas seleccionadas de microARN conservados y hemos incluido estas horquillas en la Tabla Suplementaria 2 y la Tabla Suplementaria3. Estas listas coinciden con las estimaciones de unos 500 microARN de alta confianza en el genoma humano2,26.

Como con cualquier técnica, los resultados deben confirmarse con un enfoque ortogonal. Hemos reproducido con éxito pequeños resultados de secuenciación de ARN con pequeñas manchas de ARN norte queincorporan sondas radioetiquetadas para confirmar el tamaño y la abundancia relativa de microRNAs candidatos 6,7,23. El PCR cuantitativo de los microRNAs mediante la secuenciación de lectura dividida y la confirmación de los cambios de ARNm de destino mediante qPCR y la hincha occidental son otras opciones de validación.

En resumen, hemos proporcionado un método para aislar y secuenciar microARN y realizar alineaciones con bases de datos de microARN existentes. La asequibilidad de los reactivos y equipos y el uso de herramientas de código abierto para el análisis deben hacer que este protocolo sea accesible para cualquier persona. Por último, este protocolo se puede utilizar en cualquier tejido o línea celular para producir lecturas altamente reproducibles y de alta calidad.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

Nos gustaría dar las gracias a los miembros de los laboratorios de Andrew Fire y Mark Kay por su orientación y sugerencias.

Materials

Name Company Catalog Number Comments
100 bp DNA ladder NEB N3231
19:1 bis-acrylamide Millipore Sigma A9926
25 bp DNA step ladder Promega G4511
Acid phenol/chloroform ThermoFisher AM9720
Acrylamide RNA loading dye ThermoFisher R0641
Ammonium persulfate (APS) Biorad 161-0700
Bioanalyzer instrument Agilent G2991AA For assessing RNA quality and concentration
Chloroform Fisher Scientific C298-500
Ethanol (100%) Sigma E7023
Gel Loading Buffer II ThermoFisher AM8547
GlycoBlue ThermoFisher AM9516 Blue color helps in visualizing pellet
HCl Sigma 320331
KOH Sigma P5958
Maxi Vertical Gel Box 20 x 20cm Genesee 45-109
miRVana microRNA isolation kit ThermoFisher AM1560
miSeq system Illumina SY-410-1003 For generating small RNA sequencing data
NaCl Fisher Scientific S271-500
Nusieve low-melting agarose Lonza 50081
Parafilm (laboratory sealing film) Millipore Sigma P7793
Poly-ethylene glycol 8000 NEB included with M0204
ProtoScript II First strand cDNA Synthesis Kit NEB E6560S
QIAquick Gel Extraction kit Qiagen 28704
Qubit Fluorometer ThermoFisher Q33226 For quantifying DNA concentration
Qubit RNA HS Assay kit ThermoFisher Q32855
Razor Blades Fisher Scientific 12640
Siliconized Low-Retention 1.5 ml tubes Fisher Scientific 02-681-331
T4 RNA ligase 1 NEB M0204
T4 RNA Ligase 2, truncated K227Q NEB M0351S
TapeStation Agilent G2939BA For assessing RNA quality and concentration
Taq DNA Polymerase NEB M0273X
TEMED Biorad 161-0800
Tris Base pH 7.5 Sigma 10708976001
Tris-buffered EDTA Sigma T9285
Trizol ThermoFisher 15596026
UltraPure Ethidium bromide (10 mg/ml) Invitrogen 15585-011
Universal miRNA cloning linker NEB S1315S
Urea Sigma U5378

DOWNLOAD MATERIALS LIST

References

  1. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  2. Bartel, D. P. Metazoan MicroRNAs. Cell. 173 (1), 20-51 (2018).
  3. Lau, N. C., Lim, L. P., Weinstein, E. G., Bartel, D. P. An abundant class of tiny RNAs with probable regulatory roles in Caenorhabditis elegans. Science. 294 (5543), 858-862 (2001).
  4. Kim, V. N., Han, J., Siomi, M. C. Biogenesis of small RNAs in animals. Nature Reviews Molecular Cell Biology. 10 (2), 126-139 (2009).
  5. Gu, S., et al. The loop position of shRNAs and pre-miRNAs is critical for the accuracy of dicer processing in vivo. Cell. 151 (4), 900-911 (2012).
  6. Valdmanis, P. N., et al. RNA interference-induced hepatotoxicity results from loss of the first synthesized isoform of microRNA-122 in mice. Nature Medicine. 22 (5), 557-562 (2016).
  7. Valdmanis, P. N., et al. miR-122 removal in the liver activates imprinted microRNAs and enables more effective microRNA-mediated gene repression. Nature Communications. 9 (1), 5321 (2018).
  8. Griffiths-Jones, S. The microRNA Registry. Nucleic Acids Research. 32, D109-D111 (2004).
  9. Griffiths-Jones, S., Grocock, R. J., van Dongen, S., Bateman, A., Enright, A. J. miRBase: microRNA sequences, targets and gene nomenclature. Nucleic Acids Research. 34 (Database issue), D140-D144 (2006).
  10. Griffiths-Jones, S., Saini, H. K., van Dongen, S., Enright, A. J. miRBase: tools for microRNA genomics. Nucleic Acids Research. 36 (Database issue), D154-D158 (2008).
  11. Patro, R., Mount, S. M., Kingsford, C. Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms. Nature Biotechnology. 32 (5), 462-464 (2014).
  12. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  13. Fire, A., et al. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature. 391 (6669), 806-811 (1998).
  14. Etheridge, A., Wang, K., Baxter, D., Galas, D. Preparation of Small RNA NGS Libraries from Biofluids. Methods in Molecular Biology. 1740, 163-175 (2018).
  15. Yamane, D., et al. Differential hepatitis C virus RNA target site selection and host factor activities of naturally occurring miR-122 3 variants. Nucleic Acids Research. 45 (8), 4743-4755 (2017).
  16. Giraldez, M. D., et al. Comprehensive multi-center assessment of small RNA-seq methods for quantitative miRNA profiling. Nature Biotechnology. 36 (8), 746-757 (2018).
  17. Dard-Dascot, C., et al. Systematic comparison of small RNA library preparation protocols for next-generation sequencing. BMC Genomics. 19 (1), 118 (2018).
  18. Yeri, A., et al. Evaluation of commercially available small RNASeq library preparation kits using low input RNA. BMC Genomics. 19 (1), 331 (2018).
  19. Coenen-Stass, A. M. L., et al. Evaluation of methodologies for microRNA biomarker detection by next generation sequencing. RNA Biology. 15 (8), 1133-1145 (2018).
  20. Baran-Gale, J., et al. Addressing Bias in Small RNA Library Preparation for Sequencing: A New Protocol Recovers MicroRNAs that Evade Capture by Current Methods. Frontiers in Genetics. 6, 352 (2015).
  21. Jayaprakash, A. D., Jabado, O., Brown, B. D., Sachidanandam, R. Identification and remediation of biases in the activity of RNA ligases in small-RNA deep sequencing. Nucleic Acids Research. 39 (21), e141 (2011).
  22. Van Nieuwerburgh, F., et al. Quantitative bias in Illumina TruSeq and a novel post amplification barcoding strategy for multiplexed DNA and small RNA deep sequencing. PLoS One. 6 (10), e26969 (2011).
  23. Valdmanis, P. N., et al. Upregulation of the microRNA cluster at the Dlk1-Dio3 locus in lung adenocarcinoma. Oncogene. 34 (1), 94-103 (2015).
  24. Schwarzenbach, H., da Silva, A. M., Calin, G., Pantel, K. Data Normalization Strategies for MicroRNA Quantification. Clinical Chemistry. 61 (11), 1333-1342 (2015).
  25. Viollet, S., Fuchs, R. T., Munafo, D. B., Zhuang, F., Robb, G. B. T4 RNA ligase 2 truncated active site mutants: improved tools for RNA analysis. BMC Biotechnology. 11, 72 (2011).
  26. Chiang, H. R., et al. Mammalian microRNAs: experimental evaluation of novel and previously annotated genes. Genes & Development. 24 (10), 992-1009 (2010).
  27. Fromm, B., et al. A Uniform System for the Annotation of Vertebrate microRNA Genes and the Evolution of the Human microRNAome. Annual Review of Genetics. 49, 213-242 (2015).

Tags

Genética Número 150 microARN ARN pequeños secuenciación de alto rendimiento bioinformática preparación de bibliotecas alineación de secuencias
Una tubería completa para aislar y secuenciar microRNAs, y analizarlos mediante herramientas de código abierto
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Course, M. M., Gudsnuk, K.,More

Course, M. M., Gudsnuk, K., Valdmanis, P. N. A Complete Pipeline for Isolating and Sequencing MicroRNAs, and Analyzing Them Using Open Source Tools. J. Vis. Exp. (150), e59901, doi:10.3791/59901 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter