Waiting
Procesando inicio de sesión ...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Un pipeline complet pour isoler et séquencer les microARN et les analyser à l'aide d'outils Open Source

Published: August 21, 2019 doi: 10.3791/59901

Summary

Ici, nous décrivons une stratégie étape par étape pour isoler les petits ARN, enrichir les microARN et préparer des échantillons pour le séquençage à haut débit. Nous décrivons ensuite comment traiter les lectures de séquences et les aligner sur les microARN, à l'aide d'outils open source.

Abstract

On pense que la moitié de toutes les transcriptions humaines sont réglementées par des microARN. Par conséquent, la quantification de l'expression des microARN peut révéler des mécanismes sous-jacents dans les états de la maladie et fournir des cibles thérapeutiques et des biomarqueurs. Ici, nous détaillons comment quantifier avec précision les microARN. En bref, cette méthode décrit l'isolation des microARN, leur ligature à des adaptateurs adaptés au séquençage à haut débit, amplifiant les produits finaux et préparant une bibliothèque d'échantillons. Ensuite, nous expliquons comment aligner les lectures de séquençage obtenues sur les épingles à cheveux microARN, et quantifier, normaliser et calculer leur expression différentielle. Polyvalente et robuste, cette analyse combinée du flux de travail expérimental et de la bioinformatique permet aux utilisateurs de commencer par l'extraction des tissus et de terminer avec la quantification des microARN.

Introduction

Découverte pour la première fois en 19931, on estime aujourd'hui que près de 2000 microARN sont présents dans le génome humain2. Les microARN sont de petits ARN non codants qui sont généralement 21-24 nucléotides de long. Ils sont des régulateurs post-transcriptionnels de l'expression génique, souvent liés à des sites complémentaires dans la région 3 non traduites (3-UTR) des gènes cibles pour réprimer l'expression des protéines et dégrader l'ARNm. La quantification des microARN peut donner un aperçu précieux de l'expression des gènes et plusieurs protocoles ont été développés à cette fin3.

Nous avons développé un protocole défini, reproductible et de longue date pour le séquençage de l'ARN, et pour l'analyse des lectures normalisées à l'aide d'outils de bioinformatique open source. Fait important, notre protocole permet l'identification simultanée des microARN endogènes et des constructions exogènes livrées qui produisent des espèces de forme microARN, tout en minimisant les lectures de cette carte à d'autres petites espèces d'ARN, y compris les ARN ribosomal ( rRNAs), transférer les petits ARN dérivés de l'ARN (tsRNAs), les petits ARN dérivés de la répétition et les produits de dégradation de l'ARNm. Heureusement, les microARN sont 5 phosphorylés et 2-3 hydroxylé4 , une caractéristique qui peut être exploitée pour les séparer de ces autres petits ARN et les produits de dégradation de l'ARNm. Plusieurs options commerciales existent pour le clonage et le séquençage de microARN qui sont souvent plus rapides et plus faciles au multiplex ; cependant, la nature exclusive des réactifs de kit et leurs modifications fréquentes rendent difficile la comparaison des exécutions d'échantillon. Notre stratégie optimise la collecte de la taille correcte des microARN par des étapes de purification de l'acrylamide et du gel d'agarose. Dans ce protocole, nous décrivons également une procédure pour aligner la séquence se lit aux microARN à l'aide d'outils open source. Cet ensemble d'instructions sera particulièrement utile pour les utilisateurs d'informatique novices, que notre méthode de préparation de bibliothèque ou une méthode commerciale soit utilisée.

Ce protocole a été utilisé dans plusieurs études publiées. Par exemple, il a été utilisé pour identifier le mécanisme par lequel l'enzyme Dicer fend de petits ARN en épingle à cheveux à une distance de deux nucléotides de la boucle interne de la structure de la boucle de tige - la soi-disant "règle de comptage de boucle"5. Nous avons également suivi ces méthodes pour identifier l'abondance relative des petits ARN en épingle à cheveux livrés (ardendain) exprimés à partir de vecteurs viraux adéno-associés recombinants (rAAV), afin d'identifier le seuil d'expression de l'ARNc qui peut être toléré avant le foie toxicité associée à l'expression shRNA excessive6. En utilisant ce protocole, nous avons également identifié des microARN dans le foie qui répondent à l'absence de microARN-122 - un microARN hépatique très exprimé - tout en caractérisant le modèle de dégradation de ce microARN7. Parce que nous avons utilisé notre protocole de façon cohérente dans de nombreuses expériences, nous avons été en mesure d'observer les préparations d'échantillons longitudinalement, et de voir qu'il n'y a pas d'effets de lots perceptibles.

En partageant ce protocole, notre objectif est de permettre aux utilisateurs de générer une quantification reproductible et de haute qualité des microARN dans pratiquement n'importe quelle ligne de tissus ou de cellules, en utilisant des équipements et des réactifs abordables, et des outils de bioinformatique gratuits.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Les expériences sur les animaux ont été autorisées par le Comité institutionnel de soins et d'utilisation des animaux de l'Université de Washington.

Préparation de la petite bibliothèque d'ARN

1. Isolation de l'ARN

  1. Isolez l'ARN d'une source biologique à l'aide d'un réactif d'isolement standard de l'ARN, ou d'un kit qui enrichit les microARN. Pour les tissus, il est préférable de commencer par des échantillons congelés dans de l'azote liquide et broyés en poudre à l'aide d'un mortier et d'un pilon préréfrigérés.
  2. Mesurer l'intégrité de l'ARN de chaque échantillon sur un instrument qui peut quantifier l'ARN et fournir un numéro d'intégrité de l'ARN (RIN). Les RIN devraient être le plus grand.7.

2. 3' ligation adaptateur

  1. Préparer une réaction de ligature dans des tubes à bande PCR, en combinant : 11 l d'ARN (1-3 g, en utilisant la même quantité pour chaque échantillon), 1,5 l de 10x T4 ARN ligase réaction tampon, SANS ATP, 1 L de poly-éthylène glycol (PEG), et 0,5 L de 3'-linker (100 M Universal miRNA cloning lin ker).
    REMARQUE : L'absence d'ATP aide à enrichir les miARN et minimise le clonage des produits de dégradation de l'ARNm. PEG agit comme un agent de surpeuplement moléculaire, améliorant la ligature réussie. Le lien de clonage de miARN universel a un groupe de blocage de 3' (amine) pour empêcher l'auto-ligation, la circularisation, et la ligature à l'ARN à la fin de 5'.
  2. Chauffer les échantillons à 95 oC sur un thermocycler pendant 30-40 s. Refroidir sur la glace pendant 1 min. Ajouter 1 l de ligase d'ARN T4 2 et couver à température ambiante pendant 2 h. Préparer le gel (étape 2,3) pendant que les échantillons couvent.
    REMARQUE : L'incubation à température ambiante aide à prévenir la ligature linker-linker. Nous avons également utilisé avec succès T4 RNA ligase 1.
  3. Préparer 30 ml d'un gel polyacrylamide de 15 % avec 8 M d'urée (pour un gel de 20x20 cm) : 14,4 g d'urée, 3 mL d'acide éthylènediaminetetratacetic (TBE) tamponné Tris, 11,2 mL de 40 % 19:1 acrylamide et H2O à 30 mL. La solution est mieux dissoute à 42 oC. Immédiatement avant la coulée, ajouter 150 L de 10% de persulfate d'ammonium (APS) et 30 oL de téramethylènediamine (TEMED) pour la polymérisation.
  4. Verser entre 0,8 mm de plaques de verre séparées dans un plâtre en plastique et insérer le peigne. Une fois le gel solidifié (environ 20 min), ajouter 0,5x TBE au réservoir et laver les puits d'urée résiduelle en pipetting vigoureusement.
  5. Pré-exécuter le gel à une constante 375 V pendant 25 min sans échantillons afin que l'urée peut entrer dans le gel, puis laver les puits à nouveau.
    REMARQUE : La quantité de tension peut devoir être réduite en fonction du type d'alimentation électrique et du système d'électrophorèse qui est utilisé.
  6. Une fois les échantillons terminés, ajouter 15 lde de colorant de chargement d'acrylamide aux échantillons (pour un rapport de 1:1), puis dénaturer pendant 5 min à 95 oC sur un thermocycleur.
  7. Préparer 25 ng/L de marqueurs de taille 37 et 44 bp, dilués à l'eau teintée de chargement d'acrylamide d'une partie. Les séquences sont énumérées dans le tableau 1.
  8. Chargez les échantillons sur le gel de polyacrylamide, laissant au moins une voie entre chaque échantillon. Chargez 20 L d'au moins deux ensembles de marqueurs, dans un modèle asymétrique pour garder une trace de l'orientation du gel.
  9. Exécuter le gel à une constante 375 V pour les 15 premières minutes, puis augmenter à une constante 425 V pour la course restante. Courir jusqu'à ce que le bleu bromophenol est d'environ 1-4 cm du fond, ce qui prend environ 2 h.
    REMARQUE: Si nécessaire, le gel peut être exécuté à une tension constante plus faible pendant une plus longue période de temps jusqu'à ce que le bleu bromophénol est d'environ 1-4 cm du fond.
  10. Retirer le gel des plaques de verre à l'aide d'un séparateur de plaque, et placer le gel sur un protecteur de page en plastique. Diluer 5 l de bromure d'éhidium dans 500 l'eau distillée, et pipette sur des voies de marqueur juste au-dessus du marqueur bleu clair supérieur (voir figure 1A).
    CAUTION: Utilisez des gants pour le bromure d'éhidium et éliminer les déchets conformément à la réglementation locale. Laisser s'asseoir pendant 5 min.
  11. Sous la lumière ultraviolette (UV), couper les gels du marqueur supérieur à inférieur dans chaque voie à l'aide d'une lame de rasoir propre (voir la figure 1A). Transférer dans un carré de 4 x 4 cm de film d'étanchéité en laboratoire, puis couper le gel avec environ 4 coupes horizontalement et 3 verticalement pour produire 12 petits carrés (voir Figure 1B).
  12. Pipette 400 'L de 0.3 M NaCl sur le carré de film d'étanchéité, et les morceaux de gel d'entonnoir dans 1.5 mL de tubes siliconés (voir figure 1C). Agiter les échantillons sur un écrou à 4 oC pendant la nuit.
    REMARQUE : D'autres tubes de 1,5 mL à faible rétention peuvent être remplacés par des tubes siliconés.
  13. Après au moins 12 h d'agitation à 4 oC, récupérez les échantillons et mettez-les sur la glace, ainsi qu'un tube conique de 100 % d'éthanol.
  14. Transférer 400 l de supernatant dans un nouveau tube, puis ajouter 1 ml d'éthanol à 100 % et 1 l de 15 mg/mL de glycogène coprécipitant. Assurez-vous de recueillir autant de supernatant s'enlisser que possible, en tournant vers le bas à 4 oC et en pipetting plus que nécessaire. Placer à -80 oC pendant 1 h, ou à -20 oC pendant 2 h ou plus. Le coprécipitant de glycogène améliore la visibilité et la récupération des granulés.
  15. Faire tourner à 4 oC à 17 000 x g pendant 20 à 30 min. Enlever toutes les traces d'éthanol et laisser sécher l'air des granulés pendant 5 min.

3. 5' ligation de liaison

  1. Suspendre à nouveau le granule par tuyauterie dans 6,5 l d'eau exempte de nucléane. Laisser le granule s'asseoir dans l'eau pendant quelques minutes d'abord aidera à la re-suspension.
  2. Après avoir filé le granule et le ressurage dans l'eau, ajouter 0,5 L de 100 M 5'-linker (avec codes-barres; voir tableau 1), 1 'L de tampon de ligase d'ARN T4, 1 'L de 10 mM ATP, et 1 'L de PEG. Chauffer à 90 oC pendant 30 s, puis placer sur la glace. Ajouter 1 l de ligase d'ARN T4 1 et laisser incuber à température ambiante pendant 2 h.
  3. Ajouter 400 L de 0,3 M NaCl, suivi de 400 l de phénol/chloroforme acide. Vortex 30 s - 1 min (la solution aura l'air trouble), puis tourner à 4 oC pendant 10-15 min à vitesse maximale dans un microcentrifugeur (17 000 x g). Dessinez la couche supérieure et placez-la dans un nouveau tube de 1,5 ml.
    REMARQUE : Évitez de pipetage l'une des couches inférieures.
  4. Ajouter 350 l de chloroforme, vortex brièvement, puis tourner à 4 oC pendant 10 min à vitesse maximale (17 000 x g). Dessinez le dessus plus tard et placez-le dans un nouveau tube de 1,5 ml. Ajouter 1,5 l de coprécipitant de glycogène et 1 ml d'éthanol à 100 %.
    REMARQUE: Encore une fois, éviter pipetting l'une des couches inférieures.
  5. Vortex brièvement, puis placer à -80 oC pendant au moins 1 h, ou -20 oC pendant la nuit.

4. Transcription inversée (RT)

  1. Allumez le bloc de chaleur de 42 oC. Faire tourner les échantillons à 4 oC et 17 000 x g pendant 20 à 30 min. Retirez tout le supernatant et laissez sécher l'air des granulés pendant 5 min.
  2. Suspendre à nouveau l'échantillon de granulés dans 8,25 l d'eau exempte de nucléane, puis ajouter : 0,5 L de 100 'M RT amorce (tableau 1), et 5 'L de 2x RT Reaction Mix à partir d'un kit de synthèse de l'ADNc. Incuber à 42 oC pendant 3 min.
  3. Ajouter 1,5 l d'enzyme de 10 x 10 x RT à chaque échantillon et incuber à 42 oC pendant 30 min dans un thermocycleur. Placer à -20 oC ou continuer avec l'hydrolyse et la neutralisation.
    REMARQUE : Plusieurs kits RT peuvent être utilisés pour les étapes 4.2 et 4.3.
  4. Effectuer l'hydrolyse alcaline et la neutralisation : Faire 1 ml de 150 ml d'hydroxyde de potassium (KOH) solution (150 oL de 1 M KOH, 20 oL de 1 M Tris Base pH 7,5, et 830 oL de H2O) et 1 ml de 150 mM d'acide chlorhydrique (HCl) (150 l de 1 M HL ll et 850 l de H2O).
  5. Avant d'ajouter aux échantillons, déterminez la quantité de HCl nécessaire pour neutraliser la solution KOH. En général, environ 20-24 L de HCl neutraliseront les 25 'L de KOH. Vérifiez la combinaison sur une bande de pH pour vous assurer qu'elle se trouve dans la bonne plage (pH 7,0 à 9,5).
  6. Hydrolyser les échantillons en ajoutant 25 l de 150 mM de solution KOH et incuber pendant 10 min à 95 oC.
  7. Neutraliser les échantillons en ajoutant la quantité de 150 mM HCl déterminée à l'étape 4.4, pour obtenir un pH final de l'échantillon entre 7,0 et 9,5.

5. Amplification de PCR

  1. Après la neutralisation, préparer une réaction PCR avec : 29,5 L d'eau, 5 l de tampon Taq 10x, 1 L de dNTP, 2 L de 25 'M amorce avant (tableau 1), 2 'L de 25 'M amorce inverse (tableau 1), 0,5 'L de Taq, et 10 'L de l'adéquation transctigraphique inversée à partir de l'étape 4.6 .
  2. Exécuter la réaction PCR suivante : 94 oC pendant 2 min, puis 20 cycles de 94 oC pour 45 s, 50 oC pour 75 s et 72 oC pour 60 s.
  3. Exécuter une deuxième réaction PCR d'environ 2-4 cycles de plus en utilisant 5 L de produit à partir de l'étape 5.2. Mélange : 34,8 L d'eau, 5 l de tampon Taq 10x, 1 l de dNTP, 1 l d'apprêt avant de 25 M (tableau 1), 1 l de 25 'M amorce inversée (tableau 1), et 0,2 l de polymère Taq. Suivez les mêmes paramètres thermocycleurs décrits à l'étape 5.2.
    REMARQUE : Le but de faire deux réactions PCR - avec la première pour 20 cycles et la seconde pour seulement 2-4 de plus - est de s'assurer que la quantité de cDNA amplifiée est dans une plage dynamique (c.-à-d., pas une quantité saturée).

6. Purification de gel d'Agarose

  1. Préparer un gel d'agarose à 4 % avec de l'agarose à faible fusion. Chargez 40 L ou plus du produit PCR sur le gel, avec le colorant de chargement. Chargez 100 bp et 25 marqueurs de taille de bp.
    REMARQUE : L'échelle de 25 pb aide à distinguer le produit amplifié des produits de ligature linker-linker. Les gels d'agarose à faible fusion doivent être coulés avec plus de soin que les gels agarose traditionnels, afin de suivre de près les instructions du fabricant.
  2. Pour l'extraction du gel, sélectionnez le numéro de cycle visible sur le gel mais qui n'est pas saturé (généralement des cycles de 22 à 24 cycles). Choisissez des bandes d'intensité similaires lors de l'exécution de plusieurs échantillons.
  3. Couper la bande qui est au-dessus de la bande de 125 pb (la bande plus foncée sur l'échelle de 25 pb; voir Figure 1D). À l'aide d'un kit d'extraction de gel, suivez les instructions du fabricant pour ajouter un tampon à base d'un gel de 4 %, puis secouez pour dissoudre l'agarose dans un tampon à température ambiante.
    REMARQUE : La dissolution à 55 oC augmente le potentiel de ligature linker-linker.
  4. Suivez les instructions d'extraction de gel du fabricant et elute dans 30 L de tampon d'élution ou d'eau. Si le produit semblait faible sur le gel, puis réduire l'élution à 20 L.
  5. Mesurer la concentration d'ADNc à l'aide d'une technique sensible et préparer la bibliothèque d'échantillons pour le séquençage. La préparation dépendra du type de séquençage utilisé.
    REMARQUE : Les exigences minimales pour une bibliothèque de séquençage sont généralement un volume de 10 Livres de 10 M. Si les concentrations sont trop faibles, la piscine et l'éthanol précipitent les échantillons pour amener la bibliothèque à la concentration désirée.
  6. Séquencez les échantillons à l'aide de l'équipement disponible. Un exemple courant serait d'exécuter des échantillons à l'aide d'un kit pour 50 bp lectures uniques, pour obtenir environ 15-25 millions de lectures dans un format de sortie FASTQ.

Petit alignement de séquence d'ARN et bioinformatique

7. Téléchargement de données

  1. Téléchargez les fichiers FASTQ générés à partir de chaque séquence. Téléchargez une liste de séquences d'épingles à cheveux microARN de miRbase.org8,9,10.
  2. Générez un compte Galaxy à www.usegalaxy.org et téléchargez un fichier FASTQ de séquences sur ce compte.
  3. Téléchargez un fichier texte de séquences de codes à barres sur le compte Galaxy, tels que barcodes.txt, qui est disponible sous forme de fichier texte (tableausupplémentaire 1).
  4. Téléchargez un fichier FASTA d'épingles à cheveux microARN sur le compte Galaxy à partir d'une base de données comme miRBase.org. Des exemples de précurseurs de microARN de souris (mousehairpins.fa) ou humains (humanhairpins.fa) sont fournis dans le tableau 2 et le tableau supplémentaire 3.

8. Suppression d'adaptateur, tri de code à barres, et garniture

  1. Dans l'onglet gauche, naviguez vers la manipulation de fichiers génomiques 'gt; FASTA/FASTQ 'gt; séquencesd'adaptateur clip .
  2. Dans le fichier Input en format FASTA ou FASTQ,entrez le fichier FASTQ à partir de la liste de déroulant. Changer la longueur minimale de séquence à 18. Modifier la source pour entrer la séquence personnalisée. Entrez CTGTAGGC. Conservez tous les autres paramètres par défaut. Cliquez sur Exécuter.
    REMARQUE : Les lectures de séquence séche de moins de 18 nucléotides sont difficiles à cartographier uniquement aux microARN et contiennent de nombreux produits de dégradation.
  3. Dans l'onglet gauche, naviguer vers la manipulation de fichiers génomiques 'gt; FASTA/FASTQ 'gt; Barcode Splitter.
    REMARQUE : Les fonctions et les en-têtes de la galaxie sont mis à jour périodiquement, de sorte que la fonction de recherche peut être nécessaire pour trouver un outil équivalent ou son emplacement. Les kits commerciaux utilisant des amorces indexées sont souvent déjà triés par code-barres. Par conséquent, cette étape et l'étape de garniture de code à barres ne sont pas nécessaires si à partir d'un kit commercial.
  4. Pour les codes-barres àutiliser, pointez vers barcodes.txt. Pour que la bibliothèque sedivise, utilisez Clip sur le fichier de données produit dans l'étape précédente. Dans Nombre d'inadéquations autorisées, entrez 1. Cliquez sur Exécuter.
  5. Couper les 4 premiers nucléotides: naviguer vers text Manipulations 'gt; Trim personnages principaux ou à la traîne. Pour le jeu de données Input, cliquez sur l'icône du dossier, qui est une collection de données. Sélectionnez le fichier par lots d'échantillons, qui inclut l'étiquette Barcode splitter surles données . Dans Trim du début jusqu'à cetteposition, entrez 5. Dans Le jeu de données d'entrée en format FASTQ? entrez Oui. Cliquez sur Exécuter. L'exécution peut prendre plusieurs minutes.

9. Alignement des lectures aux microARN

  1. Dans Galaxy, naviguer à l'analyse de génomique 'gt; ARN-Seq 'gt; Sailfish transcript quantification11.
  2. Pour la question Sélectionnez un transcriptome de référence de votre historique ou utilisez un index intégré? sélectionnez Utilisez-en un de l'historique. Entrez le fichier téléchargé mousehairpins.fa de la liste déroulante. Dans le fichier FASTA/Q, cliquez sur l'icône du dossier pour utiliser une collection de jeu de données et sélectionnez le fichier qui inclut Trim sur la collecte. Cliquez sur Exécuter. L'exécution peut prendre plusieurs minutes.
  3. Dans l'onglet histoire sur la droite, cliquez sur Sailfish sur la collection ... qui est une liste avec 19 articles. Cliquez sur chaque fichier individuel et cliquez sur l'icône du disque pour enregistrer sur l'ordinateur local. Les fichiers téléchargés individuellement doivent d'abord être non compressés. Ils peuvent également avoir besoin d'être re-sauvés avec une extension .txt dans le but d'importer dans une feuille de calcul.
  4. Ouvrez chaque fichier de tableur et renommez la colonne NumReads à la condition de traitement. Fusionnez les colonnes ensemble pour générer une matrice de microARN dans la première colonne et lisez les comptes par condition dans les colonnes suivantes.
  5. Pour calculer les microARN exprimés différemment pour chaque condition de traitement, utilisez le fichier avec des comptes de lecture microARN bruts comme entrée pour des programmes tels que DESeq212. DESeq2 est présent dans Galaxy dans l'analyse de génomique 'gt; ARN-seq 'gt; onglet DESeq2.
  6. Convertir les lectures brutes en comptes de lecture de microARN normalisés. Les comptes sont normalisés à la profondeur de la séquence de la bibliothèque de la bibliothèque par le calcul suivant : [(lectures brutes/lectures microARN totales) (1 000 000 - nombre de microARN comptés) - 1].
    REMARQUE : Ce calcul fournit une lecture normalisée par million (RPM) de microARN cartographiés qui peuvent être comparés entre les ensembles de données et les conditions biologiques. La sortie est un fichier délimité onglet. Sailfish fournit une colonne de sortie tpm, bien que cette valeur soit normalisée par la longueur d'épingle à cheveux de microARN, qui n'est pas nécessaire dans ce contexte.
  7. Le cas échéant, répétez l'alignement avec les séquences d'entrée personnalisées (p. ex., un vecteur) pour identifier les lectures de cette carte aux constructions livrées, comme les shRNAs.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Schéma des étapes de la préparation de la bibliothèque
Un schéma global de petite extraction, de séquençage et d'alignement de l'ARN est décrit à la figure 2.
Des échantillons de foie d'un mâle et d'une souris femelle ont été recueillis et congelés dans de l'azote liquide. L'ARN total a été extrait et évalué pour la qualité et la concentration.

Le séquençage de l'ARN ne donne pas suffisamment d'ARN pour le séquençage
3 g d'ARN provenant de deux extractions indépendantes d'ARN ont été utilisés comme matériau de départ pour le séquençage de l'ARN. Des échantillons ont été exécutés sur un gel d'acrylamide et découpés entre les marqueurs de taille correspondant à 17-28 nt de l'ARN (Figure 1A). Des échantillons ont été découpés en fragments pour l'isolement de l'ARN (figure 1B) et transférés dans un tube centrifugeur de 1,5 mL à faible rétention (figure 1C). Les codes-barres bc7 et bc17 (tableau 1) ont été ligats jusqu'à l'extrémité 5' du petit ARN. Les petites bibliothèques d'ARN ont été amplifiées PCR utilisant 22 cycles de PCR pour produire 8.0 et 11.2 ng/L produit, respectivement. Des échantillons ont été mis en commun et un échantillon de 10 nM mis en commun a été soumis pour le séquençage à haut débit à l'aide d'une longueur de lecture de 50 pb.

MiR-122 est le microARN le plus abondant dans le foie de souris
Après le tri des codes à barres, 851 931 lectures contenaient des codes-barres provenant de l'échantillon de foie 1 et 650 154 de l'échantillon de foie 2. Parmi les lectures, 83,5 % et 90,0 % ont été cartographiées en microARN respectivement, les autres étant cartographiées à des rARN (1,8 % et 0,6 % respectivement), à des tARN et à des fragments de dégradation de l'ARNm. Après l'alignement aux épingles à cheveux humaines de microARN, nous avons observé la concordance forte entre le nombre de lecture de microARN dans chaque réplique (R2 - 0.998 ; Figure 3). Au total, 306 espèces de microARN ont été détectées, le plus grand nombre de lectures étant cartographiés à miR-122 (tableausupplémentaire 4). L'abondance de microARN était semblable entre les échantillons masculins et femelles de foie.

Figure 1
Figure 1. Extraction de petits ARN à partir d'un gel d'acrylamide. (A) Gel d'acrylamide et région coupée correspondant à la taille des microARN. (B) Gel morceaux avant et après la coupe en petits fragments. (C) Processus de transfert de fragments de gel dans des tubes siliconés. (D) Réaction PCR sur le gel d'agarose à faible fusion démontrant un produit cloné correct par rapport au produit linker-linker et aux échantillons insaturés (22 cycles) par rapport aux échantillons saturés (24 cycles). Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 2
Figure 2. Schéma de protocole. Un calendrier montrant les principales étapes de la procédure. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 3
Figure 3. Reproductibilité des résultats de deux extractions indépendantes d'ARN. Scatterplot de microARN lire les comptes d'un foie de souris mâle (x-axe) par rapport à un foie de souris femelle (y-axe) à l'aide d'une échelle à base de journal10. Chaque point représente le nombre de microARN cartographiés par million (RPM) pour chaque microARN individuel. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

apprêt ordre
Lien 3' 1 rAppCTGTAGGCACCATCAAT-NH2
marqueur de taille inférieure rarurcrcrcrcrargrgrgrgrgrgrgrgrcrgrgrgrurarcrurarcrurarcrurcr
marqueur de taille supérieure rararurcrargrgrgrgrgrgrgrgrgrargrararcrgrarcrrarcrarcrarararARGGTAACCGCATCATGCGTC
code-barres1 /5AmMC6/ACGCTCTTCCGATCTrArGrCrG
code-barres2 /5AmMC6/ACGCTCTTCCGATCTrCrGrurC
code-barres3 /5AmMC6/ACGCTCTTCCGATCTrCrGrG
code-barres4 /5AmMC6/ACGCTCTTCCGATCTrArCruru
code-barres5 /5AmMC6/ACGCTCTTCGATCTrGrGrGrGrU
code-barres6 /5AmMC6/ACGCTCTTCCGATCTrGrurura
code-barres7 /5AmMC6/ACGCTCTTCGATCTrUrArUrG
code-barres8 /5AmMC6/ACGCTCTTCCGATCTrUrCrGrC
code-barres9 /5AmMC6/ACGCTCTTCCGATCTrCrCrArg
code à barres10 /5AmMC6/ACGCTCTTCGATCTrArArArC
code à barres11 /5AmMC6/ACGCTCTTCCGATCTrUrCrU
code à barres12 /5AmMC6/ACGCTCTTCCGATCTrCrAraru
code à barres13 /5AmMC6/ACGCTCTTCGATCTrArArGrA
code-barres14 /5AmMC6/ACGCTCTTCCGATCTrUrGrara
code-barres15 /5AmMC6/ACGCTCTTCCGATCTrGrGrGrG
code-barres16 /5AmMC6/ACGCTCTTCGATCTrArUrUrG
code-barres17 /5AmMC6/ACGCTCTTCCGATCTrUrCraru
code-barres18 /5AmMC6/ACGCTCTTCGATCTrGruraru
Apprêt RT ATTGATGGTGCCTACAG
Amorce PCR F AATGATACGGCGACCGAGATCTACACTCTTTCCCTACACGACGCTCTCcTCCGATCT
Apprêt PCR R CAAGCAGAAGACGGCATCATCGAGCTTTCCGATCTTGATGGTGCCTACAG

Tableau 1. Liste des amorces.

Tableau supplémentaire 1. Liste des séquences de codes à barres. Veuillez cliquer ici pour télécharger ce fichier.

Tableau supplémentaire 2. Liste organisée des séquences de précurseurs de microARN de souris. Veuillez cliquer ici pour télécharger ce fichier.

Tableau supplémentaire 3. Liste organisée des séquences humaines de précurseurs de microARN. Veuillez cliquer ici pour télécharger ce fichier.

Tableau supplémentaire 4. Les comptes de lecture de microARN crus et normalisés. Veuillez cliquer ici pour télécharger ce fichier.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Malgré l'identification des microARN il y a plus de 20 ans13, le processus de séquençage des microARN reste laborieux et nécessite des équipements spécialisés, empêchant les laboratoires d'adopter régulièrement des protocoles internes14. D'autres techniques peuvent évaluer simultanément les microARN, comme les microréseaux d'ARN et les panneaux d'expression multiplexés; cependant, ces approches sont limitées en ce qu'elles ne quantifient que les microARN présents dans leur ensemble de sondes. Pour cette raison, ils manquent des caractéristiques importantes de séquençage de l'ARN petit, comme l'identification de microARN nouveaux, et des isoformes microARN - changements nucléoside qui peuvent avoir une fonction biologique importante6,7,15 .

Lors du démarrage d'une nouvelle expérience, l'utilisation d'un fournisseur commercial est souvent plus facile parce qu'ils offrent un soutien technique et la facilité d'utilisation. Plusieurs options commerciales sont disponibles pour le séquençage des microARN, qui peut être multiplexé pour réduire la charge de travail lors du traitement de grands nombres d'échantillons. Ces kits commerciaux sont continuellement améliorés, ce qui est à la fois un avantage et un inconvénient. D'une part, les entreprises qui fabriquent ces kits ont développé de nouvelles méthodes de capture de microARN, par exemple, par la circularisation de leurs 5 et 3 extrémités avant le séquençage ou en utilisant des liens dégénérés avec des séquences aléatoires à chaque extrémité pour réduire le biais de ligature. Ils ont également mis au point des méthodes pour éliminer les adaptateurs-dimers, par exemple, par la ligature d'adaptateurs à double brin ou l'hybridation d'oligonucléotides complémentaires. D'autre part, les kits commerciaux recommandent de ne pas modifier ou modifier toute étape. Par conséquent, si des mises à jour sont apportées à un kit, il est difficile ou impossible de comparer les données dérivées d'anciennes et de nouvelles versions de kits, ainsi que les données dérivées de kits provenant de différents fournisseurs commerciaux. Ici, nous avons décrit un protocole qui a le pouvoir de rester face à des alternatives commerciales. Notre accent sur les étapes de purification du gel - alors qu'ils ajoutent du temps au protocole - permet de capturer et de reproductibilité constantes de microARN au cours des nombreuses années que nous avons utilisées. Plusieurs évaluations de la reproductibilité entre les kits commerciaux et les protocoles internes ont été faites, et nous renvoyons le lecteur à quelques-unes de ces études16,17,18,19. Fait important, les étapes que nous énoncions pour l'analyse bioinformatique des microARN peuvent être utilisées quel que soit le choix du kit ou du protocole interne.

Le séquençage des microARN est souvent perturbé par le choix des codes-barres : dans certains cas, l'efficacité de la ligature des différents codes à barres peut ne pas être équivalente, ce qui conduit à des distributions biaisées de séquences dans les échantillons20. Il est maintenant recommandé d'utiliser des bases dégénérées à l'extrémité 5 et 3 pour minimiser les biais de ligature de microARN spécifiques21,22. Dans ce protocole, nous n'avons pas observé ces problèmes de ligature et avons observé des réadmissions cohérentes pour les répliques techniques et biologiques évaluées avec différents codes-barres5,6,7,23, mais il est important d'en être conscient. Les méthodes pour éviter le biais de ligature incluent l'incorporation des amorces d'index dans les amorces de PCR, ou pour ajouter un ou plusieurs nucléosides aléatoires d'ARN à l'extrémité 3 de la séquence de 5 adaptateurs (tableau 1). L'introduction d'un ou de plusieurs ARN synthétiques, tels que le c. elegans miR-39 microRNA24, est également une option à des fins de normalisation, ce qui est essentiel pour les situations à faible rendement, comme la quantification des microARN à partir d'exosomes. De même, pour la ligature d'ARN, nous avons avec succès employé la ligase 1 d'ARN de T4, mais la ligature avec moins de biais a été démontrée pour une forme tronquée de ligase d'ARN de T4 225. Enfin, superscripts III et IV sont d'autres enzymes de transcription inversée que nous avons utilisé sans problème.

Le choix de la base de données de microARN peut également influencer les résultats définitifs normalisés. Un défi avec la conservation des bases de données microARN est que plusieurs nouveaux petits ARN répertoriés comme microARN sont en fait des fragments d'éléments répétitifs et non de bonne foi microARN2. Des efforts ont été faits pour retirer les microARN qui ne sont pas conformes aux critères standard, de sorte que la prochaine version d'une base de données de microARN soit plus raffinée; cependant, la prochaine itération contient également de nouveaux candidats qui ont besoin d'être confirmés. Lorsque les microARN dérivés à répétition sont inclus dans les alignements, ils peuvent fausser les résultats et submerger les données des microARN existants. Par conséquent, l'utilisation d'ensembles de données bien organisés de microARN de différentes espèces est essentielle26,27. Nous avons connu la plus grande reproductibilité lors de l'alignement des petites lectures de séquençage de l'ARN sur les listes de microARN conservés et avons inclus ces épingles à cheveux dans le tableau supplémentaire 2 et le tableau supplémentaire 3. Ces listes correspondent aux estimations d'environ 500 microARN de haute confiance dans le génome humain2,26.

Comme avec n'importe quelle technique, les résultats devraient être confirmés avec une approche orthogonale. Nous avons réussi à reproduire de petits résultats de séquençage d'ARN avec de petites taches nordiques d'ARN qui incorporent des sondes radiolabeled pour confirmer la taille et l'abondance relative des microARN candidats6,7,23. Le PCR quantitatif des microARN utilisant le séquençage à lecture fractionnée, et la confirmation des changements d'ARNm cibles utilisant qPCR et le ballonnement occidental sont d'autres options pour la validation.

En résumé, nous avons fourni une méthode pour isoler et séquencer les microARN et effectuer des alignements par rapport aux bases de données existantes sur les microARN. L'abordabilité des réactifs et de l'équipement et l'utilisation d'outils open source pour l'analyse devraient rendre ce protocole accessible à tous. Enfin, ce protocole peut être utilisé dans n'importe quel tissu ou lignée cellulaire pour produire des lectures hautement reproductibles et de haute qualité.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Les auteurs n'ont rien à révéler.

Acknowledgments

Nous tenons à remercier les membres des laboratoires d'Andrew Fire et de Mark Kay pour leurs conseils et leurs suggestions.

Materials

Name Company Catalog Number Comments
100 bp DNA ladder NEB N3231
19:1 bis-acrylamide Millipore Sigma A9926
25 bp DNA step ladder Promega G4511
Acid phenol/chloroform ThermoFisher AM9720
Acrylamide RNA loading dye ThermoFisher R0641
Ammonium persulfate (APS) Biorad 161-0700
Bioanalyzer instrument Agilent G2991AA For assessing RNA quality and concentration
Chloroform Fisher Scientific C298-500
Ethanol (100%) Sigma E7023
Gel Loading Buffer II ThermoFisher AM8547
GlycoBlue ThermoFisher AM9516 Blue color helps in visualizing pellet
HCl Sigma 320331
KOH Sigma P5958
Maxi Vertical Gel Box 20 x 20cm Genesee 45-109
miRVana microRNA isolation kit ThermoFisher AM1560
miSeq system Illumina SY-410-1003 For generating small RNA sequencing data
NaCl Fisher Scientific S271-500
Nusieve low-melting agarose Lonza 50081
Parafilm (laboratory sealing film) Millipore Sigma P7793
Poly-ethylene glycol 8000 NEB included with M0204
ProtoScript II First strand cDNA Synthesis Kit NEB E6560S
QIAquick Gel Extraction kit Qiagen 28704
Qubit Fluorometer ThermoFisher Q33226 For quantifying DNA concentration
Qubit RNA HS Assay kit ThermoFisher Q32855
Razor Blades Fisher Scientific 12640
Siliconized Low-Retention 1.5 ml tubes Fisher Scientific 02-681-331
T4 RNA ligase 1 NEB M0204
T4 RNA Ligase 2, truncated K227Q NEB M0351S
TapeStation Agilent G2939BA For assessing RNA quality and concentration
Taq DNA Polymerase NEB M0273X
TEMED Biorad 161-0800
Tris Base pH 7.5 Sigma 10708976001
Tris-buffered EDTA Sigma T9285
Trizol ThermoFisher 15596026
UltraPure Ethidium bromide (10 mg/ml) Invitrogen 15585-011
Universal miRNA cloning linker NEB S1315S
Urea Sigma U5378

DOWNLOAD MATERIALS LIST

References

  1. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  2. Bartel, D. P. Metazoan MicroRNAs. Cell. 173 (1), 20-51 (2018).
  3. Lau, N. C., Lim, L. P., Weinstein, E. G., Bartel, D. P. An abundant class of tiny RNAs with probable regulatory roles in Caenorhabditis elegans. Science. 294 (5543), 858-862 (2001).
  4. Kim, V. N., Han, J., Siomi, M. C. Biogenesis of small RNAs in animals. Nature Reviews Molecular Cell Biology. 10 (2), 126-139 (2009).
  5. Gu, S., et al. The loop position of shRNAs and pre-miRNAs is critical for the accuracy of dicer processing in vivo. Cell. 151 (4), 900-911 (2012).
  6. Valdmanis, P. N., et al. RNA interference-induced hepatotoxicity results from loss of the first synthesized isoform of microRNA-122 in mice. Nature Medicine. 22 (5), 557-562 (2016).
  7. Valdmanis, P. N., et al. miR-122 removal in the liver activates imprinted microRNAs and enables more effective microRNA-mediated gene repression. Nature Communications. 9 (1), 5321 (2018).
  8. Griffiths-Jones, S. The microRNA Registry. Nucleic Acids Research. 32, D109-D111 (2004).
  9. Griffiths-Jones, S., Grocock, R. J., van Dongen, S., Bateman, A., Enright, A. J. miRBase: microRNA sequences, targets and gene nomenclature. Nucleic Acids Research. 34 (Database issue), D140-D144 (2006).
  10. Griffiths-Jones, S., Saini, H. K., van Dongen, S., Enright, A. J. miRBase: tools for microRNA genomics. Nucleic Acids Research. 36 (Database issue), D154-D158 (2008).
  11. Patro, R., Mount, S. M., Kingsford, C. Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms. Nature Biotechnology. 32 (5), 462-464 (2014).
  12. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  13. Fire, A., et al. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature. 391 (6669), 806-811 (1998).
  14. Etheridge, A., Wang, K., Baxter, D., Galas, D. Preparation of Small RNA NGS Libraries from Biofluids. Methods in Molecular Biology. 1740, 163-175 (2018).
  15. Yamane, D., et al. Differential hepatitis C virus RNA target site selection and host factor activities of naturally occurring miR-122 3 variants. Nucleic Acids Research. 45 (8), 4743-4755 (2017).
  16. Giraldez, M. D., et al. Comprehensive multi-center assessment of small RNA-seq methods for quantitative miRNA profiling. Nature Biotechnology. 36 (8), 746-757 (2018).
  17. Dard-Dascot, C., et al. Systematic comparison of small RNA library preparation protocols for next-generation sequencing. BMC Genomics. 19 (1), 118 (2018).
  18. Yeri, A., et al. Evaluation of commercially available small RNASeq library preparation kits using low input RNA. BMC Genomics. 19 (1), 331 (2018).
  19. Coenen-Stass, A. M. L., et al. Evaluation of methodologies for microRNA biomarker detection by next generation sequencing. RNA Biology. 15 (8), 1133-1145 (2018).
  20. Baran-Gale, J., et al. Addressing Bias in Small RNA Library Preparation for Sequencing: A New Protocol Recovers MicroRNAs that Evade Capture by Current Methods. Frontiers in Genetics. 6, 352 (2015).
  21. Jayaprakash, A. D., Jabado, O., Brown, B. D., Sachidanandam, R. Identification and remediation of biases in the activity of RNA ligases in small-RNA deep sequencing. Nucleic Acids Research. 39 (21), e141 (2011).
  22. Van Nieuwerburgh, F., et al. Quantitative bias in Illumina TruSeq and a novel post amplification barcoding strategy for multiplexed DNA and small RNA deep sequencing. PLoS One. 6 (10), e26969 (2011).
  23. Valdmanis, P. N., et al. Upregulation of the microRNA cluster at the Dlk1-Dio3 locus in lung adenocarcinoma. Oncogene. 34 (1), 94-103 (2015).
  24. Schwarzenbach, H., da Silva, A. M., Calin, G., Pantel, K. Data Normalization Strategies for MicroRNA Quantification. Clinical Chemistry. 61 (11), 1333-1342 (2015).
  25. Viollet, S., Fuchs, R. T., Munafo, D. B., Zhuang, F., Robb, G. B. T4 RNA ligase 2 truncated active site mutants: improved tools for RNA analysis. BMC Biotechnology. 11, 72 (2011).
  26. Chiang, H. R., et al. Mammalian microRNAs: experimental evaluation of novel and previously annotated genes. Genes & Development. 24 (10), 992-1009 (2010).
  27. Fromm, B., et al. A Uniform System for the Annotation of Vertebrate microRNA Genes and the Evolution of the Human microRNAome. Annual Review of Genetics. 49, 213-242 (2015).

Tags

Génétique Numéro 150 microARN petits ARN séquençage à haut débit bioinformatique préparation de la bibliothèque alignement des séquences
Un pipeline complet pour isoler et séquencer les microARN et les analyser à l'aide d'outils Open Source
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Course, M. M., Gudsnuk, K.,More

Course, M. M., Gudsnuk, K., Valdmanis, P. N. A Complete Pipeline for Isolating and Sequencing MicroRNAs, and Analyzing Them Using Open Source Tools. J. Vis. Exp. (150), e59901, doi:10.3791/59901 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter