Summary

Identification des facteurs clés de régulation auto-renouvellement et de différenciation dans les cellules hématopoïétiques précurseurs EML par l'analyse de l'ARN-séquençage

Published: November 11, 2014
doi:

Summary

Analyses ARN de séquençage et de bioinformatique ont été utilisés pour identifier les facteurs de transcription de manière significative et exprimés de manière différentielle dans des sous-populations Lin-CD34 + et CD34 Lin-des EMLcells de souris. Ces facteurs de transcription peuvent jouer un rôle important dans la détermination de l'interrupteur entre les cellules Lin-CD34 auto-renouvellement Lin-CD34 + et partiellement différenciés.

Abstract

Les cellules souches hématopoïétiques (CSH) sont utilisés en clinique pour le traitement de la greffe à reconstruire le système hématopoïétique d'un patient dans de nombreuses maladies telles que la leucémie et le lymphome. Élucider les mécanismes contrôlant CSH auto-renouvellement et de différenciation est important pour l'application de CSH pour la recherche et les utilisations cliniques. Cependant, il est impossible d'obtenir des CSH en grande quantité en raison de leur incapacité à proliférer in vitro. Pour surmonter cet obstacle, nous avons utilisé une lignée de cellules dérivées de la moelle osseuse de souris, la lignée cellulaire EML (érythroïde, myéloïde et lymphoïde), en tant que système modèle pour cette étude.

ARN-séquençage (ARN-Seq) a été de plus en plus utilisés pour remplacer les puces à ADN pour les études d'expression génique. Nous rapportons ici une méthode détaillée de l'utilisation de la technologie de l'ARN-Seq pour enquêter sur les facteurs clés potentiels dans la régulation de la cellule EML auto-renouvellement et de différenciation. Le protocole fourni dans le présent document est divisé en trois parties. La première part explique comment la culture de cellules EML et séparé Lin-CD34 + et les cellules Lin-CD34. La deuxième partie du protocole propose des procédures détaillées pour la préparation d'ARN total et la construction de la bibliothèque ultérieure pour le séquençage à haut débit. La dernière partie décrit la méthode d'analyse de données RNA-Seq et explique comment utiliser les données pour identifier les facteurs de transcription exprimés de manière différentielle entre Lin-CD34 + et les cellules Lin-CD34. Les facteurs de transcription plus nettement exprimés de manière différentielle ont été identifiés comme les principaux régulateurs potentiels contrôle cellule EML auto-renouvellement et de différenciation. Dans la section de discussion de cet article, nous mettons en évidence les étapes clés de la performance réussie de cette expérience.

En résumé, ce document propose une méthode d'utilisation de la technologie de l'ARN-Seq pour identifier des régulateurs potentiels de l'auto-renouvellement et de différenciation dans les cellules EML. Les principaux facteurs identifiés sont soumis à l'analyse fonctionnelle en aval in vitro et in vivo.

Introduction

Les cellules souches hématopoïétiques sont des cellules sanguines rares qui se trouvent principalement dans la niche de la moelle osseuse adulte. Ils sont responsables de la production de cellules nécessaires pour reconstituer le sang et le système immunitaire 1. Comme une sorte de cellules souches, cellules souches hématopoïétiques sont capables à la fois de l'auto-renouvellement et de différenciation. Mécanismes qui contrôlent la décision de sort de CSH élucider, soit vers l'auto-renouvellement ou de la différenciation, offrira de précieux conseils sur la manipulation de cellules souches hématopoïétiques pour les recherches de maladies du sang et de l'utilisation clinique 2. Un problème rencontré par les chercheurs est que les CSH peuvent être maintenues et développées in vitro dans une mesure très limitée; la grande majorité de leur progéniture sont partiellement différenciées en culture 2.

Afin d'identifier les principaux régulateurs qui contrôlent les processus d'auto-renouvellement et de différenciation à l'échelle de l'ensemble du génome, nous avons utilisé une primitive hématopoïétique ligne de cellules souches de souris EML en tant que système modèle. Thest la lignée cellulaire a été dérivée à partir de 3,4 murin de la moelle osseuse. Lorsque nourris avec différents facteurs de croissance, les cellules peuvent se différencier en EML érythroïdes, myéloïdes, lymphoïdes et des cellules in vitro 5. Surtout, cette lignée cellulaire peut être propagé en grande quantité dans le milieu de culture contenant un facteur de cellules souches (SCF) et en conservant leur multipotentialité. EML cellules peuvent être séparés en sous-groupes d'auto-renouvellement Lin-SCA + CD34 + et les cellules différenciées partiellement Lin-SCA-CD34 sur la base de marqueurs de surface CD34 et SCA 6. Similaire à court terme CSH, SCA + CD34 + cellules sont capables d'auto-renouvellement. Lorsqu'ils sont traités avec SCF, Lin-SCA + des cellules CD34 + peut régénérer rapidement une population mixte de Lin-SCA + et les cellules CD34 + Lin-SCA-CD34 et continuent à proliférer 6. Les deux populations sont similaires dans la morphologie et des niveaux similaires de c-kit ARNm et la protéine 6. Des cellules Lin-SCA-CD34 sont capables de se propager dans un milieu contenant IL-3 à la place de SCF 3. Unveiling régulateurs clés dans la décision du destin cellulaire EML à offrir une meilleure compréhension des mécanismes cellulaires et moléculaires à transition précoce de développement au cours de l'hématopoïèse.

Afin d'étudier les différences moléculaires sous-jacents entre le Lin-SCA auto-renouvellement + CD34 + et les cellules Lin-SCA-CD34 partiellement différenciées, nous avons utilisé l'ARN-Seq pour identifier les gènes exprimés de manière différentielle. En particulier, nous nous concentrons sur les facteurs de transcription, des facteurs de transcription jouent un rôle crucial dans la détermination du destin cellulaire. ARN-Seq est une approche développée récemment qui utilise les capacités de séquençage de nouvelle génération (NGS) technologies de profil et de quantifier les ARN transcrits à partir de 7,8 génome. En bref, l'ARN total est le poly-A et fragmenté choisi comme modèle initial template.The ARN est ensuite converti en ADNc en utilisant la transcriptase inverse. Afin de cartographier des transcrits d'ARN de pleine longueur, en utilisant intact, l'ARN non dégradé pour la construction de la banque d'ADNc est importante. Pour le purpose de séquençage, des séquences d'adaptation spécifiques sont ajoutées aux deux extrémités de l'ADNc. Ensuite, dans la plupart des cas, les molécules d'ADNc sont amplifiés par PCR et séquences d'une manière à haut débit.

Après séquençage, résultant lectures peut être aligné sur un génome de référence et une base de données de transcriptome. Le numéro de la carte qui lit le gène de référence est prise en compte et cette information peut être utilisée pour estimer le niveau d'expression du gène. Le lit peut également être assemblé de novo sans un génome de référence, ce qui permet l'étude de transcriptome dans les organismes non-modèles 9. la technologie de l'ARN-seq a également été utilisé pour détecter les isoformes d'épissage 10 à 12, de nouveaux transcrits 13 et 14 des fusions de gènes. En plus de la détection de gènes codant pour des protéines, de l'ARN-Seq peut également être utilisé pour détecter et analyser nouveau niveau d'ARN non codants, tels que la transcription de l'ARN de long 15,16, 17 micro-ARN, etc. siRNA 18 non codante. En raison de til précision de cette méthode, il a été utilisé pour la détection de variations nucléotidiques simples 19,20.

Avant l'avènement de la technologie de l'ARN-Seq, puces à ADN est la principale méthode utilisée pour analyser le profil d'expression génique. Sondes pré-synthétisées sont conçus et ensuite fixés à une surface solide pour former une lame de microréseau 21. L'ARNm est extrait et converti en ADNc. Au cours du processus de transcription inverse, les nucleotides marqués par fluorescence sont incorporés dans l'ADNc et l'ADNc peuvent être hybridés sur les lames de puces à ADN. L'intensité du signal recueilli à partir d'un endroit précis dépend de la quantité d'ADNc de liaison à la sonde spécifique à cet endroit 21. Par rapport à la technologie de l'ARN-Seq, puces à ADN a plusieurs limites. Tout d'abord, puces à ADN repose sur la connaissance préalable de l'annotation des gènes, tandis que la technologie de l'ARN-Seq est capable de détecter de nouveaux relevés de notes au niveau de fond élevé relative, ce qui limite son utilisation lorsque geniveau d'expression ne est faible. En outre, la technologie de l'ARN-Seq a beaucoup plus dynamique portée de détection (8000 fois) 7, tandis que, en raison de fond et la saturation des signaux, l'exactitude des puces à ADN est limitée pour les deux gènes fortement exprimés et humble 7,22. Enfin, des sondes de puces à ADN diffèrent dans leur efficacité d'hybridation, ce qui rend les résultats moins fiables lors de la comparaison des niveaux d'expression relatifs des différents produits de transcription au sein d'un échantillon 23. Bien que l'ARN-Seq a de nombreux avantages par rapport aux puces à ADN, l'analyse des données est complexe. Ceci est une des raisons pour lesquelles de nombreux chercheurs utilisent encore microarray la place de l'ARN-Seq. Divers outils de bioinformatique sont nécessaires pour le traitement et l'analyse des données 24 ARN-Seq.

Parmi plusieurs séquençage de nouvelle génération (NGS), les plates-formes 454, Illumina, Torrent SOLIDE et Ion sont les plus largement utilisés. 454 a été la première plate-forme commerciale NGS. A la différence des autres plates-formes de séquençagelongueur comme Illumina et solide, la plate-forme 454 génère plus lus (moyenne 700 BASE lit) 25. Plus de lectures est mieux pour la caractérisation initiale de transcriptiome en raison de leur plus assembler efficacité 25. Le principal inconvénient de la plate-forme 454 est son coût élevé par mégabase de séquence. Le Illumina et solides plates-formes de générer lit avec une augmentation du nombre et de courtes longueurs. Le coût par mégabase de séquence est beaucoup plus faible que la plate-forme 454. En raison du grand nombre de court interprète pour l'Illumina et solides plates-formes, l'analyse des données est beaucoup plus de calculs. Le prix de l'instrument et des réactifs pour le séquençage de la plate-forme Ion Torrent est moins cher et le temps de séquençage est plus courte de 25. Cependant, le taux d'erreur et le coût par mégabase de séquence sont plus élevés par rapport à la Illumina et les plates-formes solides. Différentes plates-formes ont leurs propres avantages et inconvénients et nécessitent des méthodes d'analyse des données. Le platform devraient être choisis en fonction du but de séquençage et la disponibilité des fonds.

Dans cet article, nous prenons plate-forme Illumina ARN-Seq comme un exemple. Nous avons utilisé cellule EML en tant que système modèle pour étudier les régulateurs clés dans EML cellule auto-renouvellement et de différenciation, et a fourni une des méthodes détaillées de la construction de la bibliothèque de l'ARN-Seq et l'analyse de données pour le calcul du niveau d'expression et roman détection de transcription. Nous avons montré dans notre précédente publication de cette étude de l'ARN-Seq dans EML système modèle 2, lorsqu'il est couplé avec un test fonctionnel (par exemple shRNA de knockdown) fournir une approche puissante dans la compréhension du mécanisme moléculaire des premiers stades de la différenciation hématopoïétique, et peut servir de modèle pour l'analyse de cellules auto-renouvellement et de différenciation en général.

Protocol

1. EML culture cellulaire et la séparation des cellules Lin-CD34 + et CD34-Lin en utilisant la cellule magnétique Système et tri cellulaire activé par fluorescence méthode de tri Préparation de rein de bébé hamster (BHK), du milieu de culture de cellules pour la collecte de facteur de cellules souches: Culture des cellules BHK dans un milieu DMEM contenant 10% de FBS en flacon de 25 cm2 (voir le tableau 1) à 37 ° C, 5% de CO2 dans un incubateur de cult…

Representative Results

Afin d'analyser les gènes exprimés de manière différentielle dans Lin-CD34 + et les cellules Lin-CD34 EML, nous avons utilisé la technologie de l'ARN-Seq. La figure 1 montre le flux de travail des procédures. Après isolement de cellules de la lignée négatifs par tri magnétique de cellules, nous nous sommes séparés Lin-SCA + CD34 + et les cellules Lin-SCA-CD34 en utilisant FACS Aria. EML cellules Lin-enrichis ont été colorées avec anti-CD34, anti-Sca1 et anticorps de cocktail de la…

Discussion

Transcriptome des mammifères est très complexe 34-38. technologie de l'ARN-Seq joue un rôle de plus en plus important dans les études d'analyse du transcriptome, roman détection des transcriptions et seul nucléotide découverte de variation etc. Il présente de nombreux avantages par rapport aux autres méthodes d'analyse de l'expression des gènes. Comme mentionné dans l'introduction, il surmonte les artefacts d'hybridation de micro-réseau et peut être utilis?…

Declarações

The authors have nothing to disclose.

Acknowledgements

JQW, SZ, SD and KC are supported by grant from the National Institutes of Health and the Staman Ogilvie Fund—Memorial Hermann Foundation.

Materials

Antibiotic-Antimycotic Invitrogen 15240-062 BHK cell culture
Anti-Mouse CD34 FITC eBioscience 11-0341-81 FACS sorting
Anti-Mouse Ly-6A/E (Sca-1) PE eBioscience 12-5981-81 FACS sorting
APC Mouse Lineage Antibody Cocktail BD Biosciences 558074 FACS sorting
BD FACSAria Cell Sorter BD Biosciences Special offer sysmtem FACS sorting
Corning™ Cell Culture Treated Flasks 75cm2 Corning incorporated 430641 Cell culture
Corning™ Cell Culture Treated Flasks 25cm2 Corning incorporated 430639 Cell culture
Deoxyribonuclease I, Amplification Grade Invitrogen 18068-015 Library preparation
DMEM Invitrogen 11965-092 BHK cell culture
DPBS Gibco 14190 Cell culture
HI FBS  Invitrogen 16140071 BHK cell culture
Horse Serum Invitrogen 16050-122 EML cell culture
IMDM HyClone SH30228.02 EML cell culture
L-Glutamine Invitrogen 25030-081 Cell culture
Lineage Cell Depletion Kit, mouse  Miltenyi Biotec 130-090-858 Isolation of lineage negative cells
NanoVue Plus spectrophotometer  GE Healthcare 28-9569-62 Quality control
Thermo Scientific™ Napco™ 8000 Water-Jacketed CO2 Incubators Thermo Scientific 15-497-002  Cell culture
Penicillin-Streptomycin Invitrogen 15140-122 EML cell culture
TRIzol® Reagent Invitrogen 15596-018 RNA exraction
TruSeq™ RNA Sample Prep Kit v2 -Set B (48rxn) Illumina RS-122-2002 Library preparation
2100 Electrophoresis Bioanalyzer Instrument  Agilent G2939AA Quality control
0.25% Trypsin-EDTA Gibco 25200 Cell culture
0.45 µm Syringe Filters Nalgene 190-2545 Cell culture

Referências

  1. Chambers, S. M., Goodell, M. A. Hematopoietic stem cell aging: wrinkles in stem cell potential. Stem Cell Rev. 3, 201-211 (2007).
  2. Wu, J. Q., et al. Tcf7 is an important regulator of the switch of self-renewal and differentiation in a multipotential hematopoietic cell line. PLoS genetics. 8, (2012).
  3. Ye, Z. J., et al. Complex interactions in EML cell stimulation by stem cell factor and IL-3. Proceedings of the National Academy of Sciences of the United States of America. 108, 4882-4887 (2011).
  4. Tsai, S., Bartelmez, S., Sitnicka, E., Collins, S. Lymphohematopoietic progenitors immortalized by a retroviral vector harboring a dominant-negative retinoic acid receptor can recapitulate lymphoid, myeloid, and erythroid development. Genes Dev. 8, 2831-2841 (1994).
  5. Weiler, S. R., et al. D3: a gene induced during myeloid cell differentiation of Linlo c-Kit+ Sca-1(+) progenitor cells. Blood. 93, 527-536 (1999).
  6. Ye, Z. J., Kluger, Y., Lian, Z., Weissman, S. M. Two types of precursor cells in a multipotential hematopoietic cell line. Proc Natl Acad Sci U S A. 102, 18461-18466 (2005).
  7. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10, 57-63 (2009).
  8. Chu, Y., Corey, D. R. RNA sequencing: platform selection, experimental design, and data interpretation. Nucleic acid therapeutics. 22, 271-274 (2012).
  9. Hornett, E. A., Wheat, C. W. Quantitative RNA-Seq analysis in non-model species: assessing transcriptome assemblies as a scaffold and the utility of evolutionary divergent genomic reference species. BMC genomics. 13, 361 (2012).
  10. Eswaran, J., et al. RNA sequencing of cancer reveals novel splicing alterations. Scientific reports. 3, 1689 (2013).
  11. Wang, E. T., et al. Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476 (2008).
  12. Wu, J. Q., et al. Dynamic transcriptomes during neural differentiation of human embryonic stem cells revealed by short, long, and paired-end sequencing. Proceedings of the National Academy of Sciences of the United States of America. 107, 5254-5259 (2010).
  13. Loraine, A. E., McCormick, S., Estrada, A., Patel, K., Qin, P. RNA-seq of Arabidopsis pollen uncovers novel transcription and alternative splicing. Plant physiology. 162, 1092-1109 (2013).
  14. Edgren, H., et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome biology. 12, 6 (2011).
  15. Ilott, N. E., Ponting, C. P. Predicting long non-coding RNAs using RNA sequencing. Methods. 63, 50-59 (2013).
  16. Sun, L., et al. Prediction of novel long non-coding RNAs based on RNA-Seq data of mouse Klf1 knockout study. BMC bioinformatics. 13, 331 (2012).
  17. Luo, S. MicroRNA expression analysis using the Illumina microRNA-Seq Platform. Methods in molecular biology. 822, 183-188 (2012).
  18. Bolduc, F., Hoareau, C., St-Pierre, P., Perreault, J. P. In-depth sequencing of the siRNAs associated with peach latent mosaic viroid infection. BMC molecular biology. 11, 16 (2010).
  19. Chepelev, I., Wei, G., Tang, Q., Zhao, K. Detection of single nucleotide variations in expressed exons of the human genome using RNA-Seq. Nucleic acids research. 37, 106 (2009).
  20. Djari, A., et al. Gene-based single nucleotide polymorphism discovery in bovine muscle using next-generation transcriptomic sequencing. BMC genomics. 14, 307 (2013).
  21. Murphy, D. Gene expression studies using microarrays: principles, problems, and prospects. Advances in physiology education. 26, 256-270 (2002).
  22. Chen, K., et al. RNA-seq characterization of spinal cord injury transcriptome in acute/subacute phases: a resource for understanding the pathology at the systems level. PLoS one. 8, 72567 (2013).
  23. Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome research. 18, 1509-1517 (2008).
  24. Ramskold, D., Kavak, E., Sandberg, R. How to analyze gene expression using RNA-sequencing data. Methods in molecular biology. 802, 259-274 (2012).
  25. Glenn, T. C. Field guide to next-generation DNA sequencers. Mol Ecol Resour. 11, 759-769 (2011).
  26. Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature protocols. 7, 562-578 (2012).
  27. Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
  28. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  29. Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature. 28, 511-515 (2010).
  30. Anders, S., Huber, W. Differential expression analysis for sequence count data. Genome biology. 11, 106 (2010).
  31. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  32. Cheranova, D., et al. RNA-seq analysis of transcriptomes in thrombin-treated and control human pulmonary microvascular endothelial cells. J Vis Exp. , (2013).
  33. Zhang, H. M., et al. AnimalTFDB: a comprehensive animal transcription factor database. Nucleic acids research. 40, 144-149 (2012).
  34. Wu, J. Q., et al. Systematic analysis of transcribed loci in ENCODE regions using RACE sequencing reveals extensive transcription in the human genome. Genome Biol. 9, 3 (2008).
  35. Wu, J. Q., et al. Large-scale RT-PCR recovery of full-length cDNA clones. Biotechniques. 36, 690-696 (2004).
  36. Wu, J. Q., Shteynberg, D., Arumugam, M., Gibbs, R. A., Brent, M. R. Identification of rat genes by TWINSCAN gene prediction, RT-PCR, and direct sequencing. Genome Res. 14, 665-671 (2004).
  37. Dewey, C., et al. Accurate identification of novel human genes through simultaneous gene prediction in human, mouse, and rat. Genome Res. 14, 661-664 (2004).
  38. Wu, J. . Characterize Mammalian Transcriptome Complexity. , (2011).
check_url/pt/52104?article_type=t

Play Video

Citar este artigo
Zong, S., Deng, S., Chen, K., Wu, J. Q. Identification of Key Factors Regulating Self-renewal and Differentiation in EML Hematopoietic Precursor Cells by RNA-sequencing Analysis. J. Vis. Exp. (93), e52104, doi:10.3791/52104 (2014).

View Video