Summary

Identificación de los factores clave que regula la auto-renovación y diferenciación de las células precursoras hematopoyéticas EML por análisis de secuenciación de ARN-

Published: November 11, 2014
doi:

Summary

Se utilizaron análisis de ARN de secuenciación y bioinformática para identificar factores de transcripción expresados ​​diferencialmente significativamente y en subpoblaciones Lin-CD34 + y Lin-CD34 de ratón EMLcells. Estos factores de transcripción que podrían desempeñar un papel importante en la determinación del cambio entre las células Lin-CD34- auto-renovación de Lin-CD34 + y parcialmente diferenciado.

Abstract

Las células madre hematopoyéticas (HSC) se utilizan clínicamente para el tratamiento de trasplante para reconstruir el sistema hematopoyético de un paciente en muchas enfermedades tales como la leucemia y el linfoma. Dilucidar los mecanismos que controlan la auto-renovación y diferenciación de las HSC es importante para la aplicación de las CMH para la investigación y aplicaciones clínicas. Sin embargo, no es posible obtener gran cantidad de HSCs debido a su incapacidad de proliferar in vitro. Para superar este obstáculo, se utilizó una línea celular derivada de la médula ósea de ratón, la EML (eritroide, mieloide y linfocítica) línea celular, como un sistema modelo para este estudio.

RNA-secuenciación (RNA-Seq) se ha utilizado cada vez más para sustituir microarray para estudios de expresión génica. Presentamos aquí un método detallado de la utilización de la tecnología de ARN-Seq para investigar los posibles factores clave en la regulación de las células EML auto-renovación y diferenciación. El protocolo previsto en el presente documento se divide en tres partes. El primer part explica cómo la cultura células EML y separada Lin-CD34 + y células Lin-CD34. La segunda parte del protocolo ofrece procedimientos detallados para la preparación de ARN total y de la construcción de la biblioteca para la posterior secuenciación de alto rendimiento. La última parte se describe el método para el análisis de datos de RNA-Seq y se explica cómo utilizar los datos para identificar los factores de transcripción expresados ​​diferencialmente entre las células Lin-Lin-CD34- CD34 + y. Se identificaron los factores de transcripción más significativamente expresadas diferencialmente a ser los potenciales reguladores clave que controlan las células EML auto-renovación y diferenciación. En la sección de discusión de este artículo, se destacan los pasos clave para el desempeño exitoso de este experimento.

En resumen, este trabajo ofrece un método de uso de la tecnología de ARN-Seq para identificar posibles reguladores de la auto-renovación y diferenciación en células EML. Los factores clave identificados se someten a análisis funcional de aguas abajo in vitro e in vivo.

Introduction

Las células madre hematopoyéticas son células sanguíneas raras que residen principalmente en el nicho de la médula ósea de adultos. Son responsables de la producción de células requeridas para reponer la sangre y los sistemas inmunitarios 1. Como una especie de células madre, las CMH son capaces tanto de auto-renovación y diferenciación. Dilucidar los mecanismos que controlan la decisión destino de las HSC, ya sea hacia la auto-renovación o diferenciación, ofrecerá una valiosa orientación sobre la manipulación de las CMH para las investigaciones de enfermedades de la sangre y el uso clínico 2. Uno de los problemas que enfrentan los investigadores es que las CMH se pueden mantener y ampliar in vitro en una medida muy limitada; la gran mayoría de su progenie son parcialmente diferenciado en cultivo 2.

Con el fin de identificar los principales reguladores que controlan los procesos de auto-renovación y diferenciación en un genoma de gran escala, hemos utilizado un ratón primitiva línea de células progenitoras hematopoyéticas EML como un sistema modelo. Thse línea celular se deriva de médula ósea murina 3,4. Cuando se alimenta con diferentes factores de crecimiento, las células pueden diferenciarse en EML eritroide, mieloide, y las células linfoides in vitro 5. Es importante destacar que esta línea celular puede propagarse en gran cantidad en medio de cultivo que contiene el factor de células madre (SCF) y todavía conservan su pluripotencialidad. EML células se pueden separar en subpoblaciones de auto-renovación de Lin-SCA + CD34 + y células parcialmente diferenciadas Lin-SCA-CD34- basados ​​en marcadores de superficie CD34 y SCA 6. Al igual que a corto plazo las CMH, SCA + células CD34 + son capaces de auto-renovación. Cuando se trata con células CD34 + SCF, Lin-SCA + puede regenerar rápidamente una población mixta de células CD34 + y Lin-SCA-CD34 + Lin-SCA y continuar a proliferar 6. Las dos poblaciones son similares en morfología y tienen niveles similares de ARNm de c-kit y la proteína 6. Células Lin-SCA-CD34 son capaces de propagarse en los medios de comunicación que contiene IL-3 en lugar de SCF 3. Unveiling los reguladores clave en la decisión del destino celular EML ofrecerá una mejor comprensión de los mecanismos celulares y moleculares en la transición del desarrollo temprano durante la hematopoyesis.

Con el fin de investigar las diferencias moleculares subyacentes entre las células Lin-SCA-CD34- parcialmente diferenciadas auto-renovación de Lin-SCA + CD34 + y, se utilizó ARN-Seq para identificar los genes expresados ​​diferencialmente. En particular, nos centramos en los factores de transcripción, como factores de transcripción son cruciales en la determinación del destino celular. ARN-Sec es un enfoque recientemente desarrollado que utiliza las capacidades de secuenciación de próxima generación de tecnologías (NGS) para perfilar y cuantificar ARN transcrito a partir del genoma 7,8. En resumen, el ARN total es poli-A seleccionado y fragmentado como la plantilla inicial template.The ARN se convierte después en ADNc utilizando transcriptasa inversa. Con el fin de asignar transcripciones de ARN de longitud completa, utilizando ARN intacto, no degradado para la construcción de la biblioteca de ADNc es importante. Para el purpose de la secuenciación, se añaden secuencias adaptadoras específicas a ambos extremos del cDNA. Entonces, en la mayoría de los casos, las moléculas de ADNc se amplifican por PCR y se secuenciaron de una manera de alto rendimiento.

Después de la secuenciación, la resultante lee se puede alinear a un genoma de referencia y una base de datos transcriptoma. El número de lecturas que mapa para el gen de referencia se cuenta y esta información se puede utilizar para estimar el nivel de expresión génica. El lee también puede ser ensamblado de novo sin un genoma de referencia, lo que permite el estudio de la transcriptomes en organismos no modelo 9. Tecnología de RNA-seq también se ha utilizado para detectar isoformas de empalme 10-12, nuevas transcripciones 13 y 14 fusiones de genes. Además de la detección de genes codificadores de proteínas, RNA-Seq también se puede utilizar para detectar y analizar novela nivel de transcripción de los ARN no codificantes, tales como RNA largo 15,16, microRNA 17, 18 etc. siRNA no codificante. Debido a tque la precisión de este método, se ha utilizado para la detección de variaciones de un solo nucleótido 19,20.

Antes de la llegada de la tecnología de ARN-Seq, microarray fue el principal método utilizado para el análisis de perfil de expresión génica. Sondas pre-diseñadas se sintetizan y posteriormente unidos a una superficie sólida para formar un microarray de diapositivas 21. ARNm se extrae y se convirtió en ADNc. Durante el proceso de transcripción inversa, los nucleótidos marcados con fluorescencia se incorporan en el ADNc y el ADNc se pueden hibridó en las diapositivas de microarrays. La intensidad de la señal obtenida de un punto específico depende de la cantidad de ADNc de unión a la sonda específica en ese lugar 21. En comparación con la tecnología de RNA-Seq, microarray tiene varias limitaciones. En primer lugar, los microarrays se basa en el conocimiento preexistente de anotación de genes, mientras que la tecnología de ARN-Seq es capaz de detectar nuevas transcripciones en alto nivel de fondo relativa, lo que limita su uso cuando genivel de expresión ne es baja. Además, la tecnología de ARN-Seq tiene mucho mayor rango dinámico de detección (8000 veces) 7, mientras que, debido a fondo y la saturación de las señales, la exactitud de microarrays es limitada para ambos genes altamente expresados ​​y humilde 7,22. Por último, las sondas de microarrays difieren en su eficiencia de hibridación, que hacen que los resultados menos fiables al comparar los niveles de expresión relativos de diferentes transcripciones dentro de una muestra de 23. Aunque RNA-Seq tiene muchas ventajas sobre microarrays, su análisis de los datos es complejo. Esta es una de las razones por las que muchos investigadores todavía utilizan microarrays en lugar de RNA-Seq. Se requieren varias herramientas bioinformáticas para el procesamiento de datos de ARN-Seq y análisis 24.

Entre varios de secuenciación de próxima generación (NGS) plataformas, 454, Illumina, SOLID y Ion Torrent son los más ampliamente usados. 454 fue la primera plataforma comercial NGS. En contraste con las otras plataformas de secuenciaciónlongitud como Illumina y sólido, la plataforma 454 genera ya leer (promedio base de 700 lecturas) 25. Longer lecturas son mejores para la caracterización inicial de transcriptiome debido a su mayor eficiencia montar 25. La principal desventaja de la plataforma 454 es su alto coste por megabase de secuencia. La iluminación y plataformas SÓLIDOS generar lee con el aumento del número y longitudes cortas. El coste por megabase de la secuencia es mucho menor que la plataforma 454. Debido a la gran cantidad de cortos lee para la iluminación y plataformas sólidas, el análisis de datos es mucho más computacionalmente intensivas. El precio del instrumento y los reactivos para la secuenciación para la plataforma Ion Torrent es más barato y el tiempo de la secuencia es más corta 25. Sin embargo, la tasa de error y el costo por megabase de secuencia son más altos en comparación con la iluminación y plataformas SÓLIDOS. Las diferentes plataformas tienen sus propias ventajas y desventajas, y requieren diferentes métodos para el análisis de datos. El plaTForm debe ser elegido sobre la base de la finalidad de secuenciación y la disponibilidad de fondos.

En este trabajo, tomamos plataforma Illumina ARN-Seq como ejemplo. Utilizamos células EML como un sistema modelo para investigar los reguladores clave en EML células auto-renovación y diferenciación, y proporciona un métodos detallados de construcción de la biblioteca de ARN-Seq y análisis de datos para el cálculo de nivel de expresión y la novela detección transcripción. Hemos demostrado en nuestra publicación anterior que el estudio RNA-seq en el sistema de modelo de EML 2, cuando se combina con la prueba funcional (por ejemplo desmontables shRNA) proporcionar un poderoso enfoque en la comprensión del mecanismo molecular de las primeras etapas de la diferenciación hematopoyética, y puede servir como una modelo para el análisis de células auto-renovación y diferenciación en general.

Protocol

Activada por fluorescencia 1. EML cultivo celular y separación de las células Lin-CD34 + y Lin-CD34- Uso de clasificación celular magnética Sistema y método de clasificación de la célula Preparación de riñón de hámster bebé (BHK) medio de cultivo celular para la recogida de factor de células madre: Cultura células BHK en medio DMEM que contenía FBS al 10% en 25 cm 2 frasco (Tabla 1) a 37 ° C, 5% de CO2 en un incubador de cultivo celular. <li…

Representative Results

Con el fin de analizar los genes expresados ​​diferencialmente en las células Lin-Lin-EML CD34- CD34 + y, se utilizó la tecnología de ARN-Seq. La figura 1 muestra el flujo de trabajo de los procedimientos. Después del aislamiento de células negativas de linaje por clasificación celular magnética, nos separamos células Lin-SCA-CD34 utilizando FACS Aria Lin-SCA + CD34 + y. Células enriquecidas EML-Lin se tiñeron con anti-CD34, anti-Sca1 y los anticuerpos de cóctel de linaje. Sólo las célu…

Discussion

Transcriptoma de mamíferos es muy compleja 34-38. Tecnología de ARN-Seq juega un papel cada vez más importante en los estudios de análisis de transcriptoma, novela detección transcripciones y solo nucleótido variación descubrimiento etc. Tiene muchas ventajas sobre otros métodos para el análisis de expresión de genes. Como se mencionó en la introducción, que supera los artefactos de hibridación de microarrays y se puede utilizar para identificar nuevas transcripciones de novo….

Disclosures

The authors have nothing to disclose.

Acknowledgements

JQW, SZ, SD and KC are supported by grant from the National Institutes of Health and the Staman Ogilvie Fund—Memorial Hermann Foundation.

Materials

Antibiotic-Antimycotic Invitrogen 15240-062 BHK cell culture
Anti-Mouse CD34 FITC eBioscience 11-0341-81 FACS sorting
Anti-Mouse Ly-6A/E (Sca-1) PE eBioscience 12-5981-81 FACS sorting
APC Mouse Lineage Antibody Cocktail BD Biosciences 558074 FACS sorting
BD FACSAria Cell Sorter BD Biosciences Special offer sysmtem FACS sorting
Corning™ Cell Culture Treated Flasks 75cm2 Corning incorporated 430641 Cell culture
Corning™ Cell Culture Treated Flasks 25cm2 Corning incorporated 430639 Cell culture
Deoxyribonuclease I, Amplification Grade Invitrogen 18068-015 Library preparation
DMEM Invitrogen 11965-092 BHK cell culture
DPBS Gibco 14190 Cell culture
HI FBS  Invitrogen 16140071 BHK cell culture
Horse Serum Invitrogen 16050-122 EML cell culture
IMDM HyClone SH30228.02 EML cell culture
L-Glutamine Invitrogen 25030-081 Cell culture
Lineage Cell Depletion Kit, mouse  Miltenyi Biotec 130-090-858 Isolation of lineage negative cells
NanoVue Plus spectrophotometer  GE Healthcare 28-9569-62 Quality control
Thermo Scientific™ Napco™ 8000 Water-Jacketed CO2 Incubators Thermo Scientific 15-497-002  Cell culture
Penicillin-Streptomycin Invitrogen 15140-122 EML cell culture
TRIzol® Reagent Invitrogen 15596-018 RNA exraction
TruSeq™ RNA Sample Prep Kit v2 -Set B (48rxn) Illumina RS-122-2002 Library preparation
2100 Electrophoresis Bioanalyzer Instrument  Agilent G2939AA Quality control
0.25% Trypsin-EDTA Gibco 25200 Cell culture
0.45 µm Syringe Filters Nalgene 190-2545 Cell culture

References

  1. Chambers, S. M., Goodell, M. A. Hematopoietic stem cell aging: wrinkles in stem cell potential. Stem Cell Rev. 3, 201-211 (2007).
  2. Wu, J. Q., et al. Tcf7 is an important regulator of the switch of self-renewal and differentiation in a multipotential hematopoietic cell line. PLoS genetics. 8, (2012).
  3. Ye, Z. J., et al. Complex interactions in EML cell stimulation by stem cell factor and IL-3. Proceedings of the National Academy of Sciences of the United States of America. 108, 4882-4887 (2011).
  4. Tsai, S., Bartelmez, S., Sitnicka, E., Collins, S. Lymphohematopoietic progenitors immortalized by a retroviral vector harboring a dominant-negative retinoic acid receptor can recapitulate lymphoid, myeloid, and erythroid development. Genes Dev. 8, 2831-2841 (1994).
  5. Weiler, S. R., et al. D3: a gene induced during myeloid cell differentiation of Linlo c-Kit+ Sca-1(+) progenitor cells. Blood. 93, 527-536 (1999).
  6. Ye, Z. J., Kluger, Y., Lian, Z., Weissman, S. M. Two types of precursor cells in a multipotential hematopoietic cell line. Proc Natl Acad Sci U S A. 102, 18461-18466 (2005).
  7. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10, 57-63 (2009).
  8. Chu, Y., Corey, D. R. RNA sequencing: platform selection, experimental design, and data interpretation. Nucleic acid therapeutics. 22, 271-274 (2012).
  9. Hornett, E. A., Wheat, C. W. Quantitative RNA-Seq analysis in non-model species: assessing transcriptome assemblies as a scaffold and the utility of evolutionary divergent genomic reference species. BMC genomics. 13, 361 (2012).
  10. Eswaran, J., et al. RNA sequencing of cancer reveals novel splicing alterations. Scientific reports. 3, 1689 (2013).
  11. Wang, E. T., et al. Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476 (2008).
  12. Wu, J. Q., et al. Dynamic transcriptomes during neural differentiation of human embryonic stem cells revealed by short, long, and paired-end sequencing. Proceedings of the National Academy of Sciences of the United States of America. 107, 5254-5259 (2010).
  13. Loraine, A. E., McCormick, S., Estrada, A., Patel, K., Qin, P. RNA-seq of Arabidopsis pollen uncovers novel transcription and alternative splicing. Plant physiology. 162, 1092-1109 (2013).
  14. Edgren, H., et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome biology. 12, 6 (2011).
  15. Ilott, N. E., Ponting, C. P. Predicting long non-coding RNAs using RNA sequencing. Methods. 63, 50-59 (2013).
  16. Sun, L., et al. Prediction of novel long non-coding RNAs based on RNA-Seq data of mouse Klf1 knockout study. BMC bioinformatics. 13, 331 (2012).
  17. Luo, S. MicroRNA expression analysis using the Illumina microRNA-Seq Platform. Methods in molecular biology. 822, 183-188 (2012).
  18. Bolduc, F., Hoareau, C., St-Pierre, P., Perreault, J. P. In-depth sequencing of the siRNAs associated with peach latent mosaic viroid infection. BMC molecular biology. 11, 16 (2010).
  19. Chepelev, I., Wei, G., Tang, Q., Zhao, K. Detection of single nucleotide variations in expressed exons of the human genome using RNA-Seq. Nucleic acids research. 37, 106 (2009).
  20. Djari, A., et al. Gene-based single nucleotide polymorphism discovery in bovine muscle using next-generation transcriptomic sequencing. BMC genomics. 14, 307 (2013).
  21. Murphy, D. Gene expression studies using microarrays: principles, problems, and prospects. Advances in physiology education. 26, 256-270 (2002).
  22. Chen, K., et al. RNA-seq characterization of spinal cord injury transcriptome in acute/subacute phases: a resource for understanding the pathology at the systems level. PLoS one. 8, 72567 (2013).
  23. Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome research. 18, 1509-1517 (2008).
  24. Ramskold, D., Kavak, E., Sandberg, R. How to analyze gene expression using RNA-sequencing data. Methods in molecular biology. 802, 259-274 (2012).
  25. Glenn, T. C. Field guide to next-generation DNA sequencers. Mol Ecol Resour. 11, 759-769 (2011).
  26. Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature protocols. 7, 562-578 (2012).
  27. Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
  28. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  29. Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature. 28, 511-515 (2010).
  30. Anders, S., Huber, W. Differential expression analysis for sequence count data. Genome biology. 11, 106 (2010).
  31. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  32. Cheranova, D., et al. RNA-seq analysis of transcriptomes in thrombin-treated and control human pulmonary microvascular endothelial cells. J Vis Exp. , (2013).
  33. Zhang, H. M., et al. AnimalTFDB: a comprehensive animal transcription factor database. Nucleic acids research. 40, 144-149 (2012).
  34. Wu, J. Q., et al. Systematic analysis of transcribed loci in ENCODE regions using RACE sequencing reveals extensive transcription in the human genome. Genome Biol. 9, 3 (2008).
  35. Wu, J. Q., et al. Large-scale RT-PCR recovery of full-length cDNA clones. Biotechniques. 36, 690-696 (2004).
  36. Wu, J. Q., Shteynberg, D., Arumugam, M., Gibbs, R. A., Brent, M. R. Identification of rat genes by TWINSCAN gene prediction, RT-PCR, and direct sequencing. Genome Res. 14, 665-671 (2004).
  37. Dewey, C., et al. Accurate identification of novel human genes through simultaneous gene prediction in human, mouse, and rat. Genome Res. 14, 661-664 (2004).
  38. Wu, J. . Characterize Mammalian Transcriptome Complexity. , (2011).

Play Video

Cite This Article
Zong, S., Deng, S., Chen, K., Wu, J. Q. Identification of Key Factors Regulating Self-renewal and Differentiation in EML Hematopoietic Precursor Cells by RNA-sequencing Analysis. J. Vis. Exp. (93), e52104, doi:10.3791/52104 (2014).

View Video