Summary

RNAシーケンシング解析によりEML造血前駆細胞における自己再生および分化を調節する重要な要因の同定

Published: November 11, 2014
doi:

Summary

RNAシークエンシングおよびバイオインフォマティクス解析は、マウスEMLcellsのリン、CD34 +およびリン-CD34-亜集団において有意にかつ差次的に発現する転写因子を同定した。これらの転写因子は、自己再生リン-CD34 +を、部分的に分化したリン-CD34-細胞との間の切り替えを決定する際に重要な役割を果たしている可能性がある。

Abstract

造血幹細胞(HSC)は、白血病やリンパ腫などの多くの疾患において、患者の造血系を再構築するために、移植治療のために臨床的に使用されている。 HSCの自己再生および分化を制御するメカニズムを解明することは研究および臨床用途のためのHSCのアプリケーションのために重要である。しかし、によりインビトロで増殖することができないことにHSCを大量に得ることができない。このハードルを克服するために、我々は、この研究のためのモデル系として、マウス骨髄由来の細胞株、EML(赤血球、骨髄、およびリンパ球)細胞株を使用した。

RNAシークエンシング(RNA-配列)がますます遺伝子発現研究のためのマイクロアレイを置き換えるために使用されてきた。ここではEML細胞の自己再生および分化の調節において潜在的な主要因を調査するためにRNA-配列技術を使用する具体的な方法を報告する。このホワイトペーパーで提供されるプロトコルは、3つの部分に分かれています。最初のパーtはどのように文化のEML細胞と独立したLIN-CD34 +およびLIN-CD34-細胞に説明しています。プロトコルの第2の部分は、トータルRNA調製およびハイスループット配列決定のための後続のライブラリー構築のための詳細な手順を提供しています。最後の部分は、RNA配列データ解析のための方法を説明し、リン、CD34 +およびリン-CD34-細胞との間の差次的に発現する転写因子を同定するためにデータを使用する方法について説明します。最も有意に差次的に発現される転写因子はEML細胞の自己再生および分化を制御する潜在的な重要な調節因子であると同定された。本稿の議論のセクションでは、この実験の成功パフォーマンスのための主要なステップを強調表示します。

要約すると、本論文では、EML細胞中で自己複製と分化の潜在的な調節因子を同定するために、RNA-配列技術を使用する方法を提供しています。特定された主要な要因は、in vitroおよびiの下流の機能解析に供されているn個の生体内。

Introduction

造血幹細胞は、成体骨髄ニッチに主に存在する稀な血液細胞である。これらは、血液および免疫系1を補充するために必要な細胞の産生を担う。幹細胞の種類としては、HSCは、自己再生および分化の両方が可能である。 HSCの運命決定を制御するメカニズムの解明、自己複製または分化のどちらかに向かって、血液疾患の研究や臨床使用量2のためのHSCの操作に貴重なガイダンスを提供します。研究者が直面する問題の一つは、HSCが維持され、非常に限られた範囲でインビトロで増殖することができることである。その子孫の大部分は、部分的に文化2で分化されている。

ゲノムワイドスケールでの自己再生および分化の過程を制御する重要な調節因子を同定するために、我々は、モデル系としてマウス原始造血前駆細胞株EMLを使用した。目細胞株は、マウス骨髄3,4から導出された。異なる成長因子を供給すると、EML細胞は、in vitroで 5 において赤血球、骨髄、およびリンパ系細胞に分化することができる。重要なことに、この細胞株は、幹細胞因子(SCF)を含む培地中で大量に増殖させることができ、それでもそれらの多能性を維持する。 EML細胞は、自己再生リン-SCA + CD34 +表面マーカーCD34およびSCA 6に基づいて、部分的に分化したリン-SCA-CD34-細胞の亜集団に分けることができる。短期HSCのと同様に、SCA + CD34 +細胞は、自己複製が可能である。 SCFで処理した場合、LIN-SCA + CD34 +細胞は急速に林-SCA + CD34 +およびLIN-SCA-CD34-細胞の混合集団を再生成し、6を増殖し続けることができます。つの集団は、形態学的に類似しており、c-キットmRNAおよびタンパク質6の同様のレベルを有する。リン-SCA-CD34-細胞はIL-3の代わりに、SCF 3を含有する培地中で増殖させることが可能である。 UnveilingのEML細胞の運命決定に重要な調節因子は、造血時の初期発生の移行における細胞および分子メカニズムのより良い理解を提供します。

自己複製リン-SCA + CD34 +および部分的に分化リン-SCA-CD34-細胞との間の根本的な分子の違いを調べるために、我々は、差次的に発現される遺伝子を同定するために、RNA配列を使用した。転写因子は、細胞の運命を決定する上で重要であるように、特に、我々は、転写因子に焦点を当てる。 RNA-seqがゲノム7,8から転写されたRNAをプロファイリングし、定量化するために、次世代シーケンシング(NGS)技術の能力を利用して最近開発されたアプローチです。簡単に述べると、トータルRNAは、ポリ選択と初期template.The RNAテンプレートは次いで逆転写酵素を用いてcDNAに変換されるように、断片化されている。 cDNAライブラリーを構築するために、無傷の、非分解RNAを用いて、完全長のRNA転写物をマッピングするために重要である。 PURのためシークエンシングの姿勢は、特定のアダプター配列は、cDNAの両端に付加される。そして、ほとんどの場合、cDNA分子は、PCRによって増幅され、ハイスループット様式で配列決定した。

シーケンシング後、得られたは参照ゲノムとトランスクリプトームデータベースに整列させることができる読み取ります。数は、参照遺伝子のマップがカウントされ、この情報は、遺伝子発現のレベルを推定するために使用できることを読み取る。読み込みは、非モデル生物9にトランスクリプトームの研究を可能にする、参照ゲノムなしデノボ組み立てることができる。 RNA-seqの技術は、スプライスアイソフォーム10-12、新規な転写物13および14の遺伝子融合検出するために使用されてきた。タンパク質をコードする遺伝子の検出に加えて、RNA-配列はまた、新規に検出し、そのような18の非コードRNA 15,16、マイクロRNA 17は、siRNA などの長い非コードRNAの転写レベルを分析するために使用され得る。なぜなら、tの彼は、この方法の精度は、単一ヌクレオチド変異19,20の検出に利用されている。

RNA-配列技術の出現の前に、マイクロアレイは、遺伝子発現プロファイルを分析するために使用される主要な方法であった。予め設計されたプローブは、マイクロアレイスライド21を形成するように合成し、続いて固体表面に付着される。 mRNAを抽出し、cDNAに変換される。逆転写プロセスの間に、蛍光標識されたヌクレオチドは、cDNAに組み込まれ、cDNAはマイクロアレイスライドにハイブリダイズさせることができる。特定の場所から収集された信号の強度は、そのスポット21上の特異的プローブに結合したcDNAの量に依存する。 RNA-配列技術と比較して、マイクロアレイはいくつかの限界がある。 RNA-配列技術は、その使用が制限されるとき、比較的高いバックグラウンドレベルで新規な転写物を検出することが可能であるが、まず、マイクロアレイは、遺伝子アノテーションの既存の知識に依存している葛ね発現レベルが低い。による背景信号が飽和し、マイクロアレイの精度は両方の高度に発現される遺伝子と低い7,22のため制限され、一方でまた、RNA-配列技術は、検出(8000倍)7の非常に高いダイナミックレンジを有する。最後に、マイクロアレイプローブは、一つのサンプル23内の異なる転写物の相対発現レベルを比較した場合、結果はあまり信頼性を高めるそれらのハイブリダイゼーションの効率、が異なる。 RNA-配列がマイクロアレイに比べて多くの利点を有するが、そのデータ分析は複雑である。これは、多くの研究者がまだRNA-配列の代わりに、マイクロアレイを使用する理由の一つです。様々なバイオインフォマティクスツールは、RNA配列のデータ処理および分析24のために必要とされる。

いくつかの次世代シーケンサー(NGS)のプラットフォームのうち、454、イルミナ、SOLIDとイオントレントは、最も広く使用されているものである。 454は最初の商用NGSプラットフォームだった。他のシーケンシングプラットフォームとは対照的にそのようなイルミナ固体として、454プラットフォームは、より長い読みの長さ(平均700ベースの読み取り)25を生成します。長くは、その高い効率25を組み立てるためにtranscriptiomeの初期特性評価のための優れている読み取ります。 454プラットフォームの主な欠点は、シーケンスのメガベース当たりのコストが高いことである。イルミナとSOLIDプラットフォームは増大した数と短い長さで読み込み、生成する。シーケンスのメガベース当たりのコストは、454プラットフォームよりもはるかに低い。が短いため、大量のデータ分析がはるかに計算集約され、イルミナとSOLIDプラットフォーム用に読み取ります。イオントレントプラットフォーム用のシーケンシングするための機器および試薬の価格は安いですし、シーケンシング時間は25短い。しかし、エラーレートとシーケンスのメガベース当たりのコストは、イルミナとSOLIDプラットフォームに比べて高くなっている。異なるプラットフォームは、独自の長所と短所を持っており、データ解析のために異なる方法を必要とする。ナンプラーTFORMは、配列決定の目的や資金の利用可能性に基づいて選択する必要があります。

本稿では、例として、イルミナRNA-のSeqプラットフォームを取る。我々は、EMLの細胞の自己再生および分化において重要な調節因子を調査するためのモデル系としてEML細胞を使用し、発現量の計算および新規な転写産物を検出するためのRNA-配列ライブラリーの構築およびデータ分析の詳細な方法を提供した。我々は、機能テスト( 例えば shRNAのノックダウン)と結合EMLモデルシステム2のRNA-seqの研究は、造血分化の初期段階の分子機構を理解する上での強力なアプローチを提供し、として機能することができるという本発明者らの以前の刊行物に示されている一般に、細胞の自己再生および分化の分析のためのモデル。

Protocol

1. EML細胞培養およびシステムおよび磁気細胞ソーティングの使用LIN-CD34 +およびLIN-CD34-細胞の分離蛍光を活性化細胞選別法幹細胞因子コレクションのベビーハムスター腎臓(BHK)細胞培養培地の調製: 37℃の細胞培養インキュベーター中、5%CO 2で25cm 2のフラスコ( 表1)、10%FBSを含むDMEM培地中で培養BHK細胞。 細胞が80まで成長する場合 – 90…

Representative Results

リン- CD34 +およびCD34-リン-EML細胞において差次的に発現される遺伝子を分析するために、我々は、RNA配列の技術を使用した。 図1は、手順のワークフローを示している。磁気細胞選別による系統陰性細胞の単離後、我々は、LIN-SCA + CD34 +およびFACSアリアを使用してLIN-SCA-CD34-細胞を分離した。リン富化EML細胞を、抗CD34、抗のSca1および系統カクテル抗体で染色した。唯一のリニア細?…

Discussion

哺乳動物のトランスクリプトームは、34〜38は非常に複雑です。 RNA-配列技術はまた、遺伝子発現解析のための他の方法に勝る多くの利点を有する新規な転写産物の検出および一塩基変化の検出など 、トランスクリプトーム解析の研究においてますます重要な役割を果たしている。冒頭で述べたように、マイクロアレイのハイブリダイゼーションのアーチファクトを克服す…

Divulgations

The authors have nothing to disclose.

Acknowledgements

JQW, SZ, SD and KC are supported by grant from the National Institutes of Health and the Staman Ogilvie Fund—Memorial Hermann Foundation.

Materials

Antibiotic-Antimycotic Invitrogen 15240-062 BHK cell culture
Anti-Mouse CD34 FITC eBioscience 11-0341-81 FACS sorting
Anti-Mouse Ly-6A/E (Sca-1) PE eBioscience 12-5981-81 FACS sorting
APC Mouse Lineage Antibody Cocktail BD Biosciences 558074 FACS sorting
BD FACSAria Cell Sorter BD Biosciences Special offer sysmtem FACS sorting
Corning™ Cell Culture Treated Flasks 75cm2 Corning incorporated 430641 Cell culture
Corning™ Cell Culture Treated Flasks 25cm2 Corning incorporated 430639 Cell culture
Deoxyribonuclease I, Amplification Grade Invitrogen 18068-015 Library preparation
DMEM Invitrogen 11965-092 BHK cell culture
DPBS Gibco 14190 Cell culture
HI FBS  Invitrogen 16140071 BHK cell culture
Horse Serum Invitrogen 16050-122 EML cell culture
IMDM HyClone SH30228.02 EML cell culture
L-Glutamine Invitrogen 25030-081 Cell culture
Lineage Cell Depletion Kit, mouse  Miltenyi Biotec 130-090-858 Isolation of lineage negative cells
NanoVue Plus spectrophotometer  GE Healthcare 28-9569-62 Quality control
Thermo Scientific™ Napco™ 8000 Water-Jacketed CO2 Incubators Thermo Scientific 15-497-002  Cell culture
Penicillin-Streptomycin Invitrogen 15140-122 EML cell culture
TRIzol® Reagent Invitrogen 15596-018 RNA exraction
TruSeq™ RNA Sample Prep Kit v2 -Set B (48rxn) Illumina RS-122-2002 Library preparation
2100 Electrophoresis Bioanalyzer Instrument  Agilent G2939AA Quality control
0.25% Trypsin-EDTA Gibco 25200 Cell culture
0.45 µm Syringe Filters Nalgene 190-2545 Cell culture

References

  1. Chambers, S. M., Goodell, M. A. Hematopoietic stem cell aging: wrinkles in stem cell potential. Stem Cell Rev. 3, 201-211 (2007).
  2. Wu, J. Q., et al. Tcf7 is an important regulator of the switch of self-renewal and differentiation in a multipotential hematopoietic cell line. PLoS genetics. 8, (2012).
  3. Ye, Z. J., et al. Complex interactions in EML cell stimulation by stem cell factor and IL-3. Proceedings of the National Academy of Sciences of the United States of America. 108, 4882-4887 (2011).
  4. Tsai, S., Bartelmez, S., Sitnicka, E., Collins, S. Lymphohematopoietic progenitors immortalized by a retroviral vector harboring a dominant-negative retinoic acid receptor can recapitulate lymphoid, myeloid, and erythroid development. Genes Dev. 8, 2831-2841 (1994).
  5. Weiler, S. R., et al. D3: a gene induced during myeloid cell differentiation of Linlo c-Kit+ Sca-1(+) progenitor cells. Blood. 93, 527-536 (1999).
  6. Ye, Z. J., Kluger, Y., Lian, Z., Weissman, S. M. Two types of precursor cells in a multipotential hematopoietic cell line. Proc Natl Acad Sci U S A. 102, 18461-18466 (2005).
  7. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10, 57-63 (2009).
  8. Chu, Y., Corey, D. R. RNA sequencing: platform selection, experimental design, and data interpretation. Nucleic acid therapeutics. 22, 271-274 (2012).
  9. Hornett, E. A., Wheat, C. W. Quantitative RNA-Seq analysis in non-model species: assessing transcriptome assemblies as a scaffold and the utility of evolutionary divergent genomic reference species. BMC genomics. 13, 361 (2012).
  10. Eswaran, J., et al. RNA sequencing of cancer reveals novel splicing alterations. Scientific reports. 3, 1689 (2013).
  11. Wang, E. T., et al. Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476 (2008).
  12. Wu, J. Q., et al. Dynamic transcriptomes during neural differentiation of human embryonic stem cells revealed by short, long, and paired-end sequencing. Proceedings of the National Academy of Sciences of the United States of America. 107, 5254-5259 (2010).
  13. Loraine, A. E., McCormick, S., Estrada, A., Patel, K., Qin, P. RNA-seq of Arabidopsis pollen uncovers novel transcription and alternative splicing. Plant physiology. 162, 1092-1109 (2013).
  14. Edgren, H., et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome biology. 12, 6 (2011).
  15. Ilott, N. E., Ponting, C. P. Predicting long non-coding RNAs using RNA sequencing. Methods. 63, 50-59 (2013).
  16. Sun, L., et al. Prediction of novel long non-coding RNAs based on RNA-Seq data of mouse Klf1 knockout study. BMC bioinformatics. 13, 331 (2012).
  17. Luo, S. MicroRNA expression analysis using the Illumina microRNA-Seq Platform. Methods in molecular biology. 822, 183-188 (2012).
  18. Bolduc, F., Hoareau, C., St-Pierre, P., Perreault, J. P. In-depth sequencing of the siRNAs associated with peach latent mosaic viroid infection. BMC molecular biology. 11, 16 (2010).
  19. Chepelev, I., Wei, G., Tang, Q., Zhao, K. Detection of single nucleotide variations in expressed exons of the human genome using RNA-Seq. Nucleic acids research. 37, 106 (2009).
  20. Djari, A., et al. Gene-based single nucleotide polymorphism discovery in bovine muscle using next-generation transcriptomic sequencing. BMC genomics. 14, 307 (2013).
  21. Murphy, D. Gene expression studies using microarrays: principles, problems, and prospects. Advances in physiology education. 26, 256-270 (2002).
  22. Chen, K., et al. RNA-seq characterization of spinal cord injury transcriptome in acute/subacute phases: a resource for understanding the pathology at the systems level. PLoS one. 8, 72567 (2013).
  23. Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome research. 18, 1509-1517 (2008).
  24. Ramskold, D., Kavak, E., Sandberg, R. How to analyze gene expression using RNA-sequencing data. Methods in molecular biology. 802, 259-274 (2012).
  25. Glenn, T. C. Field guide to next-generation DNA sequencers. Mol Ecol Resour. 11, 759-769 (2011).
  26. Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature protocols. 7, 562-578 (2012).
  27. Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
  28. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  29. Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature. 28, 511-515 (2010).
  30. Anders, S., Huber, W. Differential expression analysis for sequence count data. Genome biology. 11, 106 (2010).
  31. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  32. Cheranova, D., et al. RNA-seq analysis of transcriptomes in thrombin-treated and control human pulmonary microvascular endothelial cells. J Vis Exp. , (2013).
  33. Zhang, H. M., et al. AnimalTFDB: a comprehensive animal transcription factor database. Nucleic acids research. 40, 144-149 (2012).
  34. Wu, J. Q., et al. Systematic analysis of transcribed loci in ENCODE regions using RACE sequencing reveals extensive transcription in the human genome. Genome Biol. 9, 3 (2008).
  35. Wu, J. Q., et al. Large-scale RT-PCR recovery of full-length cDNA clones. Biotechniques. 36, 690-696 (2004).
  36. Wu, J. Q., Shteynberg, D., Arumugam, M., Gibbs, R. A., Brent, M. R. Identification of rat genes by TWINSCAN gene prediction, RT-PCR, and direct sequencing. Genome Res. 14, 665-671 (2004).
  37. Dewey, C., et al. Accurate identification of novel human genes through simultaneous gene prediction in human, mouse, and rat. Genome Res. 14, 661-664 (2004).
  38. Wu, J. . Characterize Mammalian Transcriptome Complexity. , (2011).
check_url/fr/52104?article_type=t

Play Video

Citer Cet Article
Zong, S., Deng, S., Chen, K., Wu, J. Q. Identification of Key Factors Regulating Self-renewal and Differentiation in EML Hematopoietic Precursor Cells by RNA-sequencing Analysis. J. Vis. Exp. (93), e52104, doi:10.3791/52104 (2014).

View Video