Summary

RNA-seqを用いた分子進化と遺伝子発現を探るバイオインフォマティクスのパイプライン

Published: May 28, 2021
doi:

Summary

このプロトコルの目的は、RNAシーケンシングデータを用いて候補遺伝子の進化と発現を調べるものです。

Abstract

全ゲノムやトランスクリプトームデータなどの大規模なデータセットを蒸留して報告することは、しばしば困難な作業です。結果を分解する1つの方法は、生物にとって重要な1つ以上の遺伝子ファミリーに焦点を当て、研究することです。このプロトコルでは、系統を生成し、目的の遺伝子の発現を定量化するためのバイオインフォマティクスステップの概要を説明する。系統樹は、遺伝子が種の内外でどのように進化しているかについての洞察を与えるだけでなく、鳥類学を明らかにすることができます。これらの結果は、RNA-seqデータを用いて、異なる個体または組織におけるこれらの遺伝子の発現を比較するために増強することができる。分子進化と発現の研究は、種間の遺伝子機能の進化と保存のモードを明らかにすることができます。遺伝子ファミリーの特徴付けは、将来の研究のスプリングボードとして機能し、新しいゲノムまたはトランスクリプトーム論文で重要な遺伝子ファミリーを強調することができます。

Introduction

シーケンシング技術の進歩は、非モデル生物のゲノムおよびトランスクリプトムのシーケンシングを促進してきた。多くの生物からのDNAとRNAのシーケンシングの実現可能性の増加に加えて、関心のある遺伝子を研究するために豊富なデータが一般に公開されています。このプロトコルの目的は、目的の生物に重要な役割を果たす可能性のある遺伝子の分子進化と発現を調査するためのバイオインフォマティクスのステップを提供することです。

遺伝子や遺伝子ファミリーの進化を調査することで、生物学的システムの進化に関する洞察を得ることができます。遺伝子ファミリーのメンバーは、通常、保存されたモチーフまたは相同遺伝子配列を同定することによって決定される。遺伝子ファミリーの進化は、以前は遠縁モデル生物1のゲノムを用いて調べられた。このアプローチの制限は、これらの遺伝子ファミリーが密接に関連する種でどのように進化し、異なる環境選択的圧力の役割が明確でないということです。このプロトコルでは、密接に関連する種のホモログの探索を含む。系統レベルで系統を生成することで、保存された遺伝子や系統特異的な重複などの遺伝子ファミリーの進化の傾向に注意することができます。このレベルでは、遺伝子がオルソログかパラログかを調べることもできます。多くのホモログは互いに同様に機能する可能性が高いが、必ずしも2の場合ではない。これらの研究に系統樹を組み込むことは、これらの相同遺伝子がオルソログであるかどうかを解決するために重要である。真核生物において、多くのオルソログは、哺乳類タンパク質が酵母オルソログ3の機能を回復する能力によって証明されるように、細胞内で同様の機能を保持している。しかし、非オーソリンス遺伝子が特徴付き機能4を行う場合があります。

系統樹は遺伝子と種の関係を引き起じ始めますが、遺伝的関係だけに基づいて機能を割り当てることはできません。遺伝子発現解析と機能性アノテーションと濃縮分析を組み合わせることで、遺伝子機能を強力にサポートします。遺伝子発現を定量化し、個人や組織の種類を比較できるケースは、潜在的な機能をより伝えることができます。以下のプロトコルは、Hydra下流7のオプシン遺伝子の調査に用いられる方法に従うが、それらはあらゆる種およびあらゆる遺伝子ファミリーに適用することができる。このような研究の結果は、非モデル生物における遺伝子機能および遺伝子ネットワークのさらなる調査のための基礎を提供する。一例として、光伝達カスケードを開始するタンパク質であるオプシンの系統の調査は、眼および光検出8、9、10、11の進化にコンテキストを与える。この場合、非モデル生物、特にクニダリアンやクテノフォアなどの基底動物種は、クレード12、13、14にわたる光変調カスケードおよび視力の保全または変化解明することができる。同様に、他の遺伝子ファミリーの系統、発現、ネットワークを決定することは、適応の根底にある分子メカニズムについて私たちに知らせるでしょう。

Protocol

このプロトコルは、UCアーバイン動物ケアガイドラインに従います。 1. RNA-セクライブラリ調製 RNAを分離するには、以下の方法を用いた。 サンプルを収集します。RNAを後で抽出する場合、フラッシュは、サンプルを凍結するか、RNAストレージ溶液15(材料の表)に置く。 目的の組織を分離するために生物を安楽死させ、解…

Representative Results

上記の方法は 図1 に要約され、 ヒドラ下品 組織のデータセットに適用された。 H. 下垂体 は、サンゴ、クラゲ、イソギンチャクを含むフィラム クニダリア に属する淡水無脊椎動物です。 H.下品は 出芽によって無性を再現することができ、二分すると頭と足を再生することができます。本研究では、 ヒドラ7における?…

Discussion

このプロトコルの目的は、RNA-seqデータを用いて遺伝子ファミリーを特徴付けるためのステップの概要を提供することにある。これらの方法は、さまざまな種やデータセット4、3435に対して機能することが証明されています。ここで確立されたパイプラインは簡素化されており、バイオインフォマティクスの初心者が続く…

Divulgations

The authors have nothing to disclose.

Acknowledgements

アドリアナ・ブリスコ、ギル・スミス、ラビ・ムラド、アリーン・G・レンゲルに、これらのステップのいくつかをワークフローに組み込む際のアドバイスとガイダンスに感謝します。また、キャサリン・ウィリアムズ、エリザベート・レボア、ナターシャ・ピッチャーニの原稿に対するコメントに感謝しています。この研究の一部は、ジョージ・E・ヒューイット医学研究フェローシップによって支援されました.M.M。

Materials

Bioanalyzer-DNA kit Agilent 5067-4626 wet lab materials
Bioanalyzer-RNA kit Agilent 5067-1513 wet lab materials
BLAST+ v. 2.8.1 On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC) On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0 On computer cluster
Bowtie v. 1.0.0 On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended) NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1 On computer cluster
edgeR v. 3.26.8 (in R) In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0 On computer cluster
Java v. 11.0.2 On computer cluster
MEGA7 (on your PC) On local computer
https://www.megasoftware.net
MEGAX v. 0.1 On local computer
https://www.megasoftware.net
NucleoSpin RNA II kit Macherey-Nagel 740955.5 wet lab materials
perl 5.30.3 On computer cluster
python On computer cluster
Qubit 2.0 Fluorometer ThermoFisher Q32866 wet lab materials
R v.4.0.0 On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlater ThermoFisher AM7021 wet lab materials
RNeasy kit Qiagen 74104 wet lab materials
RSEM v. 1.3.0 Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335 On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3 Computer software
SRA Toolkit v. 2.8.1 On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0c On computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4d On computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0 On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35 On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5 On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzol ThermoFisher 15596018 wet lab materials
TruSeq RNA Library Prep Kit v2 Illumina RS-122-2001 wet lab materials
TURBO DNA-free Kit ThermoFisher AM1907 wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

References

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology – B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. . RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra’s periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. . OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. . edgeR differential expression analysis of digital gene expression data User’s Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).
check_url/fr/61633?article_type=t

Play Video

Citer Cet Article
Macias-Muñoz, A., Mortazavi, A. A Bioinformatics Pipeline for Investigating Molecular Evolution and Gene Expression using RNA-seq. J. Vis. Exp. (171), e61633, doi:10.3791/61633 (2021).

View Video