Summary

RNA-seq를 사용하여 분자 진화 및 유전자 발현을 조사하기 위한 생물정보학 파이프라인

Published: May 28, 2021
doi:

Summary

이 프로토콜의 목적은 RNA 염기서열 분석 데이터를 사용하여 후보 유전자의 진화 와 발현을 조사하는 것이다.

Abstract

전체 게놈 또는 전사 데이터와 같은 대규모 데이터 집합을 증류하고 보고하는 것은 종종 어려운 작업입니다. 결과를 분해하는 한 가지 방법은 유기체와 연구에 중요한 하나 이상의 유전자 가족에 집중하는 것입니다. 이 프로토콜에서, 우리는 생물학적 단계를 설명하고 필로겐을 생성하고 관심있는 유전자의 표현을 정량화합니다. 필로유전학 나무는 유전자가 종 안팎에서 어떻게 진화하고 있는지, 그리고 종이학을 드러내는지에 대한 통찰력을 제공할 수 있습니다. 이러한 결과는 RNA-seq 데이터를 사용하여 상이한 개인 또는 조직에서 이러한 유전자의 발현을 비교하는 것으로 향상될 수 있다. 분자 진화와 발현의 연구는 종 사이 유전자 기능의 진화 그리고 보존의 모드를 밝힐 수 있습니다. 유전자 가족의 특성화는 미래 연구를 위한 발판으로 봉사할 수 있고 새로운 게놈 또는 전사 종이에 있는 중요한 유전자 가족을 강조할 수 있습니다.

Introduction

시퀀싱 기술의 발전은 비모델 유기체의 게놈 및 전사의 시퀀싱을 용이하게 했습니다. 많은 유기체에서 DNA와 RNA를 시퀀싱하는 것의 증가된 타당성 이외에, 관심 있는 유전자를 연구하기 위하여 데이터의 풍부가 공개적으로 유효합니다. 이 프로토콜의 목적은 관심있는 유기체에서 중요한 역할을 할 수있는 유전자의 분자 진화 와 발현을 조사하기 위한 생물 정보 학적 단계를 제공하는 것입니다.

유전자 또는 유전자 가족의 진화를 조사하는 것은 생물학 시스템의 진화에 대한 통찰력을 제공할 수 있습니다. 유전자 가족의 구성원은 전형적으로 보존된 모티프 또는 동상적 유전자 서열을 식별하여 결정됩니다. 유전자 가족 진화는 이전에 먼 관련 모형 유기체1에서게놈을 사용하여 조사되었습니다. 이 접근에 제한은 이 유전자 가족이 밀접하게 관련된 종및 다른 환경 선택적인 압력의 역할에서 어떻게 발전하는지 명확하지 않다는 것입니다. 이 프로토콜에서는 밀접하게 관련된 종의 동종에 대한 검색이 포함됩니다. 필럼 수준에서 필로겐을 생성함으로써 보존 된 유전자 또는 혈통 별 복제와 같은 유전자 가족 진화의 동향을 주목할 수 있습니다. 이 수준에서, 우리는 또한 유전자가 정형 소또는 패러로그인지 여부를 조사할 수 있습니다. 많은 동형 모로그가 서로 유사하게 작동할 가능성이 있지만 반드시2는아닙니다. 이 연구 결과에 있는 phylogenetic 나무를 통합하는 것은 이 동종 유전자가 정형술인지 여부를 해결하는 것이 중요합니다. 진핵생물에서, 많은 정형술은 효모 정형술3의기능을 복원하는 포유류 단백질의 능력에 의해 입증된 바와 같이 세포 내에서 유사한 기능을 유지한다. 그러나, 비직교 유전자가 특징적인 기능4를수행하는 경우가 있다.

필로유전학 나무는 유전자와 종 사이의 관계를 묘사하기 시작하지만, 기능은 유전 적 관계에 따라 전적으로 할당 할 수 없습니다. 기능성 주석 및 농축 분석과 결합된 유전자 발현 연구는 유전자 기능에 대한 강력한 지원을 제공합니다. 유전자 발현이 개인 또는 조직 모형을 통해 정량화되고 비교될 수 있는 케이스는 잠재적인 기능의 더 많은 말하기일 수 있습니다. 다음 프로토콜은 히드라 저속가스7에서opsin 유전자를 조사하는 데 사용되는 방법을 따르지만 모든 종 및 유전자 패밀리에 적용 될 수 있습니다. 이러한 연구의 결과는 비 모델 유기체에서 유전자 기능 및 유전자 네트워크에 대한 추가 조사를위한 기초를 제공합니다. 예를 들어, 광유도 캐스케이드를 시작하는 단백질인 opsins의 물리학에 대한 조사는 눈과 광 검출8,9,10,11의진화에 대한맥락을제공한다. 이 경우, 비모델 유기체는 특히 cnidarians 또는 ctenophores와 같은 기저 동물 종은12,13,14에걸쳐 광반유도 캐스케이드 및 시력의 보존 또는 변화를 해명할 수 있다. 유사하 게, 다른 유전자 가족의 phylogeny, 발현 및 네트워크를 결정 하는 것은 분자 메커니즘 기본 적응에 대해 알려 줄 것 이다.

Protocol

이 프로토콜은 UC 어바인 동물 관리 지침을 따릅니다. 1. RNA-seq 라이브러리 준비 RNA를 다음과 같은 방법을 사용하여 분리한다. 샘플을 수집합니다. RNA를 나중에 추출하는 경우, RNA 저장용액(15)에 시료 또는 배치를동결한다(재료의 표). 관심 있는 조직을 분리하기 위해 유기체를 안락사시키고 해부한다. 추출 키트를 사…

Representative Results

위의 메서드는 그림 1에 요약되어 있으며 히드라 저속조직의 데이터 집합에 적용되었습니다. H. 저속한 은 또한 산호, 해파리, 바다 말미잘을 포함하는 phylum Cnidaria에 속하는 담수 무척추 동물입니다. H. 저속한 신진에 의해 무성을 재현할 수 있으며 양분 시 머리와 발을 재생할 수 있습니다. 이 연구에서는 히드라7에서opsin ?…

Discussion

이 프로토콜의 목적은 RNA-seq 데이터를 사용하여 유전자 가족을 특성화하기 위한 단계의 개요를 제공하는 것이다. 이러한 방법은 다양한 종 및 데이터 집합4,34,35에대해 작동하는 것으로 입증되었습니다. 여기에 설립 된 파이프 라인은 단순화되었으며 생물 정보학의 초보자가 뒤따를 만큼 쉬워야합니다. 프로토콜의 중요성은 ?…

Divulgations

The authors have nothing to disclose.

Acknowledgements

우리는 우리의 워크 플로우에 이러한 단계의 일부를 통합에 조언과 지침을 아드리아나 브리스코, 길 스미스, 라비 무라드와 Aline G. Rangel 감사합니다. 우리는 또한 원고에 대한 의견에 캐서린 윌리엄스, 엘리자베스 렙보아, 나타샤 Picciani에 감사드립니다. 이 작품은 A.M.M 의학 연구 펠로우십을 위한 조지 E. 휴이트 재단에 의해 부분적으로 지원되었습니다.

Materials

Bioanalyzer-DNA kit Agilent 5067-4626 wet lab materials
Bioanalyzer-RNA kit Agilent 5067-1513 wet lab materials
BLAST+ v. 2.8.1 On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC) On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0 On computer cluster
Bowtie v. 1.0.0 On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended) NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1 On computer cluster
edgeR v. 3.26.8 (in R) In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0 On computer cluster
Java v. 11.0.2 On computer cluster
MEGA7 (on your PC) On local computer
https://www.megasoftware.net
MEGAX v. 0.1 On local computer
https://www.megasoftware.net
NucleoSpin RNA II kit Macherey-Nagel 740955.5 wet lab materials
perl 5.30.3 On computer cluster
python On computer cluster
Qubit 2.0 Fluorometer ThermoFisher Q32866 wet lab materials
R v.4.0.0 On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlater ThermoFisher AM7021 wet lab materials
RNeasy kit Qiagen 74104 wet lab materials
RSEM v. 1.3.0 Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335 On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3 Computer software
SRA Toolkit v. 2.8.1 On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0c On computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4d On computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0 On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35 On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5 On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzol ThermoFisher 15596018 wet lab materials
TruSeq RNA Library Prep Kit v2 Illumina RS-122-2001 wet lab materials
TURBO DNA-free Kit ThermoFisher AM1907 wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

References

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology – B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. . RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra’s periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. . OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. . edgeR differential expression analysis of digital gene expression data User’s Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

Play Video

Citer Cet Article
Macias-Muñoz, A., Mortazavi, A. A Bioinformatics Pipeline for Investigating Molecular Evolution and Gene Expression using RNA-seq. J. Vis. Exp. (171), e61633, doi:10.3791/61633 (2021).

View Video