사용 하 여 계통 발생 분석은 진 핵 유전자 원산지 조사

Published: August 14, 2018

doi:

Dechun Zhang*¹, Xianzhao Kan*², Sarah Elizabeth Huss, Lan Jiang, Li-Qing Chen, Yibing Hu

¹Key Laboratory of Three Gorges Regional Plant Genetics and Germplasm Enhancement (CTGU)/Biotechnology Research Center,China Three Gorges University, ²The Institute of Bioinformatics, College of Life Sciences,Anhui Normal University, ³Department of Plant Biology,University of Illinois at Urbana-Champaign, ⁴College of Resources & Environmental Sciences,Nanjing Agricultural University

Summary

순서 상 동 자의 진핵생물과 SemiSWEETs에서 prokaryotes에서에 따라 계통 발생 나무를 구성 하는 방법을 설명 합니다. 계통 발생 분석은 다른 유기 체 그룹에서 동종 단백질 또는 유전자 진화 relatedness를 설명 하는 유용한 도구.

Abstract

계통 발생 분석을 사용 하 여 뉴클레오티드 또는 아미노산 시퀀스 또는 다른 매개 변수를 도메인 시퀀스 등 3 차원 구조는 분자에서 다른 taxa (분류 단위) 사이 진화 관계를 표시 하는 트리를 구성 수준입니다. 계통 발생 분석 사용할 수 있습니다 개별 taxon, 내 도메인 관계 조사를 실질적인 받은 생물 형태학과 생리학, 하지만 어떤 연구자 부족으로 인해 화석 증거에 대 한 변경에 대 한 특히는 생물의 긴 진화 역사 또는 담았다의 부족.

이 텍스트는 계통 발생 방법, 아미노산 순서 정렬 Clustal 오메가, 그리고 둘 다 최대 가능성 (ML) 분자 진화 유전학의를 사용 하 여 후속 계통 발생 나무 건축을 사용 하 여를 사용 하 여에 대 한 자세한 프로토콜 설명 분석 (메가) 및 MrBayes 통해 베이지안 추론. 진 핵 설탕 것 이다 결국 수출 전송기 수 (달콤한) 유전자의 기원 조사, 228 과자 35 달콤한 단백질에서 단 세포 진핵생물과 원핵생물에서 57 약간 단 단백질을 포함 하 여 분석 되었다. 흥미롭게도, SemiSWEETs 원핵생물에서 찾아냈다 그러나 과자는 진핵생물에서 발견 됐다. 이론적으로 다른 방법을 사용 하 여 건설의 계통 발생 나무 2 개는 지속적으로 첫 번째 핵 달콤한 유전자 세균성 약간 단 유전자와 archaeal 약간 단 유전자의 융합에서 줄기 수 있습니다 제안 했다. 그것은 하나는 결론을 끌기 위해는 계통 발생 분석에만 기반으로 어렵거나 심지어 실험 방법을 통해 분별 하는 다른 taxa 사이의 기본 관계를 설명 하는 데 유용 하지만 신중 해야 지적 가치 .

Introduction

DNA 또는 RNA 순서 생리 및 생 화 확 적인 방법을 통해 분석 하거나 형태학 및 화석 증거를 통해 관찰 될 수 있는 기본 고기에 대 한 유전 정보를가지고. 의미에서 유전 정보 외부 고기 때문에 전자는 후자에 대 한 기초 평가 보다 더 안정적입니다. 진화 연구, 화석 증거에서는 매우 직접적이 고 설득력 있는입니다. 그러나, 미생물와 같은 많은 유기 체를 긴 지질 시대 화석 형성 작은 기회가 있다. 따라서, 뉴클레오티드 시퀀스 및 관련된 현존 생물에서 아미노산 시퀀스 등 분자 정보 진화 관계¹을 탐험에 대 한 가치는 있습니다. 현재 연구에서 기본적인 계통 발생 지식과 배우기 쉬운 프로토콜의 간단한 소개 자신의 계통 발생 나무를 구성 하는 이민자를 위한 제공 했다.

동종 유전자, 세포, 또는 심지어 유기²계통 발생 관계를 추론 (뉴클레오티드) DNA와 단백질 (아미노산) 시퀀스를 사용할 수 있습니다. DNA 시퀀스 동안 진화 변화에 의해 영향을 받을 가능성이 더 높습니다. 대조적으로, 아미노산 시퀀스는 훨씬 더 안정 주어진 뉴클레오티드 시퀀스에 동의어 돌연변이 아미노산 시퀀스에서 돌연변이 발생 하지 않습니다. 그 결과, DNA 시퀀스는 반면 아미노산 시퀀스는 먼 관련된 생물³에서 동종 유전자에 대 한 적절 한 밀접 하 게 관련된 유기 체에서 동종 유전자의 비교를 위해 유용 합니다.

아미노산의 맞춤으로 시작 하는 계통 발생 분석 또는 시퀀스, FASTA 형식, 즉, 상 상속 또는 표현 단백질에 나열 된 뉴클레오티드 시퀀스⁴ 한 주석된 게놈 시퀀싱 데이터베이스⁵ 에서 검색 RNA 순서 또는 DNA 순서. 그것은 높은-품질 시퀀스 분석을 위해 수집 하는 것이 중요 하만 동종 시퀀스 계통 발생 관계를 분석 하는 데 사용할 수 있습니다. 많은 다른 플랫폼 Clustal W, Clustal X, 근육, T-커피, MAFFT, 시퀀스 정렬에 사용할 수 있습니다. Clustal 오메가⁶^,⁷ (http://www.ebi.ac.uk/Tools/msa/clustalo/), 온라인으로 사용할 수 또는 무료로 다운로드 될 수 있다는 가장 널리 사용 되는. 정렬 도구는 많은 매개 변수를 기본 매개 변수는 대부분의 경우에서 잘 작동 하지만 사용자 정렬, 시작 하기 전에 조정할 수 있습니다. 프로세스가 완료 되 면 정렬된 시퀀스 다음 단계에 대 한 올바른 형식으로 저장 해야 합니다. 그들은 다음 편집 한다 또는 메가 하 여 계통 발생 나무 건축 (를 포함 하 여 아미노산 약어 및 하이픈 길이가 되도록 시퀀스 필요 하기 때문에 BioEdit, 같은 편집 소프트웨어를 사용 하 여 손질. 정렬 된 시퀀스에는 아미노산 또는 뉴클레오티드 없이 어떤 위치 든 지 하이픈으로 표시는 “-“). 일반적으로, 튀어나온 아미노산 또는 뉴클레오티드 맞춤의 양쪽 끝에 모두 제거 되어야 한다. 또한, 열 맞춤에서 잘못 정렬 된 시퀀스를 포함 하는 그들은 약간 귀중 한 정보를 전달 하 고 때로는 혼란 또는 거짓 정보³를 줄 수 있기 때문에 삭제할 수 있습니다. 이 시간에 또는 이후 트리 건설 단계에서 하나 이상의 하이픈을 포함 하는 열을 삭제할 수 있습니다. 또는, 그들은 계통 발생 계산에 사용할 수 있습니다. 순서 정렬 및 트리밍 완료 되 면, 정렬된 시퀀스 FASTA 형식, 또는 차후 사용을 위해 원하는 포맷에 저장 한다.

많은 소프트웨어 플랫폼 다른 방법 또는 알고리즘을 사용 하 여 트리 건설 기능을 제공 합니다. 일반적으로 메서드는 거리 매트릭스 방법 또는 개별 데이터 방법으로 나눌 수 있다. 거리 매트릭스 방법 간단 하 고 빠른 계산, 개별 데이터 메서드는 복잡 하 고 시간이 많이 걸리는 동안에. 공유의 아미노산 또는 뉴클레오티드 순서, 거리 행렬 방법의 높은 수준으로 매우 밀접 하 게 관련된 taxa에 대 한 (이웃 합류: 뉴저지; 산술 평균 unweighted 쌍 그룹 방법: UPGMA) 적합 한; 먼 관련된 taxa, 개별 데이터 방법에 대 한 (최대 가능성: ML; 최대 간결: MP; 베이지안 추론) 최적의³^,⁸입니다. 이 연구에서는 메가 (6.0.6) 및 베이지안 추론 (MrBayes 3.2) ML 방법 계통 발생 나무⁹를 생성에 적용 했다. 이상적으로, 적절 한 모델 및 매개 변수 사용 하는 다른 방법에서 파생 된 결과 일치, 있을 수 있습니다 그리고 그들은 따라서 더 안정적이 고 설득력 있는.

¹⁰메가 사용 하 여 건설 ML 계통 발생 나무에 대 한 프로그램으로 FASTA 형태로 정렬된 시퀀스 파일을 업로드 해야 합니다. 첫 번째 단계는 다음 업로드 된 데이터에 대 한 최적의 대체 모델을 선택 하는 것입니다. 업로드 된 순서에 따라 모든 사용할 수 있는 대체 모델을 비교 하 고 그들의 최종 점수 결과 테이블에 표시 됩니다. (테이블에 처음 나열) 작은 베이지안 정보 기준 (의 BIC) 점수와 모델을 선택 권장 모델 ML 매개 변수를 설정 하 고 계산을 시작. 계산 시간 로드 데이터 (길이 시퀀스 및 taxa의 수)의 복잡 하 고 프로그램은 실행 하는 컴퓨터의 성능에 따라 몇 일 분에서 변화 한다. 계산이 완료 되 면, 계통 발생 나무는 새 창에 표시 됩니다. “FileName.mat”로 파일을 저장 합니다. 나무의 모양을 지정 하는 매개 변수를 설정한 후 다시 한 번 저장 합니다. 이 메서드를 사용 하 여 메가 게시 학년 계통 발생 나무 그림을 생성할 수 있습니다.

MrBayes¹¹나무 건설, 대 한 첫 번째 단계는 넥서스 형식 (파일 형식으로.nex)으로 보통 FASTA 형태로 나열 된 정렬 된 순서를 변환 하입니다. FASTA 파일 넥서스 형식으로 변형 하는 것은 메가에서 처리할 수 있습니다. 다음, 넥서스 형태로 정렬된 순서 MrBayes에 업로드할 수 있습니다. 파일이 성공적으로 업로드 하는 경우 트리 계산에 대 한 상세한 매개 변수를 지정 합니다. 이러한 매개 변수 커플링, ngen 번호 아미노산 대체 모델, 변형 률, 체인 번호 마르코프 연쇄 몬테 카를로 (MCMC)에 대 한 세부 정보를 포함, 분할 주파수의 표준 편차를 평균 하 고. 이러한 매개 변수를 지정한 후 계산을 시작 합니다. 결국, ASC II 코드, 보여주는 하나의 clade 신뢰성 및 다른 표시 지점 길이, 2 개의 나무 숫자는 화면에 표시 됩니다.

나무 결과 “FileName.nex.con”으로 자동으로 저장 됩니다. 이 트리 파일을 열 수 및 기관에 의해 편집 그리고 기관에 표시 하는 그림 추가 수 있도록 게시를 위해 더 적당 한 수정할 수 있습니다.

이 연구에서는 단 세포 진핵생물에서 35 자와 원핵생물에서 57 SemiSWEETs를 포함 하 여 228 달콤한 단백질, 예를 들어 분석 했다. 과자 및 SemiSWEETs는 막¹²^,¹³에 걸쳐 포도 당과 당, 또는 자당 전송기 특징 이었다. 계통 발생 분석 과자 포함 된 두 개의 MtN3/타 액 도메인 archaeon¹⁴와 세균성 SemiSWEET의 진화 융합에서 파생 될 수 있습니다 제안 합니다.

Protocol

1. 시퀀스 정렬 진 핵 정하고 별도 문서에 간결한 SemiSWEET의 아미노산 시퀀스를 수집 하 고 FASTA 형태로 그들을 나열. 유사성 검색 기본 로컬 맞춤 검색 도구 (폭발) 도구를 사용 하 여 생명 공학 정보 (NCBI), 유럽 분자 생물학 실험실 (EMBL), 및 일본 (DDBJ) 데이터베이스의 DNA 데이터 은행에 대 한 국립 센터에서 시퀀스 다운로드. 예제 파일에서 진핵생물과 원핵생물의 단일 MtN…

Representative Results

계통 발생 나무 35 달콤한 시퀀스의 첫 번째 MtN3/타 액 도메인의 모든 한 clade와 다른 clade로 클러스터 달콤한 시퀀스의 두 번째 MtN3/타 액 도메인으로 클러스터를 표시 합니다. 또한, 과자 및 SemiSWEETs의 정렬 결과 표시 일부 SemiSWEETs α-Proteobacteria에서 달콤한 시퀀스의 첫 번째 MtN3/타 액 도메인으로 정렬 SemiSWEETs Methanobacteria (archaea)에서 두 번째 MtN3/타 액과 정렬 하는 반면 달콤…

Discussion

그것은 뉴클레오티드 또는 아미노산 시퀀스⁸에 따라 계통 발생 나무를 만들기 위해 생물 학적 연구에 점점 더 인기 끌고있다. 일반적으로, 시퀀스 정렬, 계통 발생 나무 계산 결과의 시각화 및 적당 한 방법 또는 알고리즘, 정렬 된 시퀀스의 평가 포함 하는 실천의 세 가지 중요 한 단계가 있습니다. 제시 연구에서 열 정렬의 3 라운드 실시 했다: 첫째, 첫 번째 및 두 번째 MtN3/타 액 …

Disclosures

The authors have nothing to disclose.

Acknowledgements

이 작품은 국립 자연 과학 재단의 중국 (31371596), 바이오 기술 연구 센터, 중국 3 협곡 대학 (2016KBC04), 그리고 장쑤 성, 중국 (BK20151424)의 자연 과학 재단에 의해 지원 되었다.

Materials

Adobe Illustration			a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit			a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega			a package for making multiple sequence alignments of amino acid or nucleotide sequences. http://www.clustal.org/
CorelDRAW			a graphic design software. Copyright © 2017 Corel Corporation
FigTree			a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA			MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes			an Bayesian phylogenetic inference tool
NVIDIA			a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP			Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop			a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM			a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group – Copyright 2007-2009
TMHMM			a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter			4GB memory, Core 2 or above CPU. Windows 7, Windows 10

References

Nei, M., Kumar, S. . Molecular Evolution and Phylogenetics. , (2000).
Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

사용 하 여 계통 발생 분석은 진 핵 유전자 원산지 조사

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

사용 하 여 계통 발생 분석은 진 핵 유전자 원산지 조사

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below