Summary

葡萄全基因组鉴定与表达的综合工作流 E3 泛素连接基因家族的 Meta 分析

Published: December 22, 2017
doi:

Summary

本文介绍了一个基因家族的鉴定和描述的程序, 适用于在 Levadura 的家庭的葡萄Tóxicos 的拟南芥(ATL) E3 泛素酶。

Abstract

家庭中基因的分类和命名可以显著地有助于描述编码蛋白质的多样性, 以及基于几个特征的家庭功能的预测, 如序列主题的存在或特定修饰修改的网站和家庭成员在不同条件下的表达谱。这项工作描述了一个关于基因家族特性的详细的协议。在这里, 这个过程被应用到在 Levadura 中的拟南芥 Tóxicos的描述 (ATL) E3 泛素连接家族的葡萄。这些方法包括家庭成员的全基因组鉴定、基因定位、结构和复制的特征、保守蛋白的分析、蛋白质定位和磷酸化的预测以及基因表达谱在不同的数据集的整个家族。这种程序可以扩展到根据实验目的进一步分析, 可适用于任何基因组的任何植物物种, 为其提供基因数据, 并提供有价值的信息, 以确定感兴趣的候选人为功能性研究, 提供对植物适应环境的分子机制的洞察。

Introduction

在过去的十年中, 对葡萄基因组学进行了大量的研究。葡萄是一种公认的经济相关作物, 它已成为研究果实发育和木本植物对生物和非生物学胁迫反应的模型。在此上下文中,葡萄亚种cv. PN40024 基因组在 2007年1及其更新版本2中的发布导致了 “学” 数据的快速积累和大量高通量的研究。根据所公布的序列数据, 对某一特定基因家族 (通常由分享保守主题的蛋白质、结构和/或功能相似性和进化关系) 的综合分析, 现在可以进行, 以揭示其分子功能, 进化和基因表达谱。这些分析有助于理解基因家族如何控制整个基因组的生理过程。

植物生命周期的许多方面是由泛素介导的关键蛋白降解, 这需要一个 fine-tuned 的营业额, 以确保正常的细胞过程。泛素介导的降解过程的重要组成部分是 E3 泛素酶, 这是负责系统的灵活性, 由于具体目标的招聘3。因此, 这些酶代表一个巨大的基因家族, 约 1400 E3 连接编码基因预测在拟南芥基因组4, 每 E3 泛素连接作用于特定靶蛋白泛。尽管基质特异泛在植物细胞调控中的重要性, 但很少有人知道如何调节泛通路和目标蛋白只在少数情况下被识别。对这种特异性和调节机制的破译首先依赖于系统的不同组成部分的识别和定性, 特别是 E3 酶。在泛素酶中, ATL 亚科的特征是: 在a. 南芥中, 显示一个 RING-H2 手指域5,6, 其中一些在防御和荷尔蒙应答中扮演了一个角色7

定义新基因家族成员的第一个关键步骤是对家庭特征的精确定义, 如一致主题、关键域和蛋白质序列特征。事实上, 基于爆炸分析的所有基因家族成员的可靠检索需要一些强制性的序列特性, 特别是蛋白质的功能/活动, 作为蛋白质的签名。这可以通过先前对其他植物物种的同一基因家族的描述来促进, 或者通过分析不同植物物种中属于同一家族的不同基因认定来分离共同的序列。然后, 家庭成员可以根据国际财团为某种特定植物所定的共同规则, 单独命名。例如, 在小道消息, 这种程序受到了葡萄基因注释 (sNCGGa) 的超级命名委员会的建议, 建立了一个系统系统树的构建, 包括五亚种a. 南芥基因家族成员允许基于核苷酸序列的基因注释8

染色体定位的家庭成员和基因重复调查允许突出的存在, 全基因组或串联复制基因。这种信息似乎有助于解开假定的基因功能, 因为它可能显示功能冗余或揭示不同的情况,, non-functionalization, 新官能化, 或 sub-functionalization9。新的和 sub-functionalization 都是重要的事件, 创造了基因的新奇, 为植物适应变化的环境提供了新型的细胞组件10。特别是, 在葡萄基因组的进化过程中, 祖先基因的重复和新基因的产生是非常频繁的, 而新形成的基因则是来自葡萄的近端和串联重叠, 更有可能产生新函数11

破译基因家族功能的另一个关键因素是组剖面。因此, 可以利用公共数据库访问大量的组数据, 从而利用 large-scale在 “硅片” 表达式分析中为基因家族成员分配假定函数。的确, 特定植物器官中某些基因的奇特表达或对某些压力的反应, 可以给出一些关于在定义条件下相应蛋白质的假定作用的提示, 并支持关于可能的假设sub-functionalization 重复的基因来应对不同的挑战。为此, 重要的是要考虑几个数据集: 这些可以已经可用的基因表达矩阵, 如葡萄器官的全基因组组图谱和发育阶段12, 或者可以通过以下方式生成ad hoc检索特定植物物种的组数据集的定义应力。此外, 一个简单的方法使用两个矩阵, 一个具有成对相似性的数据和另一个具有两两表达系数, 可以用来评价序列相似性和表达模式之间的关系在一个基因家族。

这项工作的目的是提供一个全球性的方法, 定义基因结构, 保守的蛋白质主题, 染色体位置, 基因重复, 和表达模式, 以及预测蛋白质本地化和磷酸化的网站, 以达到植物基因家族的详尽描述。这种综合的方法在这里适用于描述的 ATL E3 泛素连接家族的葡萄。根据 ATL 亚科成员在调控关键细胞过程中的新作用7, 这项工作可以很好地帮助识别功能性研究的强候选者, 并最终解开控制这一重要作物对其环境的适应。

Protocol

1. 确定假想的 ATL 基因家族成员 (s) 爆炸网络版 打开爆炸网页13 , 然后单击 “蛋白质爆炸” 部分。 在 “输入查询序列” 字段中, 输入蛋白质的氨基酸序列 (这里 VIT_05s0077g01970), 它将用作探针来识别其他家族成员。注意: 应该使用一种很好的代表性蛋白质 (一种蛋白质, 显示家庭的所有重要特征)。 在 “选择搜索集” 字段中, 选择 “参考蛋白…

Representative Results

VIT_05s0077g01970 基因, 被确定为最相似的a. 南芥 ATL2 (At3g16720) 通过 BLASTp 搜索, 被用作探针, 以调查的 ATL 家族成员在葡萄基因组 (五亚种cv 皮诺 PN40024)。PSI-爆炸分析在几个周期之后汇合, 揭示了属于葡萄树 ATL 基因家族 (图 1A) 的假定基因列表。在分析中确定的所有条目的肌肉对齐方式的视觉检查 (图 1B) 中, 对每个候选?…

Discussion

在基因组时代, 许多植物物种被深深地刻画了。这些信息是初步的功能研究, 并提供一个框架, 进一步调查不同成员在一个家庭中的作用。在这方面, 还需要一个命名系统, 允许唯一地识别家庭中的每个成员, 避免在不同的研究组独立于不同的基因分配姓名时可能出现的冗余和混乱。

经过深思熟虑的考虑, 葡萄科学界同意命名的葡萄基因在一个家庭的基础上与拟南芥基因的…

Disclosures

The authors have nothing to disclose.

Acknowledgements

这项工作得到了维罗纳大学在联合项目2014的框架内的支持 (在葡萄藤中的 ATL 基因家族的特性及其对霜霉病霜霉病的抗性)。

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).
check_url/kr/56626?article_type=t

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video