Summary

Fluxo de trabalho abrangente para a identificação de todo o genoma e Meta-análise da expressão da ATL E3 ubiquitina Ligase Gene família em videira

Published: December 22, 2017
doi:

Summary

Este artigo descreve o procedimento para a identificação e caracterização de uma família de gene em videira aplicada à família de Arabidopsis Tóxicos em Levadura (ATL) E3 ubiquitina ligases.

Abstract

Classificação e nomenclatura dos genes em uma família podem contribuir de forma significativa para a descrição da diversidade das proteínas codificadas e a previsão da família funções com base em diversas características, tais como a presença de motivos de sequência ou de particular sites para modificação pós-traducional e o perfil de expressão dos membros da família em diferentes condições. Este trabalho descreve um protocolo detalhado para a caracterização de família do gene. Aqui, o procedimento é aplicado para a caracterização da Arabidopsis Tóxicos em Levadura (ATL) E3 ubiquitina ligase família na videira. Os métodos incluem a identificação de todo o genoma dos membros da família, a caracterização da localização do gene, estrutura e duplicação, a análise dos motivos da proteína conservada, a previsão dos sites de localização e fosforilação de proteínas, bem como Gene expressão perfila através da família em diferentes conjuntos de dados. Tal procedimento, que poderia ser alargado a novas análises dependendo fins experimentais, poderia ser aplicado a qualquer família de gene em quaisquer espécies de plantas para as quais dados genomic estão disponíveis, e fornece informações valiosas para identificar candidatos interessantes para estudos funcionais, dando insights sobre os mecanismos moleculares de adaptação da planta para seu ambiente.

Introduction

Durante a última década, muita pesquisa realizada na genômica de videira. Videira é uma reconhecida cultura economicamente relevante, que se tornou um modelo para a investigação sobre o desenvolvimento do fruto e sobre as respostas de plantas lenhosas a estresses bióticos e abióticos. Neste contexto, o lançamento do genoma Vitis vinifera CV. PN40024 em 2007-1 e sua versão atualizada em 20112 levou a uma rápida acumulação de dados “Omics”-escala e a uma explosão de estudos de alto rendimento. Baseado nos dados de sequência publicada, a análise abrangente de uma família de determinado gene (geralmente composta por proteínas partilha motivos conservados, semelhanças estruturais e/ou funcionais e as relações evolutivas), agora pode ser realizada para descobrir sua perfis de expressão genética, evolução e funções moleculares. Essas análises podem contribuir para a compreensão de como as famílias gene controlam processos fisiológicos em um nível de todo o genoma.

Muitos aspectos do ciclo de vida da planta são regulados pela mediada por ubiquitina de degradação de proteínas chaves, que requerem um volume de negócios de aperfeiçoá-lo para assegurar o regulares processos celulares. Importantes componentes do processo de degradação mediada por ubiquitina são os E3 ubiquitina ligases, que são responsáveis pela flexibilidade do sistema, graças ao recrutamento de alvos específicos3. Por conseguinte, estas enzimas representam uma família enorme de gene, com cerca de 1.400 E3 ligase-codificação genes previstos em Arabidopsis thaliana genoma4, cada ligase de ubiquitina E3 atuando para o ubiquitination de proteínas alvo específico. Apesar da importância da ubiquitination substrato específico no Regulamento celular em plantas, pouco se sabe sobre como o caminho da ubiquitination é regulamentado e proteínas alvo foram identificadas somente em alguns casos. O deciframento de tais mecanismos de especificidade e regulamentação depende primeiramente a identificação e caracterização das diferentes componentes do sistema, em particular as ligases E3. Entre ubiquitina ligases, subfamília ATL é caracterizada por 91 Membros identificados em a. thaliana , exibindo um anel-H2 dedo domínio5,6, alguns deles desempenhando um papel na defesa e hormônio respostas7.

O primeiro passo crucial para definir os membros de uma família nova do gene é a definição precisa das características familiares, tais como motivos de consenso, domínios-chave e características da sequência da proteína. Com efeito, a recuperação confiável de todos os membros da família gene com base na análise de explosão requer algumas características de sequência obrigatória, em domínios de particular da proteína responsáveis pela proteína função/atividade, servindo como assinatura de proteína. Isto pode ser facilitado pela caracterização anterior da mesma família gene em outras espécies de plantas ou alcançado através da análise de diferentes genes presumidamente pertencentes à família mesma em diferentes espécies de plantas, para isolar as sequências comuns. Os membros da família podem então ser individualmente nomeados seguindo regras comuns colonizadas por consórcios internacionais para uma espécie de determinada planta. Em videira, por exemplo, tal procedimento é submetido às recomendações do Comité de nomenclatura super para anotação de Gene de uva (sNCGGa), que estabelece a construção de uma árvore filogenética, incluindo V. vinifera e a. thaliana membros da família para permitir a anotação de gene gene baseiam em sequências de nucleotídeos8.

Localização de cromossomo de membros da família e pesquisa de duplicação do gene permitir destacando a presença de genes duplicados do inteiro-genoma ou em tandem. Essa informação aparece útil para desvendar as funções do gene putativo, desde que pode mostrar a redundância funcional ou revelar situações diferentes, ou seja, não-functionalization, neo-functionalization ou functionalization sub9. Ambos os neo – e sub – functionalization é eventos importantes que criam novidade genética, fornecendo novos componentes celulares para adaptação da planta às mudanças ambientes10. Em particular, as duplicações de genes ancestrais e produção de novos genes eram muito frequentes durante a evolução do genoma de videira e recém-formado genes originários de duplicações em tandem e proximais em videira eram mais propensos a produzir novos funções de11.

Outro fator chave em decifrar a função dos genes familiares é o perfil de transcriptomic. A disponibilidade de bases de dados públicas, dando acesso a uma enorme quantidade de dados de transcriptomic pode ser explorada, assim, para atribuir funções putativos para membros da família gene usando análises de expressão em larga escala em silico . Com efeito, a expressão peculiar de alguns genes em órgãos da planta específica ou em resposta a certas tensões pode dar algumas dicas sobre os putativos papéis das proteínas correspondentes em condições definidas e dar suporte a hipóteses sobre possíveis sub functionalization dos genes duplicados para responder aos desafios diferentes. Para esse efeito, é importante considerar os vários conjuntos de dados: estas podem ser gene já disponível matrizes de expressão, tais como o atlas transcriptomic de todo o genoma da videira órgãos e estádios de desenvolvimento,12, ou podem ser construídas ad hoc por recuperação de conjuntos de dados transcriptomic para as espécies de planta particular sujeitados a tensões definidas. Além disso, uma abordagem simples, usando duas matrizes, uma com dados de similaridade emparelhadas e outro com os coeficientes emparelhadas expressão co podem ser aplicados para avaliar as relações entre padrões de semelhança e a expressão de sequência dentro de uma família de gene.

O objetivo deste trabalho é apresentar uma abordagem global, definindo a estrutura do gene, motivos de proteína conservada, localização cromossômica, duplicações do gene e padrões de expressão, como também a previsão de sites localização e fosforilação da proteína, para atingir uma caracterização exaustiva de uma família de genes em plantas. Uma abordagem abrangente é aplicada aqui, para a caracterização da família ATL E3 ubiquitina ligase em videira. De acordo com o papel emergente de membros da subfamília ATL na regulação de processos celulares chave7, este trabalho pode também auxiliar a identificação dos fortes candidatos para estudos funcionais e eventualmente a desvendar os mecanismos moleculares que regem o adaptação desta cultura importante para seu ambiente.

Protocol

1. identificação da família do Gene ATL putativo membro (s) Versão web de PSI-BLAST Abra a página web de explosão13 e clique na seção de explosão de proteína. No campo “Sequência de consulta de Enter”, digite a sequência de aminoácidos da proteína (aqui VIT_05s0077g01970) que será usada como sonda para identificar outros membros da família.Nota: Uma boa proteína representante deve ser usado (uma proteína mostrando todas as c…

Representative Results

O gene VIT_05s0077g01970, identificado como o mais parecido com a. thaliana ATL2 (At3g16720), através de uma pesquisa BLASTp, foi usado como sonda para inspeccionar os membros da família ATL no genoma da videira (V. vinifera cv Pinot Noir PN40024). A análise de PSI-BLAST convergiu depois de alguns ciclos, revelando uma lista de putativos genes pertencentes à família de gene videira ATL (figura 1A). A presença do anel-H2 domínio canôn…

Discussion

Na era genômica, muitas famílias de gene foram caracterizadas profundamente em várias espécies de plantas. Esta informação é preliminar do estudos funcionais e fornecer um quadro para investigar mais profundamente o papel dos diferentes membros de uma família. Neste contexto, há também a necessidade de um sistema de nomenclatura que permite para identificar exclusivamente cada membro de uma família, evitando a redundância e confusões que podem surgir quando os nomes são atribuídos de maneira independente d…

Disclosures

The authors have nothing to disclose.

Acknowledgements

O trabalho foi apoiado pela Universidade de Verona, dentro do quadro de comum projeto 2014 (caracterização da família do gene ATL em videira e da sua participação na resistência à Plasmopara viticola).

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).
check_url/kr/56626?article_type=t

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video