Summary

Flux de travail complet pour le génome-large d’Identification et de la Meta-analyse de l’Expression de la famille des gènes ATL E3 ubiquitine Ligase à Grapevine

Published: December 22, 2017
doi:

Summary

Cet article décrit la procédure pour l’identification et la caractérisation d’une famille de gènes dans la vigne à cette famille d’ Arabidopsis Tóxicos dans Levadura (ATL) E3 ubiquitine ligases.

Abstract

Classification et nomenclature des gènes dans une famille peuvent contribuer significativement à la description de la diversité des protéines et à la prévision de fonctions familiales selon plusieurs caractéristiques, telles que la présence de motifs de séquence ou de particulier sites de modification post-traductionnelle et le profil d’expression des membres de la famille dans des conditions différentes. Cet ouvrage décrit un protocole détaillé pour la caractérisation des gènes familiaux. Ici, la procédure est appliquée à la caractérisation de la famille Arabidopsis Tóxicos dans Levadura (ATL) E3 ubiquitine ligase à grapevine. Les méthodes comprennent l’identification de tout le génome des membres de la famille, la caractérisation de la localisation du gène, la structure et les doubles emplois, l’analyse des motifs de protéine conservée, la prédiction des sites de localisation et de la phosphorylation des protéines ainsi que Profil d’expression génique au sein de la famille dans différents ensembles de données. Telle procédure, qui pourrait être étendu à de nouvelles analyses selon des fins expérimentales, pourrait être appliquée à toute famille de gènes à des espèces végétales pour lesquelles il existe des données génomiques, et il fournit des renseignements précieux pour identifier les candidats intéressants pour des études fonctionnelles, donnant un aperçu des mécanismes moléculaires de l’adaptation des plantes à leur environnement.

Introduction

Au cours de la dernière décennie, beaucoup de recherche a été effectuée en génomique de la vigne. Vigne est une culture économiquement pertinente reconnue, qui est devenu un modèle pour la recherche sur le développement de fruits et sur les réponses des plantes ligneuses aux stress biotiques et abiotiques. Dans ce contexte, la libération du Vitis vinifera CV PN40024 génome en 20071 et sa version mise à jour en 20112 conduit à une accumulation rapide de données à l’échelle « omiques » et à un éclatement des études de haut débit. Selon les données publiées de séquence, l’analyse détaillée d’une famille de gène donné (généralement composée de protéines partageant des motifs conservés, les similitudes structurelles ou fonctionnelles et les relations évolutives), peut désormais être réalisée afin de découvrir ses les fonctions moléculaires, évolution et profils d’expression génique. Ces analyses peuvent contribuer à comprendre comment familles de gènes contrôlent les processus physiologiques à une échelle du génome.

Plusieurs aspects du cycle de vie végétale sont réglementées par dégradation ubiquitine-mediated de protéines clés, qui exigent un chiffre d’affaires adaptée pour garantir des processus cellulaires réguliers. Important les composants du processus de dégradation induite par l’ubiquitine sont l’E3 ubiquitine ligases, qui sont responsables de la souplesse du système, grâce au recrutement de cibles spécifiques3. En conséquence, ces enzymes représentent une famille de gènes énorme, avec environ 1 400 E3 ligase-codage gènes prévues dans Arabidopsis thaliana génome4, chaque ubiquitine ligase E3 agissant pour l’ubiquitination des protéines cibles spécifiques. Malgré l’importance de l’ubiquitination de substrat spécifique dans la régulation cellulaire chez les plantes, on connaît mal comment la voie de l’ubiquitination est réglementée et protéines cibles ont été identifiées que dans de rares cas. Le déchiffrage de ces mécanismes de la spécificité et la régulation s’appuie d’abord sur l’identification et la caractérisation des différentes composantes du système, en particulier l’E3 ligases. Entre ubiquitine ligases, la sous-famille des ATL se caractérise par 91 membres identifiés chez a. thaliana affiche un anneau-H2 doigt domaine5,6, certains d’entre eux jouant un rôle dans la défense et l’hormone réponses7.

La première étape cruciale pour définir les membres d’une nouvelle famille de gènes est la définition précise des caractéristiques familiales, tels que les motifs de consensus, les domaines clés et caractéristiques de séquences de protéines. En effet, la récupération fiable de tous les membres de famille de gène BLAST analyse nécessite certaines caractéristiques de la séquence obligatoire, dans les domaines de protéine responsables de la protéine fonction/activité, servant de signature de la protéine. Cela peut être facilité par la caractérisation antérieure de la même famille de gènes chez d’autres espèces végétales ou obtenu en analysant les différents gènes putativement appartenant à la même famille dans différentes espèces de plantes, d’isoler les séquences communes. Les membres de la famille peuvent alors être individuellement nommés suivant des règles communes, a été réglées par un consortium international pour une espèce végétale donnée. Dans la vigne, par exemple, cette procédure est soumis aux recommandations du Comité de Nomenclature Super pour l’Annotation de gène de raisin (sNCGGa), établissant la construction d’un arbre phylogénétique y compris V. vinifera et a. thaliana membres de famille de gène pour permettre l’annotation de gène issu des séquences de nucléotides8.

Localisation chromosomique des membres de la famille et enquête sur la duplication génique permettent mettant en évidence la présence de gènes dupliqués génome entier ou tandem. Cette information semble utile pour démêler les fonctions des gènes putatifs, puisqu’elle pourrait voir la redondance fonctionnelle ou révéler des situations différentes, c’est-à-dire, non-fonctionnalisation, neo-fonctionnalisation ou subsidiaire fonctionnalisation9. Les deux néo – et sous-sous – functionalization sont des événements importants qui créent la nouveauté génétique, fournissant de nouveaux composants cellulaires pour l’adaptation des plantes à l’évolution des environnements10. En particulier, les duplications de gènes ancestraux et production de nouveaux gènes ont été très fréquentes au cours de l’évolution du génome vigne et nouvellement formé de gènes provenant des duplications proximales et tandem à grapevine étaient plus susceptibles de produire une nouvelle fonctions11.

Un autre facteur clé à déchiffrer la fonction des gènes familiaux est le profil de transcriptomique. La disponibilité des bases de données publiques donnant accès à une quantité énorme de données transcriptomiques peut être ainsi exploitée pour attribuer des fonctions aux membres de famille de gène à grande échelle en silico analyses d’expression. En effet, l’expression particulière de certains gènes dans les organes de la plante spécifique ou en réponse à certaines contraintes peut donner quelques conseils au sujet des rôles présumés des protéines correspondantes dans les conditions définies et apporter un soutien à des hypothèses sur la possible auxiliaire de fonctionnalisation de gènes dupliqués pour répondre aux différents défis. À cette fin, il est important de tenir compte de plusieurs ensembles de données : ceux-ci peuvent être gène déjà disponible des matrices d’expression, tels que l’atlas du génome transcriptomique des organes de la vigne et des stades de développement,12, ou peut être construits ad hoc par récupération des ensembles de données transcriptomiques pour les espèces de plante particulière soumises à des contraintes définies. En outre, une approche simple à l’aide de deux matrices, avec données de similitude par paires et l’autre avec des coefficients de co-expression par paire peuvent être appliqués afin d’évaluer les relations entre modèles de similitude et d’expression de séquence au sein d’une famille multigénique.

Le but de ce travail est de fournir une approche globale, définissant la structure des gènes, motifs de protéine conservée, localisation chromosomique, duplications géniques et profils d’expression, comme bien la prédiction des sites de localisation et de la phosphorylation des protéines, pour atteindre un caractérisation exhaustive d’une famille de gènes chez les plantes. Une telle approche globale est appliquée ici à la caractérisation de la famille ATL E3 ubiquitine ligase vigne. Selon le rôle émergent des ATL sous-famille des membres dans la régulation des processus cellulaires clés7, ce travail peut bien aider l’identification des candidats solides pour des études fonctionnelles et éventuellement élucider les mécanismes moléculaires régissant la adaptation de cette culture importante à son environnement.

Protocol

1. identification des ATL putatif famille multigénique membre (s) Version web PSI-BLAST Ouvrez la page web BLAST13 et cliquez sur la section BLAST de protéine. Dans le champ « Enter Query sequence », entrez la séquence d’acides aminés de la protéine (ici VIT_05s0077g01970) qui sera utilisée comme sonde pour identifier les autres membres de la famille.Remarque : Une bonne protéine représentative doit être utilisée (une protéi…

Representative Results

Le gène VIT_05s0077g01970, identifié comme étant le plus semblable à a. thaliana ATL2 (At3g16720) grâce à une recherche de BLASTp, a été utilisé comme sonde pour sonder les membres de la famille ATL dans le génome de la vigne (Vitis vinifera cv Pinot Noir PN40024). L’analyse de PSI-BLAST ont convergé après quelques cycles révélant une liste de gènes putatifs appartenant à la famille de gène ATL de vigne (Figure 1 a). La pr…

Discussion

Dans l’ère de la génomique, de nombreuses familles de gènes ont été profondément caractérisés chez plusieurs espèces de plantes. Cette information est préliminaire à des études fonctionnelles et fournissent un cadre pour étudier davantage le rôle des différents membres d’une famille. Dans ce contexte, il y a également un besoin pour un système de nomenclature permettant d’identifier de manière unique chaque membre d’une famille, en évitant la redondance et les confusions qui peuvent survenir lo…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Le travail a été soutenu par l’Université de Vérone, dans le cadre de Joint projet 2014 (caractérisation de la famille de gènes ATL dans la vigne et de son implication dans la résistance au Plasmopara viticola).

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).
check_url/kr/56626?article_type=t

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video