Summary

Flusso di lavoro globale per l'identificazione del genoma e la Meta-analisi di espressione della famiglia genica ATL E3 ubiquitina ligasi a Grapevine

Published: December 22, 2017
doi:

Summary

Questo articolo descrive la procedura per l’identificazione e la caratterizzazione di una famiglia di geni a grapevine applicato alla famiglia di Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitina ligasi.

Abstract

Classificazione e nomenclatura dei geni in una famiglia può contribuire significativamente alla descrizione della diversità delle proteine codificate e alla previsione delle funzioni di famiglia basato su diverse funzionalità, come la presenza di motivi di sequenza o di particolare siti per modificazione post-traduzionale e il profilo di espressione dei membri della famiglia in condizioni diverse. Questo lavoro descrive un protocollo dettagliato per la caratterizzazione dei geni familiari. Qui, la procedura viene applicata per la caratterizzazione della famiglia Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitina ligasi a grapevine. I metodi includono l’identificazione del genoma di membri della famiglia, la caratterizzazione del gene localizzazione, struttura e duplicazione, l’analisi dei motivi della proteina conservata, la previsione dei siti di localizzazione e la fosforilazione delle proteine, nonché espressione genica in tutta la famiglia in diversi set di dati. Tale procedura, che potrebbe essere esteso a ulteriori analisi a seconda gli scopi sperimentali, potrebbe essere applicato a qualsiasi famiglia genica in qualsiasi specie di piante per i quali sono disponibili dati genomici e fornisce informazioni utili per identificare i candidati interessanti per gli studi funzionali, dando comprensioni nei meccanismi molecolari dell’adattamento della pianta al loro ambiente.

Introduction

Durante l’ultimo decennio, molta ricerca è stata effettuata in grapevine genomica. Vigna è una coltura economicamente rilevante riconosciuta, che è diventato un modello per la ricerca sullo sviluppo di frutta e sulle risposte delle piante legnose agli stress biotici e abiotici. In questo contesto, il rilascio del genoma di Vitis vinifera c.v. PN40024 nel 20071 e la sua versione aggiornata nel 20112 ha portato a un rapido accumulo di dati “Omics”-scala e a una raffica di studi di alto-rendimento. Base ai dati pubblicati sequenza, l’analisi completa di una famiglia di dato gene (generalmente composta da proteine condividono motivi conservati, somiglianze strutturali e/o funzionali e rapporti evolutivi), possono ora essere eseguite per scoprire la funzioni molecolari, evoluzione e profili di espressione genica. Queste analisi possono contribuire alla comprensione di come le famiglie geniche controllano processi fisiologici a livello del genoma.

Molti aspetti del ciclo di vita della pianta sono regolati dalla degradazione ubiquitina-mediata di proteine chiave, che richiedono un fatturato fine-tuned per garantire regolari processi cellulari. Importanti componenti del processo di degradazione ubiquitina-dipendente sono la ligasi di ubiquitin E3, che sono responsabili della flessibilità del sistema, grazie all’assunzione di specifici obiettivi3. Di conseguenza, questi enzimi rappresentano una famiglia di geni enorme, con circa 1.400 E3 ligasi-codifica geni preveduti in Arabidopsis thaliana genoma4, ogni E3 ubiquitina ligasi che agiscono per l’ubiquitinazione delle proteine target specifici. Nonostante l’importanza del substrato specifico ubiquitinazione nella regolazione cellulare nelle piante, piccolo è conosciuto circa come è regolato il pathway di ubiquitinazione e solo in pochi casi sono state identificate proteine bersaglio. La decifrazione di tali meccanismi di specificità e regolamento si basa innanzitutto sull’identificazione e la caratterizzazione delle diverse componenti del sistema, in particolare la ligasi E3. Tra ubiquitin-ligasi, sottofamiglia ATL è caratterizzata da 91 membri identificati in a. thaliana visualizzati un anello-H2 dito dominio5,6, alcuni di loro un ruolo in difesa e ormone risposte7.

Il primo passo cruciale per definire i membri di una nuova famiglia genica è la definizione precisa delle caratteristiche familiari, quali motivi di consenso, settori chiave e le caratteristiche di sequenza della proteina. Infatti, il recupero affidabile di tutti i membri della famiglia genica basato su analisi BLAST richiede alcune caratteristiche di sequenza obbligatoria, nei domini di particolare proteina responsabile di funzione/attività della proteina, che funge da firma di proteina. Questo può essere facilitato dalla caratterizzazione precedente della famiglia del gene stesso in altre specie vegetali o ottenuto analizzando diversi geni putativamente appartenendo alla stessa famiglia in specie di piante diverse, per isolare sequenze comuni. I membri della famiglia possono singolarmente denominati seguendo regole comuni che si stabilì di consorzi internazionali per una determinata specie. A grapevine, per esempio, tale procedura è sottoposta alle raccomandazioni del Comitato Super-nomenclatura per l’annotazione del Gene dell’uva (sNCGGa), che stabilisce la costruzione di un albero filogenetico tra cui V. vinifera e a. thaliana membri della famiglia genica per consentire l’annotazione del gene basato su sequenze di nucleotidi8.

Localizzazione del cromosoma dei membri della famiglia e indagine di duplicazione genica consentire evidenziando la presenza di geni duplicati intero genoma o tandem. Tali informazioni appaiono utile per svelare le funzioni del gene presunto, poiché esso potrebbe mostrare ridondanza funzionale o rivelare situazioni differenti, cioè, non-funzionalizzazione, neo-funzionalizzazione o Sub-funzionalizzazione9. Entrambi neo – e sub – functionalization sono eventi importanti che creano novità genetica, fornendo nuove componenti cellulari per adattamento della pianta alle mutevoli ambienti10. In particolare, le duplicazioni dei geni ancestrali e produzione di nuovi geni erano molto frequenti nel corso dell’evoluzione del genoma della vite e neonate geni provenienti dalle duplicazioni prossimali e tandem a grapevine erano più probabili produrre nuovo funzioni11.

Un altro fattore chiave nel decifrare la funzione della famiglia genica è il profilo di trascrittomica. La disponibilità di banche dati pubbliche, dando accesso a un’enorme quantità di dati di trascrittomica può essere così sfruttata per assegnare funzioni putative ai membri della famiglia genica utilizzando su larga scala in silico analisi di espressione. Infatti, la peculiare espressione di alcuni geni negli organi vegetali specifiche o in risposta a determinate sollecitazioni possa dare alcuni suggerimenti per quanto riguarda i presunti ruoli delle proteine corrispondenti in condizioni definite e dare sostegno alle ipotesi sulle possibili Sub-funzionalizzazione dei geni duplicati per rispondere alle diverse sfide. A tale scopo, è importante prendere in considerazione diversi set di dati: questi possono essere già disponibili gene matrici di espressione, come l’Atlante di trascrittomica genoma della vite organi e fasi di sviluppo12, o possono essere costruiti ad hoc di recupero di trascrittomica DataSet per la specie di pianta particolare definito sollecitato. Inoltre, un approccio semplice utilizzando due matrici, una con dati pairwise somiglianza e l’altra con coefficienti pairwise co-espressione può essere applicati per valutare le relazioni tra modelli di somiglianza ed espressione di sequenza all’interno di una famiglia di geni.

Lo scopo di questo lavoro è quello di fornire un approccio globale, definizione di struttura del gene, conservato proteina motivi, posizione cromosomica, duplicazioni del gene e modelli di espressione, come anche la previsione di siti di localizzazione e fosforilazione di proteine, per raggiungere un esauriente caratterizzazione di una famiglia di geni in piante. Un tale approccio globale viene applicato qui alla caratterizzazione della famiglia ATL E3 ubiquitina ligasi a grapevine. Secondo il ruolo emergente dei membri sottofamiglia ATL nella regolazione dei processi cellulari chiave7, questo lavoro può anche aiutare l’identificazione dei forti candidati per studi funzionali e finalmente svelare i meccanismi molecolari che regolano la adattamento di questa coltura importante al suo ambiente.

Protocol

1. identificazione dei membri di famiglia di geni putativi ATL Versione web di PSI-BLAST Aprire la pagina web BLAST13 e clicca sulla sezione BLAST della proteina. Nel campo “Enter Query sequence”, immettere la sequenza aminoacidica della proteina (qui VIT_05s0077g01970) che verrà utilizzata come la sonda per identificare altri membri della famiglia.Nota: Una buona proteina rappresentativa deve essere utilizzato (una proteina visualizzati tut…

Representative Results

Il gene VIT_05s0077g01970, identificato come il più simile a a. thaliana ATL2 (At3g16720) attraverso una ricerca di BLASTp, fu usato come sonda per rilevare i membri della famiglia ATL del genoma della vite (V. vinifera cv Pinot Noir PN40024). L’analisi di PSI-BLAST convergenti dopo alcuni cicli rivelando una lista di geni putativi appartenendo alla famiglia del gene ATL grapevine (Figura 1A). La presenza del dominio canonico anello-H2 per …

Discussion

Nell’era genomica, molte famiglie geniche sono state profondamente caratterizzate in diverse specie di piante. Queste informazioni sono preliminari studi funzionali e forniscono una cornice per studiare ulteriormente il ruolo di diversi membri di una famiglia. In questo contesto, c’è anche un’esigenza di un sistema di nomenclatura che permette di identificare in modo univoco ogni membro di una famiglia, evitando la ridondanza e le confusioni che possono sorgere quando i nomi vengono assegnati in modo indipendente per di…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Il lavoro è stato supportato dall’Università di Verona all’interno della cornice del comune progetto 2014 (caratterizzazione della famiglia del gene ATL a grapevine e del suo coinvolgimento nella resistenza alla peronospora della vite).

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video