Summary

Flujo de trabajo integral para la identificación de todo el genoma y Meta-análisis de la expresión de la familia del Gene del ATL E3 ubiquitina ligasa en Grapevine

Published: December 22, 2017
doi:

Summary

Este artículo describe el procedimiento para la identificación y caracterización de una familia del gene en grapevine aplicada a la familia de Arabidopsis Tóxicos en Levadura (ATL) E3 ubiquitina ligasas.

Abstract

Clasificación y nomenclatura de los genes de una familia pueden contribuir considerablemente a la descripción de la diversidad de proteínas codificadas y a la predicción de funciones de la familia basada en varias características, tales como la presencia de motivos de secuencia o de particular sitios de modificación poste-de translación y el perfil de expresión de los miembros de la familia en diferentes condiciones. Este trabajo describe un protocolo detallado para la caracterización familiar gene. Aquí, el procedimiento es aplicado a la caracterización de la familia Arabidopsis Tóxicos en Levadura (ATL) E3 ubiquitina ligasa en vid. Los métodos incluyen la identificación del genoma de los miembros de la familia, la caracterización del gen localización, estructura y duplicación, el análisis de motivos conservados de la proteína, la predicción de sitios de localización y fosforilación de proteínas así como Perfil de expresión génica a través de la familia en diferentes conjuntos de datos. Tal procedimiento, que podría extenderse a otros análisis dependiendo de propósitos experimentales, se podría aplicar a cualquier familia de genes de cualquier especie de planta que están disponibles datos genómicos, y proporciona información valiosa para identificar a candidatos interesantes para los estudios funcionales, dando ideas sobre los mecanismos moleculares de adaptación de plantas a su entorno.

Introduction

Durante la última década, se ha realizado mucha investigación en genómica de la vid. Vid es un cultivo económicamente relevante reconocido, que se ha convertido en un modelo para la investigación en el desarrollo de la fruta y en las respuestas de las plantas leñosas a estreses bióticos y abióticos. En este contexto, la liberación del genoma de Vitis vinifera CV. PN40024 en 20071 y su versión actualizada en 20112 condujo a una rápida acumulación de datos a escala “ómicas” y a una explosión de estudios de alto rendimiento. Según los datos publicados de la secuencia, el análisis integral de una familia de determinado gen (generalmente compuesto de comparten motivos conservados, similitudes estructurales o funcionales y relaciones evolutivas de las proteínas), puede ahora realizarse para descubrir su funciones moleculares, evolución y perfiles de expresión génica. Estos análisis pueden contribuir a entender cómo familias génicas controlan procesos fisiológicos a nivel del genoma.

Muchos aspectos del ciclo de vida de planta están regulados por la degradación mediada por ubiquitina de proteínas clave, que requieren un volumen optimizado para regulares procesos celulares. Importantes componentes del proceso de degradación mediada por ubiquitina son las ligasas de ubiquitina E3, que son responsables de la flexibilidad del sistema, gracias a la contratación de objetivos específicos3. En consecuencia, estas enzimas representan una familia de genes enorme, con unos 1.400 E3 ligasa de codificación genes previstos en el thaliana de Arabidopsis genoma4, cada E3 ubiquitina ligasa de la ubiquitinación de proteínas específicos. A pesar de la importancia de la ubiquitinación de substrato-específica en la regulación celular en las plantas, poco se sabe sobre cómo se regula la vía de ubiquitinación y proteínas de la blanco han sido identificadas sólo en algunos casos. El desciframiento de tales mecanismos de especificidad y regulación basa primero en la identificación y caracterización de los diferentes componentes del sistema, en particular las E3 ligasas. Entre las ligasas de ubiquitina, la subfamilia ATL se caracteriza por 91 miembros identificados en a. thaliana mostrando un anillo-H2 dedo dominio5,6, algunos de ellos juega un papel en las respuestas de defensa y la hormona7.

El primer paso crucial para definir a los miembros de una nueva familia de genes es la definición precisa de las características familiares, tales como motivos consenso dominios claves y características de la secuencia de proteína. De hecho, la recuperación fiable de todos miembros de la familia génica basado en el análisis BLAST requiere algunas características de la secuencia obligatoria, en los dominios de la proteína en particular responsables de la función y actividad de la proteína, que sirve como firma de proteína. Esto puede ser facilitado por la anterior caracterización de la misma familia de genes de otras especies vegetales o logrado mediante el análisis de diversos genes supuestamente pertenecientes a la misma familia en diferentes especies de plantas, para aislar secuencias comunes. Los miembros de la familia pueden entonces ser individualmente nombrados siguiendo normas comunes que se establecieron por consorcios internacionales para una especie vegetal determinada. En vid, por ejemplo, dicho procedimiento se sujeta a las recomendaciones de la Comisión de nomenclatura súper para uva gen anotación (sNCGGa), establece la construcción de un árbol filogenético como V. vinifera y a. thaliana miembros de la familia gen para permitir la anotación de genes basan en secuencias de nucleótidos8.

Localización de cromosoma de miembros de la familia y estudio de la duplicación del gene permiten destacar la presencia de genes duplicados en tándem o de todo el genoma. Dicha información aparece útil para desentrañar las funciones del gen putativo, ya que podría demostrar la redundancia funcional o revelar situaciones diferentes, es decir, no funcionalización, neo-funcionalización o sub-funcionalización9. Tanto neo – y sub – functionalization es acontecimientos importantes que crean novedad genética, proporcionando nuevos componentes celulares para la adaptación de la planta a los cambiantes entornos10. En particular, las duplicaciones de genes ancestrales y la producción de nuevos genes fueron muy frecuentes durante la evolución del genoma de la vid y recién formados genes procedentes de duplicaciones en tándem y proximales en vid eran más propensos a producir nuevos funciones11.

Otro factor clave para descifrar la función familiar gene es el perfil transcriptómico. La disponibilidad de bases de datos públicas que da acceso a una gran cantidad de datos transcriptómicos puede explotarse así para asignar funciones putativas a miembros de la familia gen mediante análisis de expresión a gran escala en silico . De hecho, la peculiar expresión de algunos genes en órganos específicos de la planta o en respuesta a ciertas tensiones puede dar algunas pistas sobre los supuestos roles de las proteínas correspondientes en condiciones definidas y dar soporte a la hipótesis sobre la posible Sub-funcionalización de genes duplicados para responder a retos diferentes. Para ello, es importante considerar varios conjuntos de datos: estos pueden ser gene ya disponible matrices de expresión, como el atlas transcriptómico del genoma de los órganos de la vid y etapas de desarrollo12, o puede ser construidos ad hoc por recuperar datos transcriptómicos de la especie de planta en particular sometida a tensiones definidas. Por otra parte, un enfoque simple con dos matrices, uno con los datos de similitud pares y otro con coeficientes pares coexpresión pueden aplicarse para evaluar las relaciones entre patrones de similitud y la expresión de secuencia dentro de una familia de genes.

El objetivo de este trabajo es proporcionar un enfoque global, definir estructura gene, motivos conservados de la proteína, Localización cromosómica, las duplicaciones del gene y patrones de expresión, como también la predicción de la proteína phosphorylation y localización sitios web, para lograr un caracterización exhaustiva de una familia de genes en plantas. Este enfoque integral se aplica aquí a la caracterización de la familia de ligasa de ubiquitina E3 ATL en vid. Según el rol emergente de miembros de la subfamilia ATL en la regulación de procesos celulares claves7, este trabajo puede también ayudar a la identificación de los candidatos fuertes para estudios funcionales y finalmente desentrañar los mecanismos moleculares que regulan la adaptación de este cultivo importante a su entorno.

Protocol

1. identificación de los miembros de familia de genes putativos ATL Versión de la web de PSI-BLAST Abra la página web de explosión13 y haga clic en la sección de alto de proteína. En el campo “Secuencia de Enter Query”, introduzca la secuencia de aminoácidos de la proteína (aquí VIT_05s0077g01970) que se utilizará como la punta de prueba para identificar a los otros miembros de la familia.Nota: Debe ser una buena representante de pr…

Representative Results

El gen VIT_05s0077g01970, identificado como el más parecido a a. thaliana ATL2 (At3g16720) a través de una búsqueda BLASTp, fue utilizado como sonda para los familiares ATL en el genoma de la vid (V. vinifera cv Pinot Noir PN40024). El análisis PSI-BLAST converge después de algunos ciclos revela una lista de supuestos genes pertenecientes a la familia del gene ATL de vid (figura 1A). La presencia del dominio canónico del anillo-H2 para…

Discussion

En la era genómica, muchas familias de genes se han caracterizado profundamente en varias especies de plantas. Esta información es previa a los estudios funcionales y proporcionar un marco para investigar más a fondo el papel de los diferentes miembros de una familia. En este contexto, es necesario un sistema de nomenclatura que permite identificar unívocamente a cada miembro de una familia, evitando la redundancia y confusiones que pueden surgir cuando los nombres se asignan independientemente a diferentes genes por…

Disclosures

The authors have nothing to disclose.

Acknowledgements

El trabajo fue financiado por la Universidad de Verona, en el marco de conjunto proyecto 2014 (caracterización de la familia del gene ATL en vid y de su participación en la resistencia a Plasmopara viticola).

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video