Summary

Umfassenden Workflow zur genomweiten Identifizierung und Ausdruck Meta-Analyse von der ATL E3 Ubiquitin Ligase Genfamilie in Grapevine

Published: December 22, 2017
doi:

Summary

Dieser Artikel beschreibt das Verfahren für die Identifizierung und Charakterisierung einer Genfamilie in Grapevine, die zur Familie der Arabidopsis Tóxicos in Levadura (ATL) E3 Ubiquitin Ligases angewendet.

Abstract

Klassifizierung und Nomenklatur der Gene in einer Familie können erheblich zur Beschreibung von der Vielfalt der kodierten Proteine und die Vorhersage von Familienfeiern basierend auf einige Features, wie beispielsweise das Vorhandensein von Sequenzmotive oder bestimmten beitragen Standorte für Post-translationale Modifikation und das Expressionsprofil Familienmitglieder unter verschiedenen Bedingungen. Diese Arbeit beschreibt ein detailliertes Protokoll für gen-Familie-Charakterisierung. Hier wird das Verfahren bis hin zur Charakterisierung der Arabidopsis Tóxicos in Levadura (ATL) E3 Ubiquitin Ligase Familie in Grapevine angewendet. Die Methoden umfassen die genomweite Identifizierung von Familienangehörigen, die Charakterisierung des Gens Lokalisation, Struktur und Vervielfältigung, die Analyse der erhaltenen Protein Motive, die Vorhersage von Protein-Lokalisierung und Phosphorylierung-Sites sowie gen Expression profiling innerhalb der Familie in verschiedenen Datensätzen. Solches Verfahren, die zu weiteren Analysen je nach experimentellen Zwecken verlängert werden konnten, angewandt werden, für jede Genfamilie in alle Pflanzenarten für die genomische Daten verfügbar sind, und es liefert wertvolle Informationen um interessante Kandidaten zu identifizieren für funktionelle Studien geben Einblicke in die molekularen Mechanismen der Pflanze Anpassung an ihre Umwelt.

Introduction

In den letzten zehn Jahren wurde viel Forschung in Grapevine Genomics durchgeführt. Weinrebe ist eine anerkannte wirtschaftlich relevanten Ernte, die ein Modell für die Forschung auf Fruchtentwicklung und die Reaktionen von Gehölzen auf biotischen und abiotischen Stress geworden ist. In diesem Zusammenhang die Freilassung von Vitis Vinifera CV PN40024 Genom in 20071 und seine aktualisierte Version in 20112 führte zu einer schnellen Ansammlung von “Omics” angelegte Daten und einen Ausbruch von Hochdurchsatz-Studien. Basierend auf die publizierten Sequenzdaten, die umfassende Analyse einer bestimmten gen-Familie (in der Regel bestehend aus Proteinen Austausch konservierte Motive, strukturelle und funktionelle Gemeinsamkeiten und evolutionären Beziehungen), kann jetzt durchgeführt werden, um zu entdecken sein molekulare Funktionen, Evolution und gen Expressionsprofile. Diese Analysen können tragen zum Verständnis, wie Genfamilien physiologische Prozesse auf eine genomweite Ebene steuern.

Ubiquitin vermittelten Abbau von wichtigen Proteinen, erfordern einen fein abgestimmte Umsatz um regelmäßige zelluläre Prozesse zu gewährleisten, sind viele Aspekte des Lebenszyklus der Anlage geregelt. Wichtige Bestandteile des Ubiquitin-vermittelten Abbauprozess E3 Ubiquitin Ligases, die für die Flexibilität des Systems, durch die Rekrutierung von Einzelzielen3verantwortlich sind. Dementsprechend stellen diese Enzyme eine riesige Genfamilie mit rund 1.400 E3 Ligase-Kodierung Gene in Arabidopsis Thaliana Genom4, jedes E3-Ubiquitin-Ligase handeln für Ubiquitination von zielgruppenspezifischen Proteinen vorhergesagt. Trotz der Bedeutung der Substrat-spezifische Ubiquitination in zellulären Verordnung in Pflanzen ist wenig bekannt über wie Ubiquitination-Signalweg reguliert wird und Zielproteine wurden nur in wenigen Fällen identifiziert. Die Entschlüsselung dieser Spezifität und Verordnung Mechanismen stützt sich zunächst auf die Identifizierung und Charakterisierung der verschiedenen Komponenten des Systems, insbesondere E3 Ligases. Unter Ubiquitin Ligases ist ATL Unterfamilie geprägt von 91 Mitglieder in A. Thaliana anzeigen eine RING-H2 Finger Domäne5,6, einige von ihnen spielt eine Rolle in der Verteidigung und Hormon Antworten7identifiziert.

Der erste entscheidende Schritt zu definieren, die Mitglieder einer neuen gen-Familie ist die genaue Definition der Family-Features, z. B. Konsens Motive Schlüsselbereichen und Protein-Sequenz-Eigenschaften. In der Tat erfordert das zuverlässige Abrufen aller gen Familienmitglieder BLAST Analyse einige obligatorische Sequenz Merkmale in bestimmten Proteins Domänen verantwortlich für Protein-Funktion/Tätigkeit, als Protein-Signatur. Dies kann durch vorherige Charakterisierung derselben Genfamilie in anderen Pflanzenarten erleichtert oder erreicht durch die Analyse verschiedener Gene, die vermeintlich aus der gleichen Familie in verschiedenen Pflanzenarten, allgemeine Sequenzen zu isolieren. Die Familienmitglieder können dann individuell benannt werden, nach gemeinsamen Regeln, die von internationalen Konsortien für einen bestimmten Pflanzenarten besiedelt. Weinrebe zum Beispiel solche Verfahren auf die Empfehlungen des Ausschusses Super-Nomenklatur für Traube gen Annotation (sNCGGa), über den Bau einer phylogenetischen Baum einschließlich V. Vinifera und A. Thaliana unterliegt gen Familienmitglieder gen Anmerkung erlauben ausgehend von Nukleotid-Sequenzen8.

Chromosom Lokalisierung von Familienmitgliedern und gen Doppelarbeit Umfrage ermöglichen das Vorhandensein von Vollständiggenom oder Tandem duplizierten Genen Hervorhebung. Solche Informationen erscheint sinnvoll, vermeintliche Genfunktionen zu lüften, da es vielleicht funktionelle Redundanz zeigen oder unterschiedliche Situationen, d. h., nicht-Funktionalisierung, Neo-Funktionalisierung oder Sub-Funktionalisierung9 zeigen. Beiden Neo – und sub – functionalization sind wichtige Ereignisse, die genetischen Neuheit, Pflanze Anpassung an sich verändernde Umgebungen10neue zelluläre Komponenten zur erstellen. Insbesondere Vervielfältigungen von ancestral Genen und Produktion neuer Gene wurden sehr häufig während der Evolution des Genoms Weinrebe und neugeformten Gene aus proximalen und Tandem Duplikationen in Grapevine waren wahrscheinlicher, produzieren neue Funktionen11.

Ein weiterer wichtiger Faktor bei der Entschlüsselung Familie Genfunktion ist das transkriptomischen-Profil. Die Verfügbarkeit von öffentlichen Datenbanken den Zugriff auf eine riesige Menge an transkriptomischen Daten kann so ausgenutzt werden, um gen Familienmitglieder mit groß angelegten in Silico Expressionsanalysen mutmaßliche Funktionen zuweisen. In der Tat der eigentümliche Ausdruck einiger Gene in bestimmten Pflanzenorganen oder als Reaktion auf bestimmte Belastungen geben einige Hinweise auf die vermeintlichen Rollen der entsprechenden Proteine unter definierten Bedingungen und Hypothesen über mögliche Unterstützung zukommen Sub-Funktionalisierung von duplizierten Genen, verschiedene Herausforderungen zu reagieren. Zu diesem Zweck ist es wichtig, mehrere Datasets zu berücksichtigen: Diese können bereits vorhandene gen Ausdruck Matrizen, wie z. B. die genomweite transkriptomischen Atlas der Weinrebe Organe und Entwicklungsstadien12, oder ad-hoc durch gebaut werden können Abrufen von transkriptomischen Datensätzen für die bestimmten Pflanzenarten definierten Belastungen ausgesetzt. Darüber hinaus können ein einfacher Ansatz mit zwei Matrizen, eines mit paarweisen Ähnlichkeit Daten und eines mit paarweisen Co Ausdruck Koeffizienten angewendet werden um die Beziehungen zwischen Reihenfolge Ähnlichkeit und Ausdruck Muster innerhalb einer Genfamilie zu bewerten.

Diese Arbeit soll einen globalen Ansatz, Definition der Genstruktur, konserviertes Protein Motive, chromosomalen Position, gen Duplikationen und Expressionsmuster, als auch die Vorhersage von Protein Lokalisierung und Phosphorylierung Websites erreichen eine vollständige Charakterisierung einer Genfamilie in Pflanzen. Ein umfassender Ansatz wird hier auf die Charakterisierung der ATL E3 Ubiquitin Ligase Familie in Grapevine angewendet. Entsprechend der neuen Rolle des ATL Unterfamilie Mitglieder bei der Regulierung der wichtige zelluläre Prozesse7, diese Arbeit gut helfen die Identifizierung der starke Kandidaten für funktionelle Studien, und schließlich die molekularen Mechanismen zu entwirren der Anpassung von diesem wichtigen Kulturpflanzen auf seine Umgebung.

Protocol

1. Identifizierung des vermeintlichen ATL Genfamilie Mitglied(er) PSI-BLAST-Web-version Öffnen Sie BLAST Webseite13 , und klicken Sie auf Abschnitt Protein BLAST. Geben Sie im Feld “Enter Abfrage Sequence” die Aminosäure-Sequenz des Proteins (hier VIT_05s0077g01970), der als Sonde verwendet wird, um die anderen Familienmitglieder zu identifizieren.Hinweis: Ein guter Vertreter Protein sollte sein (ein Protein zeigt alle wichtigen Features, d…

Representative Results

Das VIT_05s0077g01970-gen, als am ähnlichsten A. Thaliana ATL2 (At3g16720) durch eine BLASTp Suche, diente als Sonde um die ATL Familienmitglieder in das Genom der Weinrebe Umfrage identifiziert (V. Vinifera cv Pinot Noir PN40024). Die PSI-BLAST-Analyse kamen nach ein paar Zyklen zeigt eine Liste der vermeintlichen Gene aus der Weinrebe ATL Genfamilie (Abbildung 1A). Das Vorhandensein der kanonischen RING-H2-Domäne für jeden Kandidaten wu…

Discussion

In der genomischen Ära wurden viele Genfamilien tief in mehreren Pflanzenarten charakterisiert. Diese Informationen sind Voraussetzung für funktionelle Studien und bieten einen Rahmen, um die Rolle der verschiedenen Mitglieder in einer Familie weiter zu untersuchen. In diesem Zusammenhang ist auch eine Notwendigkeit für eine Nomenklatur-System ermöglicht zur eindeutigen Identifizierung jedes Mitglied in einer Familie, Vermeidung von Redundanz und Verwirrungen, die entstehen können, wenn Namen von verschiedenen Forsc…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Die Arbeit wurde von der Universität von Verona im Rahmen des gemeinsamen Projekts 2014 (Charakterisierung der ATL-Genfamilie im Weinstock und sein Engagement im Widerstand gegen Plasmopara Viticola) unterstützt.

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).
check_url/kr/56626?article_type=t

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video