Summary

Uitgebreide Workflow voor de genoom-brede identificatie en expressie Meta-analyse van de ATL E3 Ubiquitin Ligase Gene familie in Grapevine

Published: December 22, 2017
doi:

Summary

Dit artikel beschrijft de procedure voor de identificatie en karakterisering van de familie van een gen in grapevine toegepast aan de familie van Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitin ligases.

Abstract

Indeling en naamgeving van genen in een gezin kunnen aanzienlijk bijdragen aan de beschrijving van de diversiteit van gecodeerde eiwitten en de voorspelling van familiefeesten gebaseerd op verschillende functies, zoals de aanwezigheid van reeks motieven of van bepaalde sites voor de posttranslationele wijziging en het profiel van de expressie van familieleden in verschillende omstandigheden. Dit werk beschrijft een gedetailleerd protocol voor karakterisering van de familie van het gen. Hier wordt de procedure toegepast op de karakterisatie van de familie van Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitin ligase in grapevine. De methoden omvatten de genoom-brede identificatie van familieleden, de karakterisatie van gene lokalisatie, structuur en duplicatie, de analyse van geconserveerde proteïne motieven, de voorspelling van eiwit lokalisatie en fosforylering sites, evenals gen expressie profilering over de familie in verschillende datasets. Dergelijke procedure, die kan worden verlengd tot verdere analyses afhankelijk van experimentele doeleinden, kan worden toegepast op elke gen familie in alle plantensoorten waarvoor genomic gegevens beschikbaar zijn, en biedt waardevolle informatie ter identificatie van interessante kandidaten voor functionele studies, geeft inzicht in de moleculaire mechanismen van plant aanpassing aan hun omgeving.

Introduction

Tijdens het laatste decennium, veel onderzoek verricht in grapevine genomica. Grapevine is een erkende economisch relevante gewas, die uitgegroeid een model voor onderzoek op fruit ontwikkeling en op de reacties van houtige gewassen op biotische en abiotische benadrukt tot is. In deze context, de vrijlating van de soort Vitis vinifera cv. PN40024 genoom in 20071 en de bijgewerkte versie in 20112 geleid tot een snelle ophoping van ‘ Omics ‘-schaal gegevens en tot een uitbarsting van high-throughput onderzoek. Op basis van de gepubliceerde reeks gegevens, de uitgebreide analyse van een bepaald gen familie (meestal opgebouwd uit eiwitten delen van geconserveerde motieven, structurele en/of functionele gelijkenissen en evolutionaire relaties), kan nu worden uitgevoerd om bloot te zijn moleculaire functies, evolutie en gen expressieprofielen. Deze analyses kunnen bijdragen aan inzicht hoe gen gezinnen fysiologische processen op het niveau van een genoom-brede te controleren.

Veel aspecten van de levenscyclus van de plant worden geregeld door ubiquitin-gemedieerde afbraak van belangrijke eiwitten, waarvoor een verfijnd omzet om regelmatige cellulaire processen. Belangrijke onderdelen van het proces van ubiquitin-gemedieerde afbraak zijn de E3 ubiquitin ligases, die belast zijn met systeem flexibiliteit, dankzij de aanwerving van specifieke doelstellingen3. Dienovereenkomstig, vertegenwoordigen deze enzymen een enorme gen-familie, met ongeveer 1.400 E3 ligase-encoding genen voorspeld in Arabidopsis thaliana genoom4, elke E3 ubiquitin ligase handelt voor de ubiquitination van specifieke doel eiwitten. Ondanks het belang van substraat-specifieke ubiquitination in cellulaire verordening in planten, is weinig bekend over hoe het traject ubiquitination is gereguleerd en doel eiwitten zijn geïdentificeerd alleen in een paar gevallen. De ontcijfering van dergelijke mechanismen specificiteit en de verordening berust eerst op de identificatie en karakterisering van de verschillende onderdelen van het systeem, met name de E3 ligases. Onder ubiquitin ligases, wordt de ATL onderfamilie gekenmerkt door 91 leden geïdentificeerd in A. thaliana weergeven van een RING-H2 vinger domein5,6, sommigen van hen spelen een rol in de verdediging en hormoon reacties7.

De eerste cruciale stap om de leden van een nieuwe gen-familie te definiëren is de nauwkeurige definitie van de familie functies, zoals consensus motieven, sleutelgebieden en eiwit sequentie kenmerken. Inderdaad, het betrouwbare ophalen van alle gene familieleden op basis van BLAST analyse vereist enkele verplichte reeks kenmerken, in bepaalde eiwitten domeinen verantwoordelijk voor eiwit functie/activiteit, proteïne handtekening bijeenkomen. Dit kan worden vergemakkelijkt door eerdere karakterisering van hetzelfde gen gezin bij andere plantensoorten of bereikt door het analyseren van verschillende genen vermoedelijk die behoren tot dezelfde familie in verschillende plantensoorten, te isoleren van gemeenschappelijke sequenties. De familieleden kunnen vervolgens worden afzonderlijk genoemd volgens gemeenschappelijke regels geregeld door internationale consortia voor een bepaalde plantensoorten. In grapevine, bijvoorbeeld is zo’n procedure onderworpen aan de aanbevelingen van het Comité van de Super nomenclatuur voor druivenmost Gene aantekening (sNCGGa), tot oprichting van de bouw van een fylogenetische boom waaronder V. vinifera en A. thaliana familieleden van het gen dat gene annotatie gebaseerd op nucleotide sequences8.

Chromosoom lokalisatie van familieleden en gene dubbel enquête kunnen markeren van de aanwezigheid van geheel-genoom- of tandem gedupliceerde genen. Deze informatie verschijnt nuttig te ontrafelen van vermeende gene functies, aangezien het kan weergeven van functionele redundantie of verschillende situaties, dat wil zeggen, niet-functionalization, neo-functionalization of sub functionalization9 onthullen. Beide neo – en sub – functionalization zijn belangrijke gebeurtenissen die genetische nieuwheid, plant aanpassing aan veranderende omgevingen10te voorzien in de nieuwe cellulaire componenten maken. In het bijzonder, doublures van voorouderlijke genen en productie van nieuwe genen waren zeer frequent gedurende de evolutie van het genoom van de grapevine en nieuw gevormde genen afkomstig van proximale en tandem doublures in grapevine waren meer kans op produceren nieuw functies11.

Een andere belangrijke factor in het ontcijferen van de familie genfuncties is het profiel van de transcriptomic. De beschikbaarheid van openbare databanken die toegang geven tot een enorme hoeveelheid gegevens van de transcriptomic kan aldus worden benut om de vermeende functies toewijzen aan gene familieleden met behulp van grootschalige in silico expressie analyses. Inderdaad, de eigenaardige expressie van bepaalde genen in specifieke plant organen of in antwoord op bepaalde benadrukt kan geven enkele tips met betrekking tot de vermeende rol van de overeenkomstige eiwitten in welbepaalde omstandigheden, en steun geven aan hypothesen over mogelijke sub functionalization van gedupliceerde genen om verschillende uitdagingen aan. Voor dat doel, is het belangrijk om te overwegen verschillende datasets: dit kan reeds beschikbare gen expressie matrices, zoals de genoom-brede transcriptomic atlas van grapevine organen en ontwikkelingsstadia12, of ad hoc door kan worden gebouwd het ophalen van transcriptomic datasets voor de bijzondere plantensoorten onderworpen aan gedefinieerde benadrukt. Bovendien, een eenvoudige benadering met behulp van twee matrices, een met paarsgewijze gelijkenis gegevens en de andere met paarsgewijze co expressie coëfficiënten kunnen worden toegepast om te evalueren van de relaties tussen reeks gelijkenis en expressie patronen binnen de familie van een gen.

Het doel van dit werk is bedoeld als een globale aanpak, gene structuur, Geconserveerde proteïne motieven chromosomale locatie, gene duplicaties en expressiepatronen, als ook de voorspelling van eiwit lokalisatie en fosforylering sites, om te bereiken definiëren een uitputtende karakterisatie van de familie van een gen in planten. Een dergelijke aanpak is hier toegepast op de karakterisatie van de ATL E3 ubiquitin ligase familie in grapevine. Volgens de nieuwe rol van ATL onderfamilie leden bij het reguleren van de belangrijke cellulaire processen7, dit werk kan ook helpen de identificatie van sterke kandidaten voor functionele studies, en uiteindelijk het ontrafelen van de moleculaire mechanismen inzake de aanpassing van dit belangrijk gewas aan zijn omgeving.

Protocol

1. identificatie van vermeende ATL Gene familie lid/leden PSI-BLAST webversie Open de webpagina BLAST13 en klik op de eiwit BLAST sectie. Voer in het veld “Enter Query sequence” de volgorde van de aminozuur van het eiwit (hier VIT_05s0077g01970) die worden gebruikt als de sonde voor het identificeren van de andere gezinsleden.Opmerking: Een goede vertegenwoordiger eiwit moet worden gebruikt (een eiwit worden getoond alle belangrijke functies …

Representative Results

Het VIT_05s0077g01970 gen, geïdentificeerd als het meest vergelijkbaar met A. thaliana ATL2 (At3g16720) door een onderzoek van BLASTp, werd gebruikt als sonde enquête de ATL-familieleden in het genoom van de grapevine (V. vinifera cv Pinot Noir PN40024). De analyse van de PSI-BLAST geconvergeerde na een paar cycli onthullen een lijst van vermeende genen die behoren tot de grapevine ATL gene familie (figuur 1A). De aanwezigheid van het cano…

Discussion

In de genomic era, veel gene gezinnen diep gekenmerkt in verschillende plantensoorten. Deze informatie is voorafgaand aan functionele studies en bieden een kader om de rol van verschillende leden in een gezin verder te onderzoeken. In dit verband is er ook een noodzaak om een nomenclatuur systeem ter identificatie van elk lid in een gezin, het vermijden van de redundantie en de verwarring die kunnen ontstaan wanneer de namen onafhankelijk zijn toegewezen aan verschillende genen door verschillende onderzoeksgroepen.

<…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Het werk werd gesteund door de Universiteit van Verona, in het kader van gezamenlijke Project 2014 (karakterisering van de ATL gene familie in grapevine en haar betrokkenheid bij weerstand tegen Plasmopara noordelijke).

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).
check_url/kr/56626?article_type=t

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video