Summary

Omfattende arbejdsgang for Genome-wide identifikation og udtryk Meta-analyse af ATL E3 Ubiquitin Ligase gen familie i Grapevine

Published: December 22, 2017
doi:

Summary

I denne artikel beskrives fremgangsmåden for identifikation og karakterisering af et gen familie i grapevine anvendes til familien af Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligases.

Abstract

Klassificering og nomenklatur af gener i en familie kan bidrage væsentligt til beskrivelsen af mangfoldigheden af kodede proteiner og forudsigelse af familien fungerer på basis af flere funktioner, såsom tilstedeværelsen af sekvens motiver eller af særlig websteder for posttranslationel modifikation og udtryk profil af familiemedlemmer i forskellige betingelser. Dette arbejde beskriver en detaljeret protokol for gen familie karakterisering. Her, anvendes proceduren, der til karakterisering af Arabidopsis Tóxicos i Levadura (ATL) E3 ubiquitin ligase familie i grapevine. Metoderne omfatter genome-wide identifikation af familiemedlemmer, karakterisering af genet lokalisering, struktur og dobbeltarbejde, analyse af bevarede protein motiver, forudsigelse af protein lokalisering og fosforylering websteder samt gen expression profilering på tværs af familien i forskellige DataSet. En sådan procedure, som kunne udvides til at omfatte yderligere analyser afhængig af forsøgsformål, kunne anvendes på enhver gen familie i enhver plantearter som genomisk data er tilgængelige, og det giver værdifulde oplysninger til at identificere interessante kandidater funktionelle studier, giver indsigt i de molekylære mekanismer af vegetabilsk tilpasning til deres miljø.

Introduction

I det sidste tiår, har megen forskning foretaget i grapevine genomforskning. Grapevine er en anerkendt økonomisk relevante afgrøde, som er blevet en model for forskning på frugt udvikling og svar af træagtige planter til biotiske og abiotiske understreger. I denne forbindelse, frigivelse af Vitis vinifera cv. PN40024 genom i 20071 og dens opdateret gengivelse i 20112 førte til en hurtig ophobning af “omik”-skala data og en byge af høj overførselshastighed undersøgelser. Baseret på offentliggjorte sekvens data, den omfattende analyse af et givent gen familie (generelt består af proteiner dele bevarede motiver, strukturelle og/eller funktionelle ligheder og evolutionære relationer), kan nu udføres for at afdække sin molekylære funktioner, evolution og gen expression profiler. Disse analyser kan bidrage til forståelsen af hvordan gen familier styrer fysiologiske processer på en genome-wide plan.

Mange aspekter af plante livscyklus er reguleret af ubiquitin-medieret nedbrydning af vigtige proteiner, der kræver en finjusteret omsætning for at sikre regelmæssig cellulære processer. Vigtige komponenter i ubiquitin-medieret nedbrydning-processen er E3 ubiquitin ligases, der er ansvarlig for systemet fleksibilitet, takket være rekruttering af specifikke mål3. Derfor, disse enzymer repræsenterer en enorm gen familie, med omkring 1.400 E3 ligase-kodning gener forudsagt i Arabidopsis thaliana genom4, hver E3 ubiquitin ligase handler for ubiquitination af specifikke mål proteiner. Trods vigtigheden af substrat-specifikke ubiquitination i cellulære regulering i planter, lidt om hvordan ubiquitination vej er reguleret og kun i et par tilfælde konstateret target proteiner. Afkodningen af sådanne mekanismer, specificitet og forordning bygger på identifikation og karakterisering af de forskellige komponenter i systemet, navnlig første E3 ligases. Blandt ubiquitin ligases, er ATL underfamilie karakteriseret ved 91 medlemmer identificeret i A. thaliana viser en RING-H2 finger domæne5,6, nogle af dem spiller en rolle i forsvaret og hormon svar7.

Det første afgørende skridt til at definere en ny gen familiemedlemmer er en præcis definition af de familie funktioner, såsom konsensus motiver, centrale domæner og protein sekvens karakteristika. Faktisk kræver pålidelige hentning af alle gen familiemedlemmer baseret på BLAST analyse nogle obligatoriske sekvens karakteristika, i bestemt protein domæner ansvarlig for protein funktion/aktivitet, der tjener som protein signatur. Dette kan lettes ved tidligere karakterisering af samme gen familie i andre plantearter eller opnået ved at analysere forskellige gener derfor tilhører den samme familie i forskellige plantearter, at isolere fælles sekvenser. Familiemedlemmer kan derefter individuelt navngives efter fælles regler afgjort af internationale konsortier for en given planteart. I grapevine, eksempelvis er en sådan procedure udsat for anbefalingerne fra den super-Nomenklaturudvalget for druemost gen Annotation (sNCGGa), om oprettelse af opførelsen af en Fylogenetisk træ herunder V. vinifera og A. thaliana gen familiemedlemmer til at tillade gen anmærkning baseret på nukleotid-sekvenser8.

Kromosom lokalisering af familiemedlemmer og gen dobbeltarbejde undersøgelse tillade fremhæve tilstedeværelsen af hele-genom eller tandem duplikerede gener. Disse oplysninger vises nyttige at trævle formodede genet funktioner, da det kan vise funktionel redundans eller afsløre forskellige situationer, dvs., ikke-functionalization, neo-functionalization eller sub functionalization9. Begge neo – og sub – functionalization er vigtige begivenheder, der skaber genetiske nyhed, om anlægget tilpasning til skiftende miljøer10nye cellulære komponenter. Især overlapning af forfædres gener og produktion af nye gener var meget hyppig under udviklingen i grapevine genome og nydannede gener med oprindelse fra proksimale og tandem gengangere i grapevine var mere tilbøjelige til at producere nye funktioner11.

En anden vigtig faktor i afkodningen genfunktion familie er transkriptom profil. Tilgængeligheden af offentlige databaser giver adgang til en enorm mængde af transkriptom data kan således udnyttes til at tildele formodede funktioner til gen familiemedlemmer ved hjælp af storstilet i siliciummangan udtryk analyser. Faktisk, den særegne udtryk for nogle gener i specifikke anlæg organer eller som svar på visse understreger kan give nogle gode råd med hensyn til de formodede roller i de tilsvarende proteiner i definerede betingelser, og give støtte til hypoteser om mulige sub functionalization af duplikerede gener til at reagere på forskellige udfordringer. Til dette formål, er det vigtigt at overveje flere datasæt: disse kan være allerede tilgængelige gen expression matrixer, såsom genome-wide transkriptom atlas over grapevine organer og udviklingsstadier12, eller kan bygges ad hoc- af hentning af transkriptom datasæt for de særlige plantearter underkastes definerede understreger. En simpel tilgang ved hjælp af to matrixer, kan en med parvise lighed data og den anden med parvise Co udtryk koefficienter desuden anvendes til at vurdere forholdet mellem sekvens lighed og udtryk mønstre inden for en gen familie.

Formålet med dette arbejde er at give en global tilgang, definere gen struktur, bevarede protein motiver, kromosomale placering, gen gengangere og udtryk mønstre, som godt forudsigelse af protein lokalisering og fosforylering sites, at opnå en udtømmende karakterisering af et gen familie i planter. Sådan en omfattende tilgang er anvendt her til karakterisering af ATL E3 ubiquitin ligase familie i grapevine. Ifølge ATL underfamilie medlemmer i at regulere cellulære nøgleprocesser7nye rolle, kan dette arbejde godt identificeringen af stærke kandidater til funktionelle studier, og til sidst optrævle de molekylære mekanismer, der regulerer de tilpasning af dette vigtige afgrøder til sine omgivelser.

Protocol

1. identifikation af formodede ATL gen familie medlem(mer) PSI-BLAST webversion Åbn BLAST web side13 og klik på afsnittet protein BLAST. I feltet “Enter forespørgsel sekvens” angive aminosyresekvens protein (her VIT_05s0077g01970), der skal bruges som sonden til at identificere de andre familiemedlemmer.Bemærk: En god repræsentant protein skal være brugt (et protein, der viser alle de vigtige funktioner, der karakteriserer familien).</l…

Representative Results

VIT_05s0077g01970 gen, identificeret som den mest svarende til A. thaliana ATL2 (At3g16720) gennem en BLASTp søgning, blev brugt som sonden til undersøgelse ATL familiemedlemmer i grapevine genome (V. vinifera cv Pinot Noir PN40024). PSI-BLAST analyse konvergeret efter et par cykler afslører en listen over formodede gener tilhører grapevine ATL gen familien (figur 1A). Tilstedeværelsen af de kanoniske RING-H2 domæne for hver kandidat b…

Discussion

I genomisk æra, har mange gen familier været dybt præget i flere plantearter. Denne information er forud funktionelle studier og giver en ramme for at undersøge yderligere rolle på forskellige medlemmer i en familie. I denne forbindelse er der også behov for en nomenklatur system giver mulighed for entydigt at identificere hver medlem i en familie og at undgå redundans og forvirring, der kan opstå, når navne er tildelt uafhængigt forskellige gener af forskellige forskergrupper.

Efter…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Arbejdet var støttet af universitetet i Verona inden for rammen af fælles projekt 2014 (karakterisering af familien ATL gen i grapevine og af sin deltagelse i modstanden mod Plasmopara viticola).

Materials

Personal computer
Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
Motif-based sequence analysis tools (MEME) http://meme-suite.org/
Geneious Biomatters Limited http://www.geneious.com/
ProtParam Tool http://web.expasy.org/protparam/
ngLOC http://genome.unmc.edu/ngLOC/index.html
TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
MUsite http://musite.sourceforge.net/
Pfam http://pfam.xfam.org/
TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
ProtScale http://web.expasy.org/protscale/
Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
MCScanX http://chibba.pgml.uga.edu/mcscan2/
Interactive Tree Of Life (iTOL) http://itol.embl.de/
UniProt http://www.uniprot.org/
Phylogeny.fr http://www.phylogeny.fr/index.cgi
MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012
Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
R https://www.r-project.org/
EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

References

  1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
  2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
  3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
  4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
  5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
  6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
  7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
  8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
  9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
  10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
  11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
  12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
  13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
  14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
  15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
  16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
  18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
  19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
  20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
  21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
  22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
  23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
  24. Overbeek, R., Fonstein, M., D’Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
  25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
  26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
  27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
  28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
  29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
  30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
  31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
  32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
  33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).
check_url/kr/56626?article_type=t

Play Video

Cite This Article
Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

View Video