Summary

Skapa och tillämpa en referens för att underlätta diskussion och klassificering av proteiner i en heterogen grupp

Published: August 16, 2017
doi:

Summary

Målet med detta protokoll är att utveckla en referens för olika proteiner i en grupp som saknar sammanhängande kriterier för nomenklatur och klassifikation. Denna hänvisning kommer att underlätta analyser och diskussioner i gruppen som helhet och kan användas förutom etablerade namn.

Abstract

Relaterade proteiner som har studerats i olika laboratorier använder olika organismer kan sakna ett enhetligt system av nomenklaturen och klassificering, vilket gör det svårt att diskutera gruppen som helhet och att placera nya sekvenser i lämpliga sammanhang. Utveckla en referens som prioriterar viktiga sekvens funktioner avser struktur eller verksamhet kan användas förutom etablerade namn för att lägga några koherens till en mångskiftande grupp av proteiner. Detta papper används cystein-stabiliserad alfa-helix (CS-αβ) överfamiljen som exempel för att visa hur en referens som genereras i kalkylprogram kan klargöra relationerna mellan befintliga proteiner i överfamiljen, samt underlätta tillägg av nya sekvenser. Det visar också hur referensen kan bidra till att förfina sekvens linjeföring genereras i vanliga programvara, vilket påverkar giltigheten av fylogenetiska analyser. Användning av en referens kommer sannolikt mest användbart för protein grupper som inkluderar mycket olika sekvenser från ett brett spektrum av taxa, med funktioner som inte fångas tillräckligt av molekylära analyser.

Introduction

En proteinets namnet ska återspegla är egenskaper och förhållande till andra proteiner. Tyvärr, enhetsnamnen tilldelas generellt vid tiden för upptäckten och forskning fortsätter, förståelsen av större sammanhang kan ändras. Detta kan leda till flera namn om ett protein identifierades självständigt av mer än en lab, att ändringar i nomenklaturen eller egenskaper tros vara definitiv när du tilldelar namn och att namnet inte längre tillräckligt att differentiera proteinet från andra.

Ryggradslösa defensins ger ett bra exempel på degeneration i nomenklatur och klassifikation. De första ryggradslösa defensins rapporterades från insekter, och det namnet ”insekt defensin” föreslogs baserat på den upplevda homologi till däggdjur defensins1,2. Den termen defensin används fortfarande, även om det står nu klart att ryggradslösa och däggdjur defensins delar inte en gemensam förfader3,4. Beroende på art, kan en ryggradslösa ”defensin” ha sex eller åtta cysteines (som bildar tre eller fyra disulfide obligationer) och en mängd antimikrobiella aktiviteter. Att komplicera situationen, proteiner med samma egenskaper som defensins inte alltid kallas ”defensins”, såsom den nyligen identifierade cremycins från Caenorhabditis remanei5. Dessutom är ryggradslösa stora defensins mer benägna att vara evolutionärt relaterade till ryggradsdjur β-defensins än till andra ryggradslösa defensins6. Trots detta forskare förlitar sig ibland på det namnet ”defensin” vid fastställandet av vilka sekvenser bör ingå i analyserna.

Strukturella studier visade likheten mellan insekt defensins och scorpion gifter7och CS-αβ luckan var därefter etablerad som den strukturella kännetecknande för insekt defensins8. Här fållan definierar scorpion toxin-liknande (CS-αβ) överfamiljen i strukturella klassificering av proteiner (SCOP) databas9, som för närvarande omfattar fem familjer: insekt defensins, kortkedjade scorpion toxiner, långkedjiga scorpion toxiner, MGD-1 (från en mollusk) och växt defensins. Denna Överfamilj är synonymt med de nyligen beskrivna cis-defensins4 och överfamiljen 3.30.30.10 i CATH/Gene 3D databasen10,11. Studier från en mängd evertebrater, växter och svampar Visa att namnen på proteiner som innehåller denna fålla inte är klart relaterade till cystein nummer eller limning mönster, antimikrobiell aktivitet eller evolutionära historia12.

Bristen på konsekvens och tydliga kriterier gör det utmanande att namnge och klassificera nyligen identifierade sekvenser i denna superfamiljen. Ett stort hinder för jämföra proteiner i denna Överfamilj är att cysteines numreras med avseende på varje enskild sekvens (den första cystein i varje sekvens är C1), med inget sätt att ta hänsyn till strukturella roll. Detta innebär att endast sekvenser med samma antal cysteines kan jämföras. I området i närheten finns det lilla sekvens bevarande än de cysteines som bildar CS-αβ luckan, vilket försvårar anpassningar och fylogenetiska analyser. Genom att utveckla ett numreringssystem som prioriterar strukturella egenskaper, kan superfamiljen sekvenser lättare jämföras och arrangera i rak linje. Bevarade funktioner, samt de definiera subgrupper, kan visualiseras snabbt, och nya sekvenser kan enkelt placeras i lämpliga sammanhang.

Detta papper använder ett kalkylprogram (exempelvis Excel) för att generera en referens numreringssystem för CS-αβ överfamiljen. Det visar hur detta klargör jämförelser mellan sekvenser och gäller det nya CS-αβ-sekvenser som identifierats från tardigrades. Med CS-αβ överfamiljen som exempel, skrevs protokollet att ge vägledning när du använder sekvenser av intresse. Det är emellertid inte avsedd att vara specifik för denna superfamiljen eller till cystein-rika sekvenser. Denna metod kommer sannolikt mest användbara för grupper av proteiner som har undersökts självständigt i olika taxa och/eller har lite övergripande sekvenshomologi, med diskret egenskaper som inte kanske kan enkelt identifieras av molekylär analysprogramvara. Denna metod kräver vissa förhand beslut om viktiga funktioner, så det blir av begränsad nytta om inga viktiga funktioner har identifierats. Det primära målet är att visa hur en enkel visualisering av sekvens relationer kan uppnås. Detta kan sedan användas för att informera sekvens justering och analys, men om justering och analys är de primära målen, en streckkod metod skulle vara ett lämpligt alternativ som har mer kapacitet för automation13. Den nuvarande metoden visar funktionerna i varje peptid i en linjär form, så det inte kommer vara bra för direkt visualisering av 3D-strukturen.

Protocol

1. bestämma definiera funktioner i gruppen Protein av intresse Consult tidigare publikationer att avgöra om det finns en enighet om de funktioner som är nödvändiga för att betraktas som en del av gruppen. Notera eventuella inkonsekvenser eller skillnader i uppfattning mellan forskargrupper och har egenskaper som kan användas för att skilja en undergrupp från en annan. Om tidigare litteratur inte behandlar definierande egenskaper, använda sekvenser som företrädare för gruppen anses en utg…

Representative Results

Grupper av sekvenser i CS-αβ överfamiljen rapporterats i litteraturen redovisas i figur 4. Cystein kopplingarna baserat på numreringen för varje sekvens föreslår fem grundläggande grupper (tabell 1, mellersta kolumnen). Grupp 1 har sex cysteines som från tre disulfide obligationer och innehåller sekvenser från insekter, spindeldjur, mollusker, nematoder och svampar. Grupperna 2, 3 och 4 har 8 cysteines som bildar fyra disulfide obl…

Discussion

Kriterierna för att namnge ett protein inom en grupp bör vara tydlig, men detta är inte alltid fallet. Sekvenser som har den CS-αβ vik har studerats i många övningar med hjälp av olika organismer, vilket resulterar i olika system i nomenklaturen, samt olika nivåer av karakterisering. Försöker införa en helt ny nomenklatur är inte rimligt och skulle resultera i en hel del förvirring när consulting tidigare litteratur. En referens numreringssystem kan användas förutom namnet på ett protein för att klarg?…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Pågående tardigrade antimikrobiella peptid forskning stöds av intramurala finansiering från Midwestern University kontor för forskning och sponsrade program (ORSP). ORSP hade ingen roll i studiedesign, datainsamling, analys, tolkning eller manuskript förberedelse.

Materials

BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

Riferimenti

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).
check_url/it/56107?article_type=t

Play Video

Citazione di questo articolo
Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

View Video