Summary

Aanmaken en toepassen van een verwijzing ter vergemakkelijking van de discussie en de indeling van de eiwitten in een Diverse groep

Published: August 16, 2017
doi:

Summary

Het doel van dit protocol is het ontwikkelen van een verwijzing voor uiteenlopende eiwitten in een groep die ontbreekt aan coherente criteria voor nomenclatuur en classificatie. Deze referentie zal vergemakkelijken, analyses en discussie van de groep als geheel en kan worden gebruikt naast gevestigde namen.

Abstract

Verwante proteïnen die zijn bestudeerd in verschillende laboratoria met behulp van verschillende organismen mag het ontbreken van een uniform systeem van nomenclatuur en classificatie, waardoor het moeilijk is om te bespreken van de groep als geheel en nieuwe sequenties in de juiste context plaatsen. Ontwikkeling van een referentie die prioriteit belangrijke reeks functies geeft verband houden met structuur en/of activiteit kan worden gebruikt naast gevestigde namen toe te voegen sommige coherentie aan een diverse groep van eiwitten. Deze paper gebruikt de superfamilie cysteïne-gestabiliseerde alpha-helix (CS-αβ) als een voorbeeld om te laten zien hoe een verwijzing gegenereerd in spreadsheet-software kan verduidelijking van de relaties tussen bestaande eiwitten in de superfamilie, evenals vergemakkelijken de toevoeging van nieuwe sequenties. Het laat ook zien hoe de verwijzing kan helpen om reeks aanpassingen gegenereerd in de gebruikte software, die invloed op de geldigheid van de fylogenetische analyses te verfijnen. Het gebruik van een verwijzing zal waarschijnlijk meest nuttig voor eiwit groepen waarin zeer uiteenlopende sequenties van een breed spectrum van taxa, met functies die niet adequaat door moleculaire analyses zijn vastgelegd.

Introduction

Van een eiwit naam een afspiegeling is van de kenmerken en de relatie tot andere eiwitten. Helaas, namen zijn over het algemeen toegewezen op het moment van ontdekking en zoals onderzoek blijft, het inzicht in de grotere context kan veranderen. Dit kan leiden tot meerdere namen als een eiwit onafhankelijk door meer dan één lab, wijzigingen in de nomenclatuur of in de kenmerken gezien ontdekt werd als definitieve bij het toewijzen van de naam en de naam niet langer voldoende differentiatie van het eiwit van anderen.

Ongewervelde defensinen bieden een goed voorbeeld van degeneratie in de nomenclatuur en classificatie. De eerste-ongewervelde defensinen werden gemeld van insecten, en de naam “insect defensin” werd voorgesteld op basis van de waargenomen homologie aan zoogdieren defensinen1,2. De term defensin wordt nog steeds gebruikt, hoewel het is nu duidelijk dat ongewervelde en zoogdieren defensinen ben niet een gemeenschappelijke voorouder3,4. Afhankelijk van de soort kan wellicht een ongewervelden “defensin” zes of acht cysteines (die drie of vier disulfide bindingen vormen) en een scala aan antimicrobiële activiteiten. Om compliceren de situatie, eiwitten met dezelfde kenmerken als de defensinen zijn niet altijd genoemd “defensinen,” zoals de onlangs vastgestelde cremycins van Caenorhabditis remanei5. Daarnaast zijn de ongewervelde grote defensinen waarschijnlijker evolutionair verband te houden met gewervelde β-defensinen dan andere ongewervelde defensinen6. Ondanks dit, zijn onderzoekers soms afhankelijk van de naam “defensin” bij het bepalen welke rijen moeten worden opgenomen in de analyses.

Structurele studies bleek de gelijkenis tussen insect defensinen en scorpion toxines7en de CS-αβ-vouw vervolgens werd opgericht als het belangrijkste structurele kenmerk van insecten defensinen8. Deze vouw definieert de scorpion toxine-achtige (CS-αβ) superfamilie in de structurele indeling van eiwitten (SCOP) database9, waarin momenteel vijf families: insect defensinen, korte keten scorpion toxines, lange-keten scorpion toxines, MGD-1 (vanaf een weekdier), en plant defensinen. Deze superfamilie is synoniem met de recent beschreven cis-defensinen4 en de superfamilie 3.30.30.10 in de CATH/Gene 3D database10,11. Studies uit een verscheidenheid van ongewervelde taxa, planten en schimmels Toon dat de namen van eiwitten die deze vouw bevatten niet duidelijk zijn gerelateerd aan cysteïne getal of hechting patroon, antimicrobiële activiteit of evolutionaire geschiedenis12.

Het gebrek aan samenhang en duidelijke criteria maken het uitdagend naam te geven en nieuw geïdentificeerd sequenties in deze superfamilie classificeren. Een belangrijk obstakel voor het vergelijken van de eiwitten in deze superfamilie is dat cysteines met betrekking tot elke individuele opeenvolging (het eerste cysteïne in elke opeenvolging is C1), met geen enkele manier verantwoordelijk voor de structurele rol worden genummerd. Dit betekent dat alleen sequenties met hetzelfde aantal cysteines kunnen worden vergeleken. Er zijn kleine volgorde instandhouding dan de vorming van de CS-αβ-vouwen, waardoor uitlijning en fylogenetische analyses moeilijk cysteines. Door het ontwikkelen van een nummeringssysteem op dat prioriteit structurele kenmerken geeft, kunnen het superfamilie sequenties gemakkelijker worden vergeleken en uitgelijnd. Geconserveerde functies, alsmede vaststelling van subgroepen, kunnen snel worden gevisualiseerd en nieuwe sequenties kunnen gemakkelijker worden geplaatst in de juiste context.

Deze paper gebruikt een spreadsheet-programma (bijvoorbeeld Excel) voor het genereren van een systeem voor de CS-αβ-superfamilie nummering verwijzing. Het laat zien hoe dit verduidelijkt vergelijkingen tussen sequenties en toegepast op nieuwe CS-αβ-sequenties geïdentificeerd van beerdiertjes. De superfamilie van de CS-αβ als een voorbeeld gebruikt, werd het protocol geschreven te adviseren bij het gebruik van sequenties van belang; het is echter niet bedoeld om specifiek naar deze superfamilie of cysteïne-rijke sequenties. Deze methode zal wellicht nuttigst voor groepen van proteïnen toe die onafhankelijk van elkaar in uiteenlopende taxa zijn onderzocht en/of hebben weinig algemene reeks homologie, met aparte kenmerken die niet gemakkelijk kan worden herkend door moleculaire analysesoftware. Deze methode vereist sommige een priori besluiten over belangrijke kenmerken, dus het zal van beperkt nut als geen belangrijke kenmerken zijn geïdentificeerd. Het primaire doel is om te laten zien hoe een eenvoudige visualisatie van de reeks relaties kan worden bereikt. Dit kan vervolgens worden gebruikt om sequentie alignering en analyse te informeren, maar als uitlijning en analyse de primaire doelstellingen zijn, een barcode-methode zou een geschikt alternatief, dat meer capaciteit voor automatisering13 heeft. De huidige methode geeft de kenmerken van elke peptide in een lineaire vorm, zodat het niet zal nuttig zijn voor de directe visualisatie van 3D-structuur.

Protocol

1. bepalen van de functies definiëren van de groep van de proteïne van belang de vorige publicaties raadplegen om te bepalen of er een consensus over de functies die nodig zijn om te worden beschouwd als onderdeel van de groep. Neem nota van inconsistenties of meningsverschillen tussen onderzoeksgroepen, en omvatten kenmerken die dienen kunnen om te onderscheiden van een deelgroep van een ander. Als vorige literatuur definiërende kenmerken niet aanpakt, gebruiken sequenties die als vertegenwoordig…

Representative Results

Groepen van sequenties in de superfamilie van de CS-αβ gemeld in de literatuur worden weergegeven in Figuur 4. De cysteïne-koppelingen op basis van de nummering voor elke sequentie voorstellen vijf basisgroepen (tabel 1, middelste kolom). Groep 1 heeft zes cysteines die uit drie bisulfide obligaties en omvat sequenties van insecten, spinachtigen, weekdieren, aaltjes en schimmels. Groepen 2, 3 en 4 hebben 8 cysteines die vier disulfide bind…

Discussion

De criteria voor de naamgeving van een eiwit binnen een groep moet duidelijk zijn, maar dit is niet altijd het geval. Sequenties die hebben de CS-αβ vouwen zijn bestudeerd in veel laboratoria met behulp van een verscheidenheid van organismen, wat resulteert in verschillende systemen van de nomenclatuur, evenals de verschillende niveaus van karakterisering. Probeert op te leggen van een volledig nieuwe nomenclatuur is niet redelijk en zou leiden tot veel verwarring bij het raadplegen van de bestaande literatuur. Een ver…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Lopende tardigrade antimicrobiële peptide onderzoek wordt ondersteund door intramurale financiering uit het Midwesten Universiteit Office of Research en gesponsorde programma’s (ORSP). De ORSP had geen rol in de studie ontwerp, gegevensverzameling, analyse, interpretatie of manuscript voorbereiding.

Materials

BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

Riferimenti

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).

Play Video

Citazione di questo articolo
Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

View Video