Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group

JoVE Journal > Behavior

Sciences du comportement

At oprette og anvende en Reference for at lette drøftelserne og klassificering af proteiner i en forskelligartet gruppe

Published: August 16, 2017

doi:

10.3791/56107

D. Ellen K. Tarr

¹Department of Microbiology and Immunology, Arizona College of Osteopathic Medicine,Midwestern University

Summary

Målet med denne protokol er at udvikle en reference for divergerende proteiner i en gruppe, der mangler sammenhængende kriterier for nomenklatur og klassificering. Denne henvisning vil lette analyser og diskussion af gruppen som helhed og kan anvendes som supplement etablerede navne.

Abstract

Relaterede proteiner, der er blevet undersøgt i forskellige laboratorier ved hjælp af varierende organismer kan mangle et ensartet system af nomenklatur og klassificering, hvilket gør det vanskeligt at diskutere gruppen som helhed og at placere nye sekvenser i den relevante kontekst. Udvikle en reference, der prioriterer vigtigt sekvens funktioner relateret til struktur og/eller aktivitet kan bruges ud over etablerede navne til at tilføje nogle sammenhæng til en forskelligartet gruppe af proteiner. Dette papir bruger cystein-stabiliseret alpha-helix (CS-αβ) superfamilien som et eksempel til at vise hvordan en reference, der er genereret i regneark software kan afklare forholdet mellem eksisterende proteiner i superfamilien, samt lette tilføjelsen af nye sekvenser. Det viser også, hvordan henvisningen kan bidrage til at forfine sekvens alignments genereret i almindeligt anvendte software, som påvirker gyldigheden af fylogenetiske analyser. Brug af en henvisning vil sandsynligvis være mest nyttige for protein grupper, der omfatter meget forskellige sekvenser fra et bredt spektrum af taxa, med funktioner, der ikke er tilstrækkeligt fanget af molekylære analyser.

Introduction

Et protein navn bør afspejle karakteristika og forholdet til andre proteiner. Desværre navne tildeles generelt på tidspunktet for opdagelse, og forskningen fortsætter og forståelse af en større sammenhæng kan ændre. Dette kan føre til flere navne, hvis et protein blev selvstændigt identificeret af mere end én lab, at ændringer i nomenklatur eller i de kendetegn, menes at være endelige, når du tildeler navnet og navnet ikke længere tilstrækkelig differentiering af protein fra andre.

Hvirvelløse defensins give et godt eksempel på degeneration i nomenklatur og klassificering. De første hvirvelløse defensins blev rapporteret fra insekter, og det navn “insekt defensin” blev foreslået baseret på den opfattede homologi til pattedyr defensins¹^,². Sigt defensin bruges stadig, selv om det er nu klart, at hvirvelløse og pattedyr defensins deler ikke en fælles forfader³^,⁴. Afhængigt af arten, kan en hvirvelløse “defensin” har seks eller otte cysteines, (der udgør tre eller fire disulfid obligationer) og en række antimikrobielle aktiviteter. At komplicere situationen, proteiner med samme egenskaber som defensins ikke er altid kaldt “defensins,” som den for nylig påviste cremycins fra Caenorhabditis remanei⁵. Derudover er hvirvelløse store defensins mere tilbøjelige til at være evolutionært relateret til hvirveldyr β-defensins end til andre hvirvelløse defensins⁶. Trods dette stole forskere undertiden på den navnet “defensin” ved fastlæggelsen af, hvilke sekvenser bør inkluderes i analyserne.

Strukturelle undersøgelser afslørede ligheden mellem insekt defensins og scorpion toksiner⁷og CS-αβ fold blev senere etableret som den strukturelle kendetegn for insekt defensins⁸. Denne fold definerer scorpion toksin-lignende (CS-αβ) superfamilien i strukturelle klassificering af proteiner (SCOP) database⁹, som i øjeblikket omfatter fem familier: insekt defensins, kortkædede scorpion toksiner, langkædede scorpion toksiner, MGD-1 (fra en bløddyr), og plante defensins. Denne superfamilien er synonymt med den seneste beskrevet cis-defensins⁴ og superfamilien 3.30.30.10 i CATH-genet 3D database¹⁰^,¹¹. Undersøgelser fra en række af hvirvelløse taxa, planter og svampe vis at navnene på proteiner, der indeholder denne fold ikke klart er relateret til cystein nummer eller limning mønster, antimikrobiel aktivitet eller evolutionær historie¹².

Manglen sammenhæng og klare kriterier gør det udfordrende at navngive og klassificere nyligt identificerede sekvenser i denne superfamilien. En væsentlig hindring for sammenligning af proteiner i denne superfamilien er, at cysteines er nummereret med hensyn til hver enkelt sekvens (den første cystein i hver sekvens er C1) med ingen måde at tage højde for den strukturelle rolle. Det betyder, at kun sekvenser med det samme antal cysteines kan sammenlignes. Der er lille sekvens bevarelse end cysteines danner CS-αβ-fold, hvilket vanskeliggør linjeføringer og fylogenetiske analyser. Ved at udvikle et nummersystem, der prioriterer strukturelle træk, kan superfamilien sekvenser mere nemt sammenlignet og justeret. Bevarede funktioner, som de definerer undergrupper, kan visualiseres hurtigt, og nye sekvenser mere let kan placeres i den relevante kontekst.

Dette papir bruger regneark software (fx Excel) til at generere en reference nummerering system for CS-αβ superfamilien. Det viser hvordan dette tydeliggør sammenligninger mellem sekvenser og gælder det nye CS-αβ sekvenser identificeret fra Biogeografi. Bruger CS-αβ superfamilien som et eksempel, var protokollen skrevet at yde vejledning, når du bruger sekvenser af interesse; Det er dog ikke beregnet til at være specifik for denne superfamilien eller cystein-rige sekvenser. Denne metode vil sandsynligvis være mest nyttig for grupper af proteiner, der har været forsket uafhængigt i divergerende taxa og/eller har lille samlede sekvens homologi, med diskrete egenskaber, der ikke kan genkendes nemt af Molekylær analyse software. Denne metode kræver nogle på forhånd beslutninger om vigtige funktioner, så det vil være af begrænset nytte, hvis ingen vigtige funktioner er blevet identificeret. Det primære mål er at vise, hvordan en simpel visualisering af sekvens relationer kan opnås. Dette kan så bruges til at informere sequence alignment og analyse, men hvis justering og analyse er de primære mål, en stregkode metode ville være et egnet alternativ, som har mere kapacitet til automatisering¹³. Den nuværende metode viser funktionerne af hver peptid i en lineær form, så det ikke vil være nyttigt for den direkte visualisering af 3D-struktur.

Protocol

1. afgøre definerer funktionerne i gruppen Protein af interesse Consult tidligere publikationer til at afgøre, om der er enighed om de funktioner, der er nødvendige for at blive betragtet som en del af gruppen. Vær opmærksom på eventuelle uoverensstemmelser eller forskelle i opfattelse mellem forskningsgrupper, og omfatter egenskaber, der kan tjene til at adskille en undergruppe af en anden. Hvis tidligere litteratur ikke omhandler definerende karakteristik, bruge sekvenser, der betragtes som r…

Representative Results

Grupper af sekvenser i CS-αβ superfamilien rapporteret i litteraturen er vist i figur 4. Cystein bindinger baseret på nummerering for hver sekvens foreslår fem grundlæggende grupper (tabel 1, midterste kolonne). Gruppe 1 har seks cysteines, der fra tre disulfid obligationer og indeholder sekvenser fra insekter, arachnids, bløddyr, nematoder og svampe. Gruppe 2, 3 og 4 har 8 cysteines, der danner fire disulfid obligationer. Gruppe 2 omfa…

Discussion

Kriterier til at navngive et protein inden for en gruppe skal være klart, men det er ikke altid tilfældet. Sekvenser, der har CS-αβ fold har været studeret i mange laboratorier ved hjælp af en række forskellige organismer, hvilket resulterer i forskellige systemer i nomenklatur, samt forskellige niveauer af karakterisering. Forsøger at indføre en helt ny nomenklatur er ikke rimeligt og ville resultere i en stor forvirring, når consulting tidligere litteratur. Reference nummerering system kan bruges ud over navn…

Divulgations

The authors have nothing to disclose.

Acknowledgements

Igangværende tardigrade antimikrobielle peptid forskning er støttet af murene finansiering fra Midwestern Universitet Office of Research og sponsorerede programmer (ORSP). ORSP spillede ingen rolle i undersøgelse design, dataindsamling, analyse, fortolkning eller manuskript forberedelse.

Materials

BLAST webpage		https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite)	DNASTAR	https://www.dnastar.com/t-allproducts.aspx
Excel 2013	Microsoft
FigTree		http://tree.bio.ed.ac.uk/software/figtree/
MEGA		www.megasoftware.net
MrBayes		http://mrbayes.sourceforge.net/
SCOP database		http://scop.mrc-lmb.cam.ac.uk/scop/

References

Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citer Cet Article

Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

At oprette og anvende en Reference for at lette drøftelserne og klassificering af proteiner i en forskelligartet gruppe

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgations

Acknowledgements

Materials

References

Tags

Play Video

Citer Cet Article

View Video

At oprette og anvende en Reference for at lette drøftelserne og klassificering af proteiner i en forskelligartet gruppe

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgations

Acknowledgements

Materials

References

Tags

Play Video

Citer Cet Article

View Video

✖

To prove you're not a robot, please enter the text in the image below