Summary

Opprette og bruke en referanse for å tilrettelegge for diskusjon og klassifisering av proteiner i en sammensatt gruppe

Published: August 16, 2017
doi:

Summary

Målet med denne protokollen er å utvikle en referanse for divergerende proteiner i en gruppe som mangler sammenhengende kriterier for nomenklatur og klassifisering. Denne referansen vil lette analyser og diskusjon av gruppen som helhet, og kan brukes i tillegg til etablerte navn.

Abstract

Relaterte proteiner som har vært undersøkt i forskjellige labs ved hjelp av ulike organismer kan mangle et enhetlig system for nomenklatur og klassifisering, gjør det vanskelig å diskutere gruppen som helhet, og plassere nye sekvenser i riktig sammenheng. Utvikle en referanse som prioriterer viktig sekvens funksjoner knyttet til struktur og/eller aktivitet kan brukes i tillegg til etablerte navn legge noen coherency til en mangfoldig gruppe av proteiner. Dette papiret bruker cystein-stabilisert alpha-helix (CS-αβ) gruppe som et eksempel for å vise hvordan en referanse generert i regneark kan avklare forholdet mellom eksisterende proteiner gruppe, samt rette nye sekvenser. Den viser også hvordan referansen kan hjelpe for å avgrense sekvens justeringer generert i brukte programvare, som påvirker gyldigheten av Fylogenetiske analyser. Bruk av en referanse vil trolig være mest nyttig for protein grupper med svært forskjellige sekvenser fra et bredt spekter av taxa, med funksjoner som ikke er tilstrekkelig fanget av molekylære analyser.

Introduction

Et protein navnet skal gjenspeile egenskaper og forhold til andre proteiner. Dessverre navn tildeles generelt på tidspunktet for oppdagelsen og, som forskning fortsetter, forståelsen av større sammenheng kan endres. Dette kan føre til flere navn hvis et protein ble uavhengig identifisert av flere lab, endringer i nomenklatur eller egenskapene antatt å være definitive tilordne navnet og navnet lenger tilstrekkelig skille protein fra andre.

Virvelløse defensins gir et godt eksempel på degenerasjon nomenklatur og klassifisering. De første virvelløse defensins ble rapportert av insekter og navnet “insekt defensin” ble foreslått basert på oppfattet homologi pattedyr defensins1,2. Uttrykket defensin brukes fortsatt, selv om det er nå klart at virvelløse og pattedyr defensins deler ikke en felles stamfar3,4. Avhengig av arten, kan en virvelløse dyr “defensin” ha seks eller åtte cysteinene (som tre eller fire disulfide obligasjoner) og en rekke antimikrobielle aktiviteter. Å komplisere situasjonen, proteiner med samme egenskaper som defensins ikke alltid kalles “defensins,” som nylig identifisert cremycins Caenorhabditis remanei5. I tillegg er virvelløse store defensins mer sannsynlig å være evolusjonært relatert til vertebrate β-defensins enn andre virvelløse defensins6. Til tross for dette, forskere og stole på det navnet “defensin” når sekvenser som skal inkluderes i analyser.

Strukturelle studier avdekket likheten mellom insekt defensins og scorpion giftstoffer7og CS-αβ fold ble deretter etablert som strukturelle karakteriserer insekt defensins8. Denne hjord definerer skorpion gift som (CS-αβ) gruppe i strukturelle klassifisering av proteiner (alle) databasen9, som for tiden omfatter fem familier: insekt defensins, kort-kjeden scorpion giftstoffer, langkjedede scorpion giftstoffer, MGD-1 (fra en mollusk) og plante defensins. Denne overfamilie er synonymt med nylig beskrevet cis-defensins4 og overfamilie 3.30.30.10 i CATH/gen 3D database10,11. Studier fra en rekke virvelløse taxa, planter og sopp viser at navnene på proteiner som inneholder denne hjord ikke tydelig gjelder cystein nummer eller bånd mønster, antimikrobielle aktivitet eller evolusjonær historie12.

Mangel på konsistens og klare kriterier gjør det utfordrende å navngi og klassifisere nylig identifiserte sekvenser i denne gruppe. En stor utfordring å sammenligne proteiner i denne overfamilie er at cysteinene er nummerert med hensyn til hver individuelle sekvens (den første cystein i hvert forløp er C1), med ingen måte å ta hensyn til den strukturerte rollen. Dette betyr at bare sekvenser med samme antall cysteinene kan sammenlignes. Det er lite sekvens bevaring enn cysteinene danner CS-αβ flippen, noe som gjør justeringer og Fylogenetiske analyser vanskelig. Ved å utvikle et nummereringssystem som prioriterer strukturfunksjonene, kan overfamilie sekvenser lettere forhold og justert. Bevarte funksjoner, samt de definerer undergrupper, kan visualiseres raskt, og nye sekvenser lettere kan plasseres i riktig sammenheng.

Denne oppgaven bruker et regnearkprogram (foreksempel Microsoft Excel) til å generere en referanse nummereringen system for CS-αβ gruppe. Den viser hvordan dette tydeliggjør sammenligninger mellom sekvenser og bruker den nye CS-αβ sekvenser identifisert fra tardigrades. Eksempel på bruk av CS-αβ gruppe ble protokollen skrevet for å gi veiledning ved sekvenser av interesse; men er det ikke ment å være spesifikk denne overfamilie eller cystein-rik sekvenser. Denne metoden vil trolig være mest nyttig for grupper av proteiner som har blitt undersøkt uavhengig i divergerende taxa og/eller har liten samlede sekvens homologi, med diskret egenskaper som ikke kan være lett anerkjent av molekylære analyseprogramvare. Denne metoden krever noe en priori avgjørelser angående viktige funksjoner, så det er av begrenset nytte hvis ingen viktige funksjoner har blitt identifisert. Hovedmålet er å vise hvordan en enkel visualisering sekvens relasjonene kan oppnås. Dette kan brukes å informere sekvens justering og analyse, men hvis justering og analyse er de primære mål, en strekkode metode vil være et egnet alternativ som har mer kapasitet for automatisering13. Det aktuelle metoden viser funksjonene i hver peptid i en lineær form, så det vil være nyttig for direkte visualisering av 3D-struktur.

Protocol

1. fastslå definere funksjonene i gruppen Protein av interesse kontakt tidligere publikasjoner å avgjøre om det er konsensus om funksjonene som er nødvendig for å bli betraktet som en del av gruppen. Legg merke til uoverensstemmelser eller forskjeller i mening mellom forskningsgrupper, og inneholder egenskaper som kan tjene til å skille en undergruppe fra en annen. Hvis forrige litteratur ikke løser definere kjennetegn, bruk sekvenser som anses representative for gruppen som utgangspunkt til ?…

Representative Results

Grupper av sekvenser CS-αβ gruppe rapportert i litteraturen er vist i Figur 4. Cystein motstandere basert på nummereringen for hver foreslå fem grunnleggende grupper (tabell 1, midterste kolonnen). 1 har seks cysteinene som fra tre disulfide obligasjoner og inkluderer sekvenser fra insekter, edderkoppdyr, bløtdyr, nematoder og sopp. Grupper 2, 3 og 4 har 8 cysteinene som danner fire disulfide obligasjoner. Gruppe 2 inkluderer insekt, ara…

Discussion

Kriteriene for å navngi et protein i en gruppe bør være klart, men dette er ikke alltid tilfelle. Sekvenser som har CS-αβ brett har vært studert i mange laboratorier ved hjelp av en rekke organismer, som resulterer i ulike systemer av nomenklatur, samt varierende nivåer av karakterisering. Prøver å innføre en helt ny nomenklaturen er ikke rimelig og vil føre til mye forvirring når rådgivning tidligere litteratur. En referanse nummereringen system kan brukes i tillegg til navnet på et protein for å avklare …

Divulgations

The authors have nothing to disclose.

Acknowledgements

Pågående tardigrade antimikrobielle peptid forskning støttes av intramural finansiering fra Midwestern University Office for forskning og sponset programmer (ORSP). ORSP ikke hadde noen rolle i studien design, innsamling, analyse, tolkning eller manuskriptet forberedelse.

Materials

BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

References

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).
check_url/fr/56107?article_type=t

Play Video

Citer Cet Article
Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

View Video