Summary

Creazione e applicazione di riferimento per facilitare la discussione e la classificazione delle proteine in un gruppo eterogeneo

Published: August 16, 2017
doi:

Summary

L’obiettivo del presente protocollo è quello di sviluppare un riferimento per le proteine divergenti in un gruppo che non dispone di criteri coerenti per la nomenclatura e classificazione. Questo riferimento faciliterà l’analisi e la discussione del gruppo nel suo complesso e può essere utilizzato in aggiunta nomi affermati.

Abstract

Proteine correlate che sono state studiate in diversi laboratori utilizzando diversi organismi potrebbero non avere un sistema uniforme di nomenclatura e classificazione, rendendo difficile per discutere il gruppo nel suo complesso e di inserire nuove sequenze nel contesto appropriato. Lo sviluppo di un riferimento che la funzionalità importante sequenza di priorità relative alla struttura e/o attività può essere utilizzata oltre a nomi affermati per aggiungere qualche coerenza a un gruppo eterogeneo di proteine. Questa carta utilizza la superfamiglia di cisteina-stabilizzato alfa-elica (CS-αβ) come un esempio per mostrare come un riferimento generato nel software di foglio di calcolo può chiarire le relazioni tra proteine esistenti nella superfamiglia, nonché facilitare l’aggiunta di nuovi sequenze. Viene inoltre illustrato come il riferimento può contribuire a perfezionare gli allineamenti di sequenza generati in software comunemente usato, che compromette la validità delle analisi filogenetiche. L’utilizzo di un riferimento sarà probabilmente più utile per i gruppi di proteine che includono sequenze altamente divergenti da un ampio spettro di taxa, con caratteristiche che non vengono adeguatamente acquisite dalle analisi molecolari.

Introduction

Nome di una proteina dovrebbe riflettere è caratteristiche e rapporto ad altre proteine. Purtroppo, i nomi vengono generalmente assegnati al momento della scoperta e, mentre la ricerca continua, la comprensione del contesto più ampio potrebbe cambiare. Questo può portare a più nomi se una proteina è stata identificata in modo indipendente da più di un laboratorio, ai cambiamenti nella nomenclatura o nelle caratteristiche pensate per essere definitiva quando si assegna il nome e il nome non è più sufficientemente differenziando la proteina dagli altri.

Invertebrati marini defensine forniscono un buon esempio di degenerazione nella nomenclatura e classificazione. Le defensine invertebrate prime sono state segnalate dagli insetti, e il nome “insetto defensine” è stato proposto basato sull’omologia percepita a mammiferi defensine1,2. Il termine defensine è ancora usata, anche se è ormai chiaro che defensine invertebrate e mammiferi non condividono un antenato comune3,4. A seconda della specie, un invertebrato “defensine” può avere sei o otto cisteine (che formano tre o quattro ponti disolfuro) e una varietà di attività antimicrobica. A complicare la situazione, proteine con le stesse caratteristiche come defensine non vengono sempre chiamate “defensine,” come la cremycins recentemente identificato da Caenorhabditis remanei5. Inoltre, defensine grande invertebrati marini sono più probabili essere evolutivamente correlato a vertebrati β-defensine rispetto a altri invertebrati defensine6. Nonostante questo, i ricercatori si affidano a volte il nome “defensine” quando si determina quali sequenze devono essere inclusi nelle analisi.

Gli studi strutturali hanno rivelato la somiglianza tra insetto defensine e Scorpione tossine7, e la piega di CS-αβ successivamente è stata stabilita come la caratteristica strutturale di defensine insetto8. Questo ovile definisce la superfamiglia di scorpione tossina-come (CS-αβ) nella classificazione strutturale delle proteine (SCOP) database9, che attualmente include cinque famiglie: insetto defensine, catena corta Scorpione tossine, tossine dello Scorpione lungo-catena, MGD-1 (da un mollusco) e pianta defensine. Questa superfamiglia è sinonima di cis-defensine recentemente descritto4 e superfamiglia 3.30.30.10 in CATH/Gene database 3D10,11. Studi da una varietà di taxa di invertebrati, piante e funghi show che i nomi delle proteine che contengono questa piega non sono chiaramente correlati al numero di cisteina o modello di incollaggio, attività antimicrobica o storia evolutiva12.

La mancanza di coerenza e criteri chiari rendono impegnativo per denominare e classificare le sequenze più recentemente identificati di questa superfamiglia. Un ostacolo importante al confronto di proteine in questa superfamiglia è che cisteine sono numerate rispetto ogni sequenza individuale (il prima cisteina in ogni sequenza è C1), con nessun modo per rappresentare il ruolo strutturale. Ciò significa che possono essere paragonate solo sequenze con lo stesso numero di cisteine. C’è poco sequenza conservazione tranne le cisteine che formano la piega di CS-αβ, che rende difficile allineamenti e analisi filogenetiche. Attraverso lo sviluppo di un sistema di numerazione che dà priorità caratteristiche strutturali, sequenze di superfamiglia possono essere più facilmente rispetto e allineati. Caratteristiche conservate, così come quelle che definiscono i sottogruppi, possono essere fruiti rapidamente, e nuove sequenze possono essere più facilmente collocati nel contesto appropriato.

Questo documento utilizza un software di foglio di calcolo (ad esempio, Excel) per generare un sistema per la superfamiglia CS-αβ di numerazione di riferimento. Essa mostra come questo chiarisce i confronti tra le sequenze e le applica nuove sequenze di CS-αβ identificati dai tardigradi. Utilizzando la superfamiglia CS-αβ come esempio, il protocollo è stato scritto per fornire una guida quando si utilizza sequenze di interesse; Tuttavia, non è inteso per essere specifici di questa superfamiglia o sequenze ricche di cisteina. Questo metodo sarà probabilmente più utile per i gruppi di proteine che sono state studiate in modo indipendente in taxa divergenti e/o hanno poca omologia di sequenza complessiva, con discrete caratteristiche che non possono essere facilmente riconosciuti dal software di analisi molecolare. Questo metodo richiede alcune decisioni a priori per quanto riguarda caratteristiche importanti, quindi sarà di limitata utilità se non importanti caratteristiche sono state identificate. L’obiettivo primario è quello di mostrare come una semplice visualizzazione delle relazioni di sequenza può essere raggiunto. Questo quindi può essere utilizzato per informare l’allineamento di sequenza e l’analisi, ma se l’allineamento e l’analisi sono gli obiettivi primari, un metodo di codice a barre sarebbe una valida alternativa che ha più capacità per automazione13. Il metodo corrente Visualizza le funzioni di ciascun peptide in una forma lineare, quindi non sarà disponibile per la visualizzazione diretta della struttura 3D.

Protocol

1. determinare le caratteristiche di definizione del gruppo di proteine di interesse Consult precedenti pubblicazioni per determinare se c’è un consenso per quanto riguarda le caratteristiche che sono necessarie per essere considerato parte del gruppo. Prendere nota di eventuali incongruenze o differenze di opinione tra gruppi di ricerca e includere caratteristiche che possono servire a distinguere un sottogruppo da altra. Se la letteratura precedente non riguarda caratteristiche distintive, utilizz…

Representative Results

Gruppi di sequenze nella superfamiglia delle CS-αβ segnalato nella letteratura sono mostrati in Figura 4. Gli abbinamenti di cisteina basati sulla numerazione per ogni sequenza suggeriscono cinque gruppi di base (tabella 1, colonna centrale). Il gruppo 1 ha sei cisteine che da bisolfuro di tre legami e include sequenze da insetti, aracnidi, molluschi, nematodi e funghi. Gruppi 2, 3 e 4 hanno 8 cisteine che formano quattro ponti disolfuro. G…

Discussion

I criteri per la denominazione di una proteina all’interno di un gruppo dovrebbero essere chiari, ma questo non è sempre il caso. Sequenze che hanno il CS-αβ piegare sono state studiate in molti laboratori utilizzando una varietà di organismi, risultante in diversi sistemi di nomenclatura, nonché a diversi livelli di caratterizzazione. Tentando di imporre una completamente nuova nomenclatura non è ragionevole e si tradurrebbe in una grande quantità di confusione durante la consultazione letteratura precedente. Un …

Divulgations

The authors have nothing to disclose.

Acknowledgements

Ricerca in corso tardigrade peptide antimicrobico è supportato da finanziamenti intramurale dalla Midwestern University Office of Research e sponsorizzato programmi (ORSP). Il ORSP non aveva alcun ruolo nel disegno dello studio, raccolta dati, analisi, interpretazione o preparazione del manoscritto.

Materials

BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

References

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).

Play Video

Citer Cet Article
Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

View Video