Summary

Erstellen und anwenden von einen Verweis zur Erleichterung der Diskussion und Klassifikation der Proteine in eine bunt gemischte Gruppe

Published: August 16, 2017
doi:

Summary

Das Ziel dieses Protokolls ist es, eine Referenz für unterschiedliche Proteine in einer Gruppe zu entwickeln, die kohärente Kriterien für Nomenklatur und Klassifizierung fehlt. Dieser Verweis erleichtert die Analyse und Diskussion der Gruppe als Ganzes und kann neben etablierten Namen verwendet werden.

Abstract

Verwandte Proteine, die in verschiedenen Labors mit unterschiedlichen Organismen untersucht wurden, fehlen möglicherweise ein einheitliches System der Nomenklatur und Klassifizierung, macht es schwierig, die Gruppe als Ganzes zu diskutieren und neue Sequenzen in den entsprechenden Kontext zu platzieren. Eine Referenz, die wichtige Reihenfolge Funktionen priorisiert die Entwicklung im Zusammenhang mit Struktur und/oder Aktivität kann neben etablierten Namen hinzufügen einige Kohärenz zu einer vielfältigen Gruppe von Proteinen verwendet werden. Dieses Papier verwendet die Cystein-stabilisierten Alpha-Helix (CS-αβ) Überfamilie als Beispiel um zu zeigen, wie eine Referenz in Tabellenkalkulations-Software erzeugt kann klären Beziehungen zwischen vorhandenen Proteine in der Superfamilie, sowie erleichtern die Zugabe von neu Sequenzen. Es zeigt auch, wie die Referenz zur Sequenz Ausrichtungen erzeugt häufig verwendete Software, was Auswirkungen auf die Gültigkeit der phylogenetische Analysen zu verfeinern beitragen kann. Die Verwendung eines Verweises werden wahrscheinlich am hilfreichsten für Protein-Gruppen, die stark divergierende Sequenzen aus einem breiten Spektrum von Taxa mit Features enthalten, die nicht ausreichend durch molekulare Analysen erfasst werden.

Introduction

Ein Protein namens sollte widerspiegeln, ist Eigenschaften und Beziehungen zu anderen Proteinen. Leider Namen werden in der Regel zum Zeitpunkt der Entdeckung und Forschung geht weiter, das Verständnis von den größeren Kontext kann sich ändern. Dies kann zu mehreren Namen führen, wenn ein Protein unabhängig von mehr als ein Labor, Änderungen in der Nomenklatur oder in den Eigenschaften dachte, endgültig zu sein, wenn der Name zuweisen und den Namen nicht mehr ausreichend differenziert das Protein identifiziert wurde von den anderen.

Wirbellosen Defensine sind ein gutes Beispiel der Degeneration in Nomenklatur und Klassifizierung. Die ersten Wirbellosen Defensine wurden von Insekten gemeldet, und der Name “Insekt defensin” wurde anhand der wahrgenommenen Homologie zu Säugetieren Defensine1,2vorgeschlagen. Der Begriff defensin wird noch verwendet, obwohl es ist nun klar, dass Wirbellosen und Säugetieren Defensine teilen keinen gemeinsamen Vorfahren3,4. Je nach Tierart möglicherweise ein Wirbellosen “defensin” sechs oder acht Cysteine (, die drei oder vier Disulfid-Bindungen bilden) und eine Vielzahl von antimikrobiellen Aktivitäten. Die Situation, Proteine mit den gleichen Merkmalen zu erschweren wie Defensine “Defensine,” nicht immer genannt werden wie die kürzlich identifizierten Cremycins von Caenorhabditis Remanei5. Darüber hinaus sind Wirbellosen große Defensine eher evolutionär auf vertebrate β-Defensine als auf anderen Wirbellosen Defensine6bezogen werden. Trotzdem setzen Forscher manchmal auf den Namen “defensin” bei der Bestimmung, welche Sequenzen in Analysen einbezogen werden sollten.

Strukturelle Studien zeigten die Ähnlichkeit zwischen Insekten Defensine und Skorpion-Toxine-7und die CS-αβ-Falte wurde anschließend als strukturelle Charakteristikum von Insekten Defensine8gegründet. Diese Falte definiert den Skorpion Toxin-ähnliche (CS-αβ)-Superfamilie in die strukturelle Klassifikation der Proteine (SCOP) Datenbank9umfasst derzeit fünf Familien: Insekt Defensine, kurzkettige Skorpion-Toxine, langkettige Skorpion-Toxine, MGD-1 (ein Weichtier) und pflanzlichen Defensine. Diese Überfamilie ist gleichbedeutend mit der kürzlich beschriebene Cis-Defensine4 und Superfamily 3.30.30.10 CATH/gen 3D Datenbank10,11. Studien aus einer Vielzahl von Wirbellosen Taxa, Pflanzen und Pilze zeigen, dass die Namen der Proteine, die diese Falte enthalten nicht eindeutig mit Cystein Anzahl oder Verklebung Muster, antimikrobielle Aktivität oder Evolutionsgeschichte12zusammenhängen.

Der Mangel an Konsequenz und klare Kriterien machen es schwierig zu benennen und neu identifizierten Sequenzen in dieser Überfamilie zu klassifizieren. Ein großes Hindernis für Proteine in dieser Überfamilie zu vergleichen ist, dass Cysteine, in Bezug auf jede einzelne Sequenz gezählt sind (die erste Cystein in jeder Sequenz ist C1), ohne die Möglichkeit, um die strukturelle Rolle zu berücksichtigen. Dies bedeutet, dass nur Sequenzen mit der gleichen Anzahl von Cysteine verglichen werden können. Es gibt kleine Sequenz Erhaltung als die Cysteine bilden die CS-αβ-Falte, die Achsen und phylogenetische Analysen erschwert. Durch die Entwicklung ein Zahlensystem, das strukturelle Merkmale priorisiert, können leichter Superfamilie Sequenzen verglichen und ausgerichtet. Konservierten Funktionen, sowie die Festlegung auf eine der Untergruppen können schnell visualisiert werden, und neue Sequenzen können leichter in den entsprechenden Kontext gesetzt werden.

Dieses Papier verwendet ein Tabellenkalkulationsprogramm (z.B. Excel) um einen Verweis Nummerierungs-System für die CS-αβ-Superfamilie zu generieren. Es zeigt, wie dies klärt Vergleiche zwischen Sequenzen und wendet sie auf neue CS-αβ-Sequenzen von Bärtierchen identifiziert. Beispiel von der CS-αβ-Superfamilie, wurde das Protokoll geschrieben, um Hilfestellung bei der Verwendung von Sequenzen von Interesse; Es soll jedoch nicht spezifisch zu dieser Überfamilie oder Cystein-reichen Sequenzen sein. Diese Methode werden wahrscheinlich besonders für Gruppen von Proteinen, die wurden unabhängig voneinander in unterschiedlichen Taxa recherchiert und/oder haben wenig allgemeine Sequenzhomologie mit diskreten Merkmalen, die nicht leicht durch molekulare Analysesoftware erkannt werden kann. Diese Methode erfordert einige a-priori Entscheidungen über wichtige Funktionen, so dass es von begrenztem Nutzen sein wird, wenn keine wichtigen Funktionen identifiziert wurden. Das primäre Ziel ist zu zeigen, wie eine einfache Visualisierung der Sequenz Beziehungen erreicht werden kann. Dies kann dann zur Sequenzalignment und Analyse zu informieren, aber wenn Ausrichtung und Analyse der primären Ziele sind, wäre eine Barcode-Methode eine geeignete Alternative, die mehr Kapazität für Automatisierung13hat. Die aktuelle Methode zeigt die Funktionen jedes Peptid in einer linearen Form, so wird es nicht hilfreich für die direkte Visualisierung der 3D-Struktur.

Protocol

1. bestimmen die Definition von Funktionen des Arbeitskreises Protein des Interesses Consult bisherige Veröffentlichungen zu ermitteln, ob ein Konsens über die Funktionen, die erforderlich sind, um die Gruppe zugerechnet werden. Beachten Sie alle Unstimmigkeiten oder Meinungsverschiedenheiten zwischen Forschungsgruppen, und enthalten Eigenschaften, die dazu dienen können, eine Untergruppe von anderen zu unterscheiden. Verwenden frühere Literatur definierenden Merkmale nicht anspricht, Sequenzen, …

Representative Results

Gruppen von Sequenzen in der CS-αβ-Superfamilie in der Literatur beschrieben sind in Abbildung 4dargestellt. Die Cystein-Paarungen anhand der Nummerierung für jede Sequenz schlagen fünf Hauptgruppen (Tabelle 1, mittlere Spalte). Gruppe 1 hat sechs Cysteines, die aus drei Disulfid-Anleihen und Sequenzen aus Insekten, Spinnentiere, Mollusken, Nematoden und Pilze gehören. Gruppen 2, 3 und 4 haben 8 Cysteines, die vier Disulfid-Bindungen bil…

Discussion

Die Kriterien für die Benennung eines Proteins innerhalb einer Gruppe sollte klar sein, aber dies ist nicht immer der Fall. Sequenzen, die die CS-αβ Falten sind in vielen Laboren unter Verwendung einer Vielzahl von Organismen, die wiederum verschiedene Systeme der Nomenklatur sowie unterschiedliche Charakterisierung untersucht worden. Versuch, eine völlig neue Nomenklatur zu verhängen ist nicht zumutbar und würde zu viel Verwirrung führen, bei der bisherigen Literatur Beratung. Ein Verweis Nummerierungs-System kan…

Divulgations

The authors have nothing to disclose.

Acknowledgements

Laufende tardigrade antimikrobiellen Peptid-Forschung wird durch Intramurale Mittel aus dem Midwestern University Office of Research und gesponserte Programme (ORSP) unterstützt. Die ORSP hatte keine Rolle beim Studiendesign, Datenerfassung, Analyse, Interpretation oder Manuskript Vorbereitung.

Materials

BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

References

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).
check_url/fr/56107?article_type=t

Play Video

Citer Cet Article
Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

View Video