Back to chapter

3.11:

Famiglie proteiche

JoVE Core
Biologia Molecolare
È necessario avere un abbonamento a JoVE per visualizzare questo.  Accedi o inizia la tua prova gratuita.
JoVE Core Biologia Molecolare
Protein Families

Lingue

Condividere

Una famiglia di proteine corrisponde a un gruppo di proteine derivato da un antenato genetico comune. Queste proteine possiedono somiglianze nelle strutture tridimensionali e nelle funzioni svolte. Le proteine all’interno di una stessa famiglia sono definite omologhe.Le proteine omologhe che si sono evolute nella stessa specie sono definite paraloghe mentre le proteine omologhe in specie diverse sono chiamate ortologhe. Una superfamiglia è composta da due o più famiglie che si sono evolute da un antenato comune più lontano di quello di una famiglia proteica. Le proteine in una superfamiglia hanno variazioni maggiori nella struttura e nella funzione.Le famiglie proteiche possono aiutarci a fare un’ipotesi per quanto riguarda la funzione di una proteina con una sequenza di amminoacidi nota, ma forma o funzione sconosciuta. Queste proteine possono essere confrontate con altre proteine della stessa famiglia per cercare di prevederne la struttura tridimensionale e aiutare a determinare la funzione della proteina. Le famiglie proteiche spesso si creano attraverso la duplicazione dei geni quando i meccanismi genetici in un organismo creano una copia extra di un gene.La copia originale del gene e la sua copia duplicata possono mutare e divergere in funzione poichè le loro sequenze genetiche codificano per differenti sequenze amminoacidiche rispetto ai loro antenati genetici. Le proteine all’interno di una famiglia possono avere identità di sequenza fino al 30%cioè solo il 30lla sequenza primaria di amminoacidi può essere identico. Tuttavia, la struttura proteica globale e i domini all’interno della proteina sono spesso incredibilmente simili;per esempio, emoglobina e mioglobina sono proteine che si pensa si siano evolute dalla duplicazione genica.Le subunità alfa e beta dell’emoglobina hanno solo il 49%di identità di sequenza amminoacidica, ma hanno lo stesso modello generale di struttura proteica secondaria e terziaria-00:01:53.820 00:01:56.010 cioè, posizioni simili della loro alfa elica e delle spire della catena amminoacidica. La subunità alfa dell’emoglobina e della mioglobina hanno solo il 26%di identità di sequenza ma hanno strutture secondarie e terziarie simili. Tutte e tre le proteine possono legarsi all’ossigeno attraverso un gruppo eme poiché queste proteine omologhe sono membri di una famiglia di proteine che si legano all’ossigeno.

3.11:

Famiglie proteiche

Protein families are groups of homologous proteins; that is, they have similarities in amino acid sequences and three-dimensional structures. Protein families usually occur because of gene duplication, where an additional copy of a gene is inserted into the genome of an organism.   Mutations that change the amino acids but still allow the protein to be properly synthesized, will lead to new protein family members.   If these new proteins contain similar amino acids in key locations, protein domains, and possibly the overall three-dimensional structure, can remain similar.   Proteins within a family can have as low as 30% amino acid sequence homology but still perform related functions.

Protein Superfamilies

Protein superfamilies are larger groups of proteins that have evolved from a more distant ancestor. They generally have lower sequence homology as compared to a protein family but still have significant structural features in common. Each superfamily can contain several protein families with more closely related structures and functions.  Some larger families are even further divided into sub-families.  The exact distinction as to whether proteins belong to a superfamily, family, or subfamily can vary between classification systems and is still changing as the amount of protein sequence and structural data continues to grow.

The immunoglobulin protein superfamily (IgSF) is one of the largest protein superfamilies; over 700 superfamily members are found in the human genome.  All members of the superfamily contain one or more immunoglobulin (Ig) domains. This domain has a unique three-dimensional structure composed of a sandwich of two anti-parallel beta-sheets, and most are involved in cell adhesion or ligand binding. The IgSF contains many families including antigen receptors, cell adhesion molecules (CAMs), cytoskeletal proteins, and several growth-factor and cytokine receptor groups. Several of the larger families are further divided into subfamilies.   The antigen receptor family can be further divided into subfamilies: the antibody or immunoglobulin family and the T- cell receptor family; the CAMs can be divided into the NCAM, ICAM, and CD2 related protein families.

Classification Databases

Protein family classifications allow scientists to understand functional and evolutionary relationships between proteins. Several online resources can be used to search for known protein families or classify newly discovered proteins.  Pfam is one of several online databases where a scientist can search for known proteins and their family members.  A researcher can also enter the amino acid sequence of a newly discovered protein to see if it might belong to a known family of proteins due to sequence similarity.  This can provide a testable hypothesis as to the possible role of the novel protein as  family members often have similar structures and functions.

Suggested Reading

  1. 1PDB ID: 1GZX
    Paoli, M., Liddington, R., Tame, J., Wilkinson, A., Dodson, G. (1996)  Crystal Structure of T State Haemoglobin with Oxygen Bound at All Four Haems. J Mol Biol 256: 775
  2. 2PDB ID: 3RGK
    Hubbard, S.R., Lambright, S.G., Boxer, S.G., Hendrickson, W.A. (1990) X-ray crystal structure of a recombinant human myoglobin mutant at 2.8 A resolution. J Mol Biol 20: 215-218 DOI: 10.1016/S0022-2836(05)80181-0
  3. H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne. (2000) The Protein Data Bank Nucleic Acids Research, 28: 235-242.
  4. D. Sehnal, A.S. Rose, J. Kovca, S.K. Burley, S. Velankar (2018) Mol*: Towards a common library and tools for web molecular graphics MolVA/EuroVis Proceedings. doi:10.2312/molva.20181103
  5. S. El-Gebali, Sara ,et al. “The Pfam protein families database in 2019,” Nucleic Acids Research,47, no D1, (2019): D427–D432, https://doi.org/10.1093/nar/gky995
  6. S. El-Gebali, L. Richardson,  R. Finn  “Pfam: Quick Tour”  EMBL-EBI Train online. Accessed January 20, 2020, https://www.ebi.ac.uk/training/online/course/pfam-quick-tour
  7. “Protein families and structural evolution.” OpenLearn. Accessed January 20, 2020, https://www.open.edu/openlearn/science-maths-technology/science/biology/proteins/content-section-4.1
  8. A. Mitchell, A. Sangrador. “What Are Protein Families?” EMBL-EBI Train online. Accessed January 20, 2020, https://www.ebi.ac.uk/training/online/course/introduction-protein-classification-ebi/protein-classification/what-are-protein-families