home *** CD-ROM | disk | FTP | other *** search
/ BCI NET 2 / BCI NET 2.iso / archives / demos / misc / prosite.lha / Prosite / data / PDOC00021 < prev    next >
Encoding:
Text File  |  1995-03-04  |  4.5 KB  |  96 lines

  1. **********************************************
  2. * EGF-like domain cysteine pattern signature *
  3. **********************************************
  4.  
  5. A sequence of  about thirty  to forty amino-acid  residues  long found in  the
  6. sequence of epidermal  growth factor (EGF)  has  been shown [1,2,3,4,5]  to be
  7. present, in   a  more or  less conserved  form, in  a  large  number  of other
  8. proteins.  The  proteins  currently  known to contain one or more copies of an
  9. EGF-like pattern  are  listed  below  (references are  only provided  for very
  10. recently sequenced proteins).
  11.  
  12.  - Transforming growth factor alpha (TGF-alpha).
  13.  - Amphiregulin, a growth factor.
  14.  - Schwannoma-derived growth factor (SDGF).
  15.  - Betacellulin, a growth factor [6].
  16.  - Growth factor related proteins from  Vaccinia, Myxoma,  and  Shope  fibroma
  17.    viruses.
  18.  - Coagulation factors VII, IX, X (once) and XII (twice).
  19.  - Coagulation associated proteins C, S and Z (once).
  20.  - Urokinase and tissue plasminogen activator (TPA) (once).
  21.  - Complement components C6, C7, C8 alpha and beta chains, and C9 (once).
  22.  - Fibronectin (twice).
  23.  - Laminin subunits A (15 times), B1 (13 times) and B2 (12 times).
  24.  - Tenascin, an extracellular matrix protein (14 times).
  25.  - Nidogen (also called entactin), a basement membrane protein (once).
  26.  - Agrin, a basal lamina protein  that causes the aggregation of acetylcholine
  27.    receptors on cultured muscle fibers (4 times).
  28.  - Aggrecan (once) and versican (twice), two large proteoglycans.
  29.  - Selectins, cell  adhesion  proteins such  as  ELAM-1 (E-selectin),  GMP-140
  30.    (P-selectin), or the lymph-node homing receptor (L-selectin) (once).
  31.  - Transforming growth factor beta-1 binding protein (TGF-B1-BP) (16 times).
  32.  - Drosophila neurogenic proteins: Notch (36 times), Delta (9 times), and Slit
  33.    (7 times).
  34.  - Drosophila epithelial development protein Crumbs (30 times).
  35.  - Drosophila ectodermal development protein Serrate (14 times).
  36.  - Caenorhabditis elegans  developmental proteins lin-12 (13 times)  and glp-1
  37.    (10 times).
  38.  - Sea urchin protein uEGF-1 (at least 9 times).
  39.  - Human teratocarcinoma-derived  growth factor 1  (TDGF-1)  (CRIPTO  protein)
  40.    (once).
  41.  - Milk fat globule-EGF factor 8 (MFG-E8) (twice).
  42.  - Tyrosine-protein kinase receptors tek and tie (3 times) [7].
  43.  
  44. The functional  significance  of  EGF  domains  in what appear to be unrelated
  45. proteins is not yet clear. However, a common feature is that these repeats are
  46. found in the extracellular  domain  of membrane-bound  proteins or in proteins
  47. known to be secreted. The EGF domain includes six cysteine residues which have
  48. been shown (in EGF) to be  involved  in  disulfide bonds.        The schematic
  49. representation of the EGF-like type A domain is shown here:
  50.  
  51.                         +-----------+ +--------+
  52.                         |           | |        |
  53.                 xxxCxxxxCxxxxxCxxxxxCxCxxxxxxxxCxxx
  54.                    |          |     ************
  55.                    +----------+
  56.  
  57. 'C': conserved cysteine involved in a disulfide bond.
  58. '*': position of the pattern.
  59.  
  60. We have  used the region which includes the last three cysteines of the domain
  61. as a consensus pattern.
  62.  
  63. -Consensus pattern: C-x-C-x(5)-G-x(2)-C
  64.                     [The three C's are involved in disulfide bonds]
  65. -Sequences known to belong to this class detected by the pattern: ALL.
  66. -Other sequence(s) detected in SWISS-PROT: 38 other proteins. It is also found
  67.  twice in the beta chain of the integrin family of proteins.   The presence of
  68.  cysteine-rich repeat patterns  in  these proteins had  already been noted but
  69.  they were said to be dissimilar with the EGF pattern [8].
  70.  
  71. -Note: the residue in position -2 to the glycine is very often an aromatic (F,
  72.  Y or W) residue.
  73. -Note: this pattern does not detect some  of the repeats of laminins A, B1 and
  74.  B2, Crumbs, Notch, TGF-B1-BP, and lin-12.
  75.  
  76. -Last update: June 1994 / Text revised.
  77.  
  78. [ 1] Davis C.G.
  79.      New Biol. 2:410-419(1990).
  80. [ 2] Blomquist M.C., Hunt L.T., Barker W.C.
  81.      Proc. Natl. Acad. Sci. U.S.A. 81:7363-7367(1984).
  82. [ 3] Barker W.C., Johnson G.C., Hunt L.T., George D.G.
  83.      Protein Nucl. Acid Enz. 29:54-68(1986).
  84. [ 4] Doolittle R.F., Feng D.F., Johnson M.S.
  85.      Nature 307:558-560(1984).
  86. [ 5] Appella E., Weber I.T., Blasi F.
  87.      FEBS Lett. 231:1-4(1988).
  88. [ 6] Shing Y.W., Christofori G., Hanahan D., Ono Y., Sasada R., Igarashi K.,
  89.      Folkman J.
  90.      Science 259:1604-1607(1993).
  91. [ 7] Ziegler S.F., Bird T.A., Schneringer J.A., Schooley K.A., Baum P.R.
  92.      Oncogene 8:663-670(1993).
  93. [ 8] Tamkun J.W., DeSimone D.W., Fonda D., Patel R.S., Buck C., Horwitz A.F.,
  94.      Hynes R.O.
  95.      Cell 46:271-282(1986).
  96.