home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #20 / NN_1992_20.iso / spool / comp / database / theory / 472 < prev    next >
Encoding:
Internet Message Format  |  1992-09-11  |  2.7 KB

  1. Path: sparky!uunet!mcsun!uknet!keele!csa09
  2. From: csa09@seq1.keele.ac.uk (Paul Singleton)
  3. Newsgroups: comp.databases.theory
  4. Subject: Re: Normalization and Relations
  5. Message-ID: <4052@keele.keele.ac.uk>
  6. Date: 11 Sep 92 13:38:18 GMT
  7. References: <gwtn05l.sjs@netcom.com>
  8. Organization: University of Keele, England
  9. Lines: 49
  10.  
  11. From article <gwtn05l.sjs@netcom.com>, by sjs@netcom.com (Stephen Schow):
  12. > There is a methodology called "Extended Relational Analysis" that goes into
  13. > how to design a relational model methodically.
  14. > It basically talks about identifying the entities of your model.  You can
  15. > generally use nouns to refer to these entities.  Each of these entities
  16. > will be represented by a table.
  17.  
  18. Shouldn't this be: "Each of these entities will be represented by a unique
  19. identifier"?  Simple attributes (e.g. 'name') of these may indeed be stored
  20. in a table.  It seems to me that traditional relational analysis likes to
  21. confuse an entity with a (hopefully) distinguishing attribute of that entity.
  22.  
  23. I think "functional data modelling" is more careful about this, but I haven't
  24. studied it.
  25.  
  26. > ... 
  27. > What you have to be careful of is that you could practically call everything
  28. > a noun and get totally out of control trying to normalize your data.  As has
  29. > been said earlier by someone in the group, if a particular entity is not of
  30. > unique interest by itself, or if it does not stand on its own as an entity,
  31. > then it probably shouldn't be one.
  32.  
  33. Sorry, why would you "get out of control"?  You might get close to the truth.
  34.  
  35. > There are many exceptions. If you are talking about gobs and gobs of redundant
  36. > data, then it may be worth it.  If you are talking about a one to many
  37. > relation, then it is neccessary.  There are many variables.  But I think it
  38. > is key to try to find a balance between absolute normalization and a more
  39. > conservative approach.
  40.  
  41. I think it is misguided and hopeless to "try to find a balance ..." without
  42. *first* analysing the application data thoroughly and uncompromisingly.  I
  43. think there should be two data models:
  44.  
  45.   1)  an exhaustive and fastidious analysis of the application, e.g. with
  46.       attributes such as 'colour' being treated as entities unless we can
  47.       be absolutely sure they are OK as attributes;
  48.  
  49.   2)  a pragmatic representation schema, deliberately denormalised for
  50.       efficiency and compactness (if necessary), and with all compromises
  51.       *documented* and *rationalised*.
  52.  
  53. But I've never done this for a living ...
  54. ----
  55.   __   __    Paul Singleton (Mr)           JANET: paul@uk.ac.keele.cs
  56.  |__) (__    Computer Science Dept.        other: paul@cs.keele.ac.uk
  57.  |  .  __).  Keele University, Newcastle,    tel: +44 (0)782 621111 x7355
  58.              Staffs ST5 5BG, ENGLAND         fax: +44 (0)782 713082
  59.