home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / sci / math / stat / 1688 < prev    next >
Encoding:
Internet Message Format  |  1992-08-17  |  3.5 KB

  1. Path: sparky!uunet!dtix!mimsy!stewart
  2. From: stewart@cs.umd.edu (G. W. Stewart)
  3. Newsgroups: sci.math.stat
  4. Subject: Re: Standard Deviation.
  5. Keywords: (n) versus (n-1)
  6. Message-ID: <59743@mimsy.umd.edu>
  7. Date: 18 Aug 92 05:18:50 GMT
  8. References: <1992Aug14.172833.11844@cbfsb.cb.att.com> <1992Aug16.211142.27499@mailhost.ocs.mq.edu.au>
  9. Sender: news@mimsy.umd.edu
  10. Organization: U of Maryland, Dept. of Computer Science, Coll. Pk., MD 20742
  11. Lines: 53
  12.  
  13. In article <1992Aug16.211142.27499@mailhost.ocs.mq.edu.au> wskelly@laurel.ocs.mq.edu.au (William Skelly) writes:
  14. >In article <1992Aug14.172833.11844@cbfsb.cb.att.com> rizzo@cbnewsf.cb.att.com (anthony.r.rizzo) writes:
  15. >>Can someone explain why calculating the Standard Deviation (SD),
  16. >>for small samples, with (n-1) in the denominator is better than
  17. >>doing so with (n) in the denominator?  I'm sure that there's
  18. >>a perfectly good reason for doing so.  But we, lowly engineers
  19. >>aren't usually told the reason.
  20.  
  21. Since the n-1 problem has generated considerable interest, it it
  22. perhaps worth a historical note.  The problem is a special case of the
  23. degrees of freedom in the residual sum of squares in a linear
  24. regression problem (for the special case take the regression matrix to
  25. be a vector of all ones).  The correct expression--$n-p$, where $p$ is
  26. the number of parameters and $n$ is the number of observations--is due
  27. to Gauss, who more than any one person was responsible for the
  28. introduction of the variance as a measure of dispersion.  His
  29. definitive treatment of the subject is contained in a series of three
  30. memoirs, beginning with "Theoria Combinationis Observationum Erroribus
  31. Minimis Obnoxiae, Pars Prior" which appeared in 1821 and can be found
  32. in Volume 4 of his works.  Here is what he says about the problem in
  33. the "Pars Posterior" (1823).
  34.  
  35.    In Articles~15 and~16 we gave a method for approximating the
  36.    precision of observations\symbolnote{1}{)An inquiry into the same
  37.    problem, which I published in an earlier memoir ({\it Bestimmung der
  38.    Genauigkeit der Beobachtungen.\ Zeitschrift f\"ur Astronomie und
  39.    vervandte Wissenschaften\/} Vol.~I, p.~185), was based on the same
  40.    hypothesis about the probability function of the experimental error
  41.    that I used to construct the method of least squares in the theory of
  42.    the motion of heavenly bodies.}).  But this method presupposes that a
  43.    sufficient number of the errors themselves are known exactly, a
  44.    condition which seldom, if ever, holds in practice.  However, if some
  45.    observeded quantities depend on one or more unknowns according to a
  46.    known law, we may find the most reliable values of the unknowns by
  47.    the method of least squares.  If the values of the observed
  48.    quantities are then computed from them, they will be felt to differ
  49.    very little from the true values, so that the greater the number of
  50.    observations the more surely we may take the differences as the true
  51.    observation errors.
  52.  
  53.    This procedure is used in actual problems by all calculators who try
  54.    to estimate precision a posteriori.  But it is theoretically unsound;
  55.    and although it is good enough for practical purposes in many cases,
  56.    in others it can fail spectacularly.  Therefore, it is well worth
  57.    while to examine the problem more closely.
  58.  
  59. Gauss goes on to point out that the mean of the residual sum of
  60. squares is by definition less than or equal to the mean of the sum of
  61. squares of the errors and hence must underestimate the latter, i.e.,
  62. the variance of the error.  He then derives the divisor $n-p$
  63. mentioned above.
  64.  
  65. Pete Stewart
  66.