home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / sci / math / stat / 1663 < prev    next >
Encoding:
Internet Message Format  |  1992-08-16  |  1.8 KB

  1. Path: sparky!uunet!usc!rpi!bu.edu!jade.tufts.edu!news.tufts.edu!sage.hnrc.tufts.edu!jerry
  2. From: jerry@ginger.hnrc.tufts.edu (Jerry Dallal)
  3. Newsgroups: sci.math.stat
  4. Subject: Re: Fwd: Standard Deviation.
  5. Message-ID: <1992Aug15.172908.298@ginger.hnrc.tufts.edu>
  6. Date: 15 Aug 92 22:29:07 GMT
  7. References: <1992Aug14.172833.11844@cbfsb.cb.att.com> <seX2yRq00Uh785H2EB@andrew.cmu.edu>
  8. Organization: USDA HNRC at Tufts University
  9. Lines: 31
  10.  
  11. In article <seX2yRq00Uh785H2EB@andrew.cmu.edu>, dr3u+@andrew.cmu.edu (Daniel Read) writes:
  12. > Can someone explain why calculating the Standard Deviation (SD),
  13. > for small samples, with (n-1) in the denominator is better than
  14. > doing so with (n) in the denominator?  
  15.  
  16.  
  17. I'm totally confused by some of the answers to this question.
  18. Using n-1 in the denominator gives an unbiased estimate of the variance.
  19.  
  20. E (sum[(xi-xbar)**2]) = E (sum[(xi-mu)**2]) - E(sum[(mu-xbar)**2])
  21.                       = E (sum[(xi-mu)**2]) - nE[(mu-xbar)**2]
  22.                       = n sigma**2          - n sigma**2 / n
  23.                       = (n-1) sigma**2
  24.  
  25. Of course, there's nothing magic about unbaisedness.  You might prefer a
  26. maximum likelihood estimate (n in the denominator) or a minimum mse estimator
  27. (n+1 in the denominator).  The reason n-1 is used is that you have to use
  28. *something* and n-1 makes the cleanest formulas.
  29.  
  30. For example, Lindgren and Friedman, Pisani, and Purves define their sd with an
  31. n in the denominator.  This means that their formula for CIs involving the t
  32. distribution becomes
  33.  
  34.                   xbar +- c s / sqrt(n-1)
  35. instead of the usual
  36.                   xbar +- c s / sqrt(n)
  37.  
  38. (Note:  All of this assumes a whole bunch of qualifications and conditions that
  39. I haven't stated explicitly, beginning with the fact that the variance should
  40. exist!)
  41.