home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / sci / math / stat / 1690 < prev    next >
Encoding:
Internet Message Format  |  1992-08-17  |  2.9 KB

  1. Path: sparky!uunet!munnari.oz.au!yoyo.aarnet.edu.au!sirius.ucs.adelaide.edu.au!sirius!wvenable
  2. From: wvenable@algona.stats.adelaide.edu.au (Bill Venables)
  3. Newsgroups: sci.math.stat
  4. Subject: Re: Standard Deviation.
  5. Message-ID: <WVENABLE.92Aug18180002@algona.stats.adelaide.edu.au>
  6. Date: 18 Aug 92 08:30:02 GMT
  7. References: <1992Aug14.172833.11844@cbfsb.cb.att.com> <c48nbgtf@csv.warwick.ac.uk>
  8. Sender: news@ucs.adelaide.edu.au
  9. Organization: Department of Statistics, University of Adelaide
  10. Lines: 37
  11. Nntp-Posting-Host: algona.stats.adelaide.edu.au
  12. In-reply-to: psrdj@warwick.ac.uk's message of 17 Aug 92 09:35:38 GMT
  13.  
  14. >>>>> "Glyn" == G M Collis <psrdj@warwick.ac.uk> writes: 
  15.  
  16. Glyn> What intrigues me is that the most elementary stats texts make a big
  17. Glyn> fuss about using n-1 for an unbiased estimate of the variance, but
  18. Glyn> ignore the fact that this gives a biased estimate for the SD. I
  19. Glyn> recall that n - 1.5 is nearer the target for the SD when the sample
  20. Glyn> is from a normally distributed population. I gather that minimising
  21. Glyn> the bias when estimating the SD is rather sensitive to the population
  22. Glyn> distribution - I'd like to know more about this.  But my big puzzle
  23. Glyn> remains - why is the biasedness of the usual SD estimator (with N-1)
  24. Glyn> so rarely mentioned, in stark contrast to the case of the variance.
  25.  
  26. What surprises me is how this quaint little thread got going at all.  The
  27. elementary books are wrong if they make a big issue of unbiasedness, period.
  28.  
  29. In this context the *two* important quantities are (a) the sum of squares,
  30. since it is the squared length of the orthogonal projection of the
  31. observation vector onto the residual space, and (b) the degrees of freedom,
  32. which is the dimension of the residual space.  This latter number is
  33. sometimes n-1, but more often n-p where p is somewhat larger than 1.  These
  34. two quantities, *separately*, are what you need for virtually all
  35. inferential procedures, like testing and confidence intervals.  Whether you
  36. divide one by the other to give an estimate of the variance is up to you.
  37. Incidently, if you do, it turns out to be unbiased, but "so what?", really.
  38.  
  39. In my opinion statistical inference is all about reliably capturing
  40. information from data (and elsewhere if you are a Bayesian); it's not
  41. really about coming up with a number from a data set that you can show will
  42. be "close" to an unknown parameter value, in some special sense of "close".
  43. The trouble with many elementary books is that they get hung up on a narrow
  44. definition of "estimation" and elevate unbiasedness to an importance far in
  45. excess of what is warranted, at the same time not mentioning sufficiency,
  46. say, a far more important concept, (but harder to describe, of course).
  47. --
  48. ___________________________________________________________________________
  49. Bill Venables, Dept. of Statistics, | Email: venables@stats.adelaide.edu.au
  50. Univ. of Adelaide, South Australia. | Tel: +61 8 228 5412  Fax: ...232 5670
  51.