home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / sci / math / stat / 1658 < prev    next >
Encoding:
Text File  |  1992-08-14  |  2.2 KB  |  45 lines

  1. Newsgroups: sci.math.stat
  2. Path: sparky!uunet!stanford.edu!leland.Stanford.EDU!dhinds
  3. From: dhinds@leland.Stanford.EDU (David Hinds)
  4. Subject: Re: Fwd: Standard Deviation.
  5. Message-ID: <1992Aug15.000049.29790@leland.Stanford.EDU>
  6. Sender: news@leland.Stanford.EDU (Mr News)
  7. Organization: DSG, Stanford University, CA 94305, USA
  8. References: <1992Aug14.172833.11844@cbfsb.cb.att.com> <seX2yRq00Uh785H2EB@andre <1992Aug14.231916.23479@magnus.acs.ohio-state.edu>
  9. Date: Sat, 15 Aug 92 00:00:49 GMT
  10. Lines: 33
  11.  
  12. In article <1992Aug14.231916.23479@magnus.acs.ohio-state.edu> regeorge@magnus.acs.ohio-state.edu (Robert E George) writes:
  13. >
  14. >More intuitively, if we take a very sample, we are less likely to get
  15. >extreme values and so our notion of what the population variance is (note
  16. >that I am not proposing some particular estimator) will be unrealistic.
  17. >For instance, I give an exam to two students. Their scores are 67 and
  18. >71. I think, "Gee, there's not a lot of variability in these scores."
  19. >But then 8 more students take the exam:
  20. >     60 78  100 38  50 88  99 39
  21. >
  22. >and it now is clear there *is* more variability in these scores.
  23. >
  24. >But let me reiterate that T will *always* have a negative bias for the
  25. >population variance whatever the sample size is
  26.  
  27. This is wrong.  If this set of 8 values is the "population", sure, for
  28. your particular sample, the predicted variance happens to be less than
  29. the population variance.  However, the mean variance of all samples
  30. from this population will equal the population variance (i.e., the
  31. sample variance is an unbiased estimator).  Note that most samples of
  32. size 2 from this population will have much larger variances than the
  33. one you picked, and many will have variances larger than the parent
  34. population (i.e., you are just as likely to get [100 38] as [67 71]).
  35.  
  36. The reason the N-weighted variance is biased, is because it measures
  37. variability around the sample mean rather than the population mean,
  38. and this estimate absorbs some of the variability in the sample.  The
  39. N-weighted variance of the sample around the population mean, and the
  40. N-1 weighted variance of the sample around the sample mean, are both
  41. unbiased estimates of the variance in the population.
  42.  
  43.         - David Hinds
  44.           dhinds@allegro.stanford.edu
  45.