home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / sci / math / stat / 1679 < prev    next >
Encoding:
Internet Message Format  |  1992-08-17  |  3.3 KB

  1. Path: sparky!uunet!dtix!darwin.sura.net!ukma!rutgers!news.cs.indiana.edu!umn.edu!thompson
  2. From: thompson@atlas.socsci.umn.edu (T. Scott Thompson)
  3. Newsgroups: sci.math.stat
  4. Subject: Re: Fwd: Standard Deviation.
  5. Message-ID: <thompson.714071949@daphne.socsci.umn.edu>
  6. Date: 17 Aug 92 17:19:09 GMT
  7. References: <1992Aug14.172833.11844@cbfsb.cb.att.com> <seX2yRq00Uh785H2EB@andre <1992Aug14.231916.23479@magnus.acs.ohio-state.edu> <1992Aug16.212245.27577@mailhost.ocs.mq.edu.au> <1992Aug16.225926.497@massey.ac.nz>
  8. Sender: news@news2.cis.umn.edu (Usenet News Administration)
  9. Reply-To: thompson@atlas.socsci.umn.edu
  10. Organization: University of Minnesota
  11. Lines: 61
  12. Nntp-Posting-Host: daphne.socsci.umn.edu
  13.  
  14. news@massey.ac.nz (USENET News System) writes:
  15.  
  16. >In article <1992Aug16.212245.27577@mailhost.ocs.mq.edu.au>, wskelly@laurel.ocs.mq.edu.au (William Skelly) writes:
  17. >> 
  18. >> This and other posting indicate that there is a relationship between
  19. >> sample size and and estimated variance (of the population) which is
  20. >> positive and always an underestimate.  What is the limit, or point
  21. >> at which an increasing sample size no longer improve the estimate
  22. >> of populations variance?
  23. >> 
  24. >When the sample size is equal to the population size (never for an
  25. >infinite population).
  26.  
  27. Not necessarily true.  It depends on the sample design.  Suppose that
  28. we have a finite population of size N and we draw _with_replacement_ a
  29. sample of size n using independent draws.  Then the bias from using
  30. the "n" denominator is (minus)
  31.  
  32.           <population variance> / n
  33.  
  34. and this is true for _any_ n, including n = N, or even n = 2N.
  35.  
  36. >> Can this be tested by taking samples of sample 
  37.  
  38. >Yes but we can work out the theory so it isn't necessary.
  39.  
  40. >> (the later sample
  41. >> being elevated to the status of population)?
  42. >> 
  43.  
  44. Perhaps we can work out the theory for the bias, but this is not so
  45. clear when we consider other features of the distribution of the
  46. estimate.  See the related questions about the bias of the usual
  47. SD estimate in this thread for an example.
  48.  
  49. The intuition in the original comment was right on!
  50.  
  51. In fact the procedure of taking samples from the original sample,
  52. "elevating" the original sample to the status of population is
  53. _exactly_ the definition of (a particular variety of) bootstrap
  54. resampling.  See for example the book _The_Bootstrap_and_Edgeworth_
  55. _Expansion_, by Peter Hall (Springer-Verlag, 1992), which provides
  56. many references and examples.
  57.  
  58. It is shown in the bootstrap literature that for certain purposes
  59. (e.g. constructing statistical tests when the sample is drawn from a
  60. non-normal population) the bootstrap procedure can outperform
  61. (sometimes significantly) the traditional procedures.
  62.  
  63. So, for example, if the reason you are estimating a variance is to put
  64. its square root in the denomenator of a t-statistic, then boostrapping
  65. _may_ be the way to go (unless you really believe in the normality of
  66. your population).  For this application, you really aren't interested
  67. in whether or not your estimate of the variance is biased, and so the
  68. n vs. n-1 debate is irrelevant.  In fact, the bootstrap based test
  69. procedure will lead to the same test whether you choose n _or_ n-1, an
  70. invariance property that I find appealing.
  71.  
  72. T. Scott Thompson              thompson@atlas.socsci.umn.edu
  73. Dept. of Economics
  74. University of Minnesota
  75.