home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / sci / math / stat / 1719 < prev    next >
Encoding:
Text File  |  1992-08-20  |  2.4 KB  |  51 lines

  1. Newsgroups: sci.math.stat
  2. Path: sparky!uunet!comp.vuw.ac.nz!cc-server4.massey.ac.nz!TMoore@massey.ac.nz
  3. From: news@massey.ac.nz (USENET News System)
  4. Subject: Re: Adjusted r-squared as analogous to sample variance estimator
  5. Message-ID: <1992Aug21.003148.124@massey.ac.nz>
  6. Organization: Massey University
  7. References: <Aug20.212648.51218@yuma.ACNS.ColoState.EDU>
  8. Date: Fri, 21 Aug 92 00:31:48 GMT
  9. Lines: 40
  10.  
  11. In article <Aug20.212648.51218@yuma.ACNS.ColoState.EDU>, mglacy@lamar.ColoState.EDU writes:
  12. > After following the thread about the approporiate divisor for the
  13. > sample variance, and the comments about the misconceptions and
  14. > mistakes concerning it that are propogated in introductory textbooks,
  15. > I was struck by an inconsistency.  While most intro. books make
  16. > considerable noise about the need to use n-1 to make the sample
  17. > variance an unbiased estimator, virtually none of them consider
  18. > the analogous correction to make the sample r-squared an unbiased
  19. > estimator of the population parameter.
  20. > Does anyone have any explanation for this inconsistency, other
  21. > than simple error on the part of textbook writers?
  22. >
  23. It's not a case of making considerable noise, but of pointing out why
  24. the "obvious" divisor is not used. It is not important anyway if only a
  25. point estimate is required. But, for inference, the t-distribution was
  26. calculated on the basis of the df as the divisor, so, unless you want to
  27. use non-standard tables, you have to stick to that.
  28.  
  29. It is also convenient to have the trouble at this point rather than when
  30. studying regression. Otherwise there would be an inconsistency: use
  31. n for single samples, n-p when fitting p-location parameters.
  32.  
  33. Having said that, Moore & McCabe "Introduction to the Practice of
  34. Statistics" p199, do use n-1 as the divisor when calculating r - strictly
  35. speaking, when calculating the covariance. (They just don't make
  36. "considerable noise" about it). (Also true of most books).
  37. The t-test statistic for testing rho = 0, r sqrt((n-2)/(1-r^2)) relies on
  38. this definition of r. Of course the n-1 cancels when the correlation is
  39. written in terms of sums of squares and sums of products -
  40. (sum (x-xbar)(y-ybar)/(sqrt(sum (x-xbar) sum(y-ybar))) -
  41. so you may not have noticed that it _was_ incorporated into the
  42. formula.
  43.  
  44. Incidently, at least one book on sampling theory uses n as a divisor
  45. because it leads to simpler formulae when the finite sampling
  46. correction is taken into account.
  47.  
  48. Terry Moore
  49.