home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / sci / math / stat / 1704 < prev    next >
Encoding:
Internet Message Format  |  1992-08-19  |  2.9 KB

  1. Path: sparky!uunet!ogicse!uwm.edu!ux1.cso.uiuc.edu!roundup.crhc.uiuc.edu!uirvlh!hougen
  2. From: hougen@uirvlh.csl.uiuc.edu (Darrell Roy Hougen)
  3. Newsgroups: sci.math.stat
  4. Subject: Re: Standard Deviation.
  5. Message-ID: <l95552INNa4h@roundup.crhc.uiuc.edu>
  6. Date: 19 Aug 92 18:36:18 GMT
  7. Article-I.D.: roundup.l95552INNa4h
  8. References: <1992Aug14.172833.11844@cbfsb.cb.att.com> <c48nbgtf@csv.warwick.ac.uk> <WVENABLE.92Aug18180002@algona.stats.adelaide.edu.au> <1992Aug18.214711.6657@mailhost.ocs.mq.edu.au>
  9. Organization: Center for Reliable and High-Performance Computing, University of Illinois at Urbana-Champaign
  10. Lines: 41
  11. NNTP-Posting-Host: uirvlh.csl.uiuc.edu
  12.  
  13. wskelly@laurel.ocs.mq.edu.au (William Skelly) writes:
  14.  
  15. *>In article <WVENABLE.92Aug18180002@algona.stats.adelaide.edu.au> wvenable@algona.stats.adelaide.edu.au (Bill Venables) writes:
  16.  
  17. *>*> and (b) the degrees of freedom,
  18. *>*>which is the dimension of the residual space.  This latter number is
  19. *>*>sometimes n-1, but more often n-p where p is somewhat larger than 1.  These
  20. *>*>two quantities, *separately*, are what you need for virtually all
  21. *>*>inferential procedures, like testing and confidence intervals.  Whether you
  22. *>*>divide one by the other to give an estimate of the variance is up to you.
  23. *>*>Incidently, if you do, it turns out to be unbiased, but "so what?", really
  24.  
  25. *>Bang on!  Yes, I think I see light.  This concept "degrees of freedom"
  26. *>is probably a much more confusing concept.  Made even more confusing to
  27. *>non-statistians, because a lot of us are thinking "n" sample size...
  28. *>i.e. the number of observations we have, rather than the more abstract
  29. *>(right term?) concepts of sample or residual "space."
  30.  
  31. Before people get too confused, just let me add my two cents worth.
  32. The number of "degrees of freedom" in a problem represents the amount
  33. of information in the data and is generally equal to the number of
  34. samples.  Intuitively, as statistics are computed using the data, the
  35. independent information in the data is gradually "used up" and the
  36. number of degrees of freedom is reduced.  The information is not
  37. actually lost, but the statistics that have been computed contain some
  38. of the information so that the amount of independent information left
  39. in the data is reduced.
  40.  
  41. Consider the example of calculating the sample variance.  To calculate
  42. the variance, one must first calculate the sample mean.  Calculating
  43. the mean uses up one degree of freedom.  This can be seen by noting
  44. that if one knew the mean and the values of n - 1 samples, one could
  45. infer the value of the remaining sample.  Therefore, there are only n
  46. - 1 independent "pieces" of information left in the data.  Similarly,
  47. when one calculates the quantities used in an analysis of variance or
  48. some other more complex statistical procedure, one may think of p
  49. degrees of freedom being assigned to treatments, b to blocks, 1 or 2
  50. to computing various means, etc., with the total always adding up to
  51. the number of samples, n.
  52.  
  53. Darrell
  54.