home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / bit / listserv / statl / 1963 < prev    next >
Encoding:
Text File  |  1992-11-14  |  2.6 KB  |  59 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!stanford.edu!bcm!convex!darwin.sura.net!paladin.american.edu!auvm!NIOBBS1.EM.CDC.GOV!SIS1
  3. Return-Receipt-To: <sis1@NIOBBS1.EM.CDC.GOV>
  4. Encoding: 51 TEXT
  5. X-Mailer: Microsoft Mail V3.0 (beta-2)
  6. Message-ID: <2B034AF1@router.em.cdc.gov>
  7. Newsgroups: bit.listserv.stat-l
  8. Date:         Fri, 13 Nov 1992 10:27:00 EST
  9. Sender:       "STATISTICAL CONSULTING" <STAT-L@MCGILL1.BITNET>
  10. From:         sis1@NIOBBS1.EM.CDC.GOV
  11. Subject:      I CHECK but I don't TEST for assumptions
  12. Lines: 45
  13.  
  14. Ed Johnson writes
  15.  
  16. > I would like to know how regularly people on this list test for assumptions.
  17. > For example, when a t test assumes a normal distribution and equal
  18. > variances, how often do you run a Lilliefor test for normalcy and an F test
  19. > for the dif-ference of means? I'm told that it should aways be done, but
  20. > these tests don't seem to be a standard part of statistical packages such
  21. > as SAS, nor do I recall having seen these tests being mentioned in the
  22. > methodology of experimental re- search. Comments, please.
  23.  
  24. Funny you should ask; I'm preparing a talk for the local SAS Users Group
  25. with the title "Using SAS to check your statistical assumptions".
  26.  
  27. Although there are certainly times that I've forgotten or I've been too
  28. busy, I try check assumptions religiously.  But I use descriptive procedures
  29. like residual and normal probability plots instead of formal tests.  Here's
  30. why.
  31.  
  32. A test, especially a test for normality like Lilliefors, has low power for
  33. small sample sizes when you need normality most, and high power for large
  34. sample sizes where you need normality the least (because of the Central Limit
  35. Theorem).  A descriptive procedure will tell you how much your data deviates
  36. from normality and in what direction.  Certain types of non-normality, like
  37. light tails are less serious than others; Lilliefors doesn't give you any
  38. clue about this.
  39.  
  40. A similar comment holds about testing equality of variances.  I use the rule
  41. of thumb that if the standard deviations or the ranges differ by a factor of
  42. three or more, there is cause for concern.  I've seen this rule in several
  43. different places; if you want a reference, I can dig one out.
  44.  
  45. Most of the Statistics text books I am familiar with place a strong emphasis
  46. on checking assumptions.  Three examples are:
  47.  
  48.   Draper and Smith.  Applied Regression Analysis;
  49.   Montgomery.  Design of Experiments; and
  50.   Neter, Wasserman, and Kutner.  Applied Linear Statistical Models.
  51.  
  52.  
  53. Steve Simon
  54. sis1@niobbs1.em.cdc.gov
  55. hhscdc!sis1/o=cdc/ou=cinc/ou=niobbs1@mhs.attmail.com
  56.  
  57. Views expressed here are my own.  Mention of a product or
  58. company name does not constitute an endorsement by NIOSH.
  59.