home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / bit / listserv / statl / 1471 < prev    next >
Encoding:
Text File  |  1992-09-02  |  2.4 KB  |  53 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!WUBIOS.WUSTL.EDU!PHIL
  3. Return-Path: <phil@wubios>
  4. X-Mailer: ELM [version 2.3 PL11]
  5. Message-ID: <9209022059.AA16618@wubios>
  6. Newsgroups: bit.listserv.stat-l
  7. Date:         Wed, 2 Sep 1992 15:59:29 CDT
  8. Sender:       "STATISTICAL CONSULTING" <STAT-L@MCGILL1.BITNET>
  9. From:         "J. Philip Miller" <phil@WUBIOS.WUSTL.EDU>
  10. Subject:      unequal variances (fwd)
  11. X-To:         "STAT-L Distribution List" <stat-l@vm1.mcgill.ca>
  12. Lines: 39
  13.  
  14. Forwarded message:
  15. > There is another aspect to the unequal variance problem - that of power under
  16. > alternatives. In a recent study, (Comm. Stat., 1991) I compared the size and
  17. > power of the F, Kruskal-Wallis, and Normal Scores tests when variances were
  18.  un-
  19. > equal. The F test was badly hurt, but the KW and NS tests were relatively un-
  20. > affected. I suspect that the rank transformation will work pretty well in most
  21. > anova problems.
  22.  
  23. it is also very important to worry about the sample sizes you are concerned
  24. with.  In papers I gave in 1981 (Proceedings of SUGI and of Stat Computing
  25. Section of ASA) I looked at 11 different methods of estimating solutions for
  26. the Behrens-Fisher problem EVEN WHEN THE POPULATION VARIANCES WERE EQUAL.  For
  27. even the case of n1=n2 with n1 < 6 many of the methods provide empirical
  28. two-sided Type I error rates substantially different than the nomial levels.
  29. To take an example for n1=n2=2, the method utilized by SAS produces an
  30. empirical error rate of about .025 for a nominal level of .05.  For unequal
  31. sample sizes, it gets even worse, e.g. for n1=2, n2=50 the SAS method produces
  32. an empirical error rate of of .12.  Even using an F test for the equality of
  33. the variances as a pretest estimator does not eliminate the problem.
  34.  
  35. Having said all of that, I think it is important for me to remark that in most
  36. actual cases of data where there appear to be unequal variances, it is also
  37. the case that the normal distribution assumption is not reasonable.
  38. Frequently a transformation of the data either by a analytic function, e.g.
  39. log or one of the rank transformations will produce better results than any of
  40. the BF solutions which assume only different variances but still normal
  41. distributions.
  42.  
  43. -phil
  44.  
  45. > Tony
  46. >
  47.  
  48.  
  49. --
  50.      J. Philip Miller, Professor, Division of Biostatistics, Box 8067
  51.      Washington University Medical School, St. Louis MO 63110
  52.      phil@wubios.WUstl.edu - Internet  (314) 362-3617 [362-2694(FAX)]
  53.