home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / bit / listserv / statl / 2334 < prev    next >
Encoding:
Text File  |  1993-01-08  |  3.8 KB  |  76 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!SUVM.SYR.EDU!METRMDHM
  3. Organization: SYRACUSE UNIV RESEARCH DATA CENTER
  4. X-Acknowledge-To: <METRMDHM@SUVM.SYR.EDU>
  5. Message-ID: <930108.014212.LCL.METRMDHM@SUVM.SYR.EDU>
  6. Newsgroups: bit.listserv.stat-l
  7. Date:         Fri, 8 Jan 1993 01:42:12 LCL
  8. Sender:       STATISTICAL CONSULTING <STAT-L@MCGILL1.BITNET>
  9. From:         "Mark D. H. Miller" <METRMDHM@SUVM.SYR.EDU>
  10. Subject:      Re: 2 x 3 contingency table
  11. In-Reply-To:  Message of Wed, 6 Jan 1993 19:11:29 GMT from <nichols@SPSS.COM>
  12. Lines: 62
  13.  
  14. On Wed, 6 Jan 1993 19:11:29 GMT David Nichols <nichols@spss.com> said:
  15. >Another way to look at the problem of figuring out where a significant
  16. >chi-square statistic comes from is to examine residuals, or more
  17. >specifically, standardized and adjusted residuals. The standardized
  18. >residuals give a picture of the contribution of the misfit of observed
  19. >vs. expected in each cell of the table, and the adjusted residuals are
  20. >asymptotically normally distributed and can thus in large samples be
  21. >used to test for cells that are mispredicted under the independence
  22. >model. See pp. 224-on in Agresti's _Categorical Data Analysis_ for more
  23. >information, or some of Haberman's stuff. These residuals are provided
  24. >in SPSS in CROSSTABS.
  25. >
  26.  
  27. I agree with David Nichols and will go even further in urging that
  28. Haberman's "standardized residuals" or "adjusted standardized
  29. residuals" really should be examined.  This is, in fact, just an
  30. an extension of the tack being taken in the initial posting.  If
  31. we take seriously Hamming's dictum that "the purpose of computing
  32. is insight not numbers" then these calculations can be extremely
  33. useful in studying a table, sometimes highlighting patterns which
  34. might otherwise go unnoticed.  The chi-square test provides no
  35. insight as to the source of significant deviations nor a real
  36. alternative hypothesis.  Since it only takes one skewed cell to
  37. produce a significant chi-squared statistic, it can be quite
  38. informative to examine the adjusted (or standardized) residuals;
  39. even graphically since the adjusted residuals lend themselves
  40. quite nicely to half-normal plots thus extending the utility of
  41. this common diagnostic tool.  Shelby Haberman's original paper
  42. "The Analysis of Residuals in Cross-classified Tables" BIOMETRICS
  43. 29(1973):205-220 is still worth a read; he uses half-normal plots
  44. as illustrations.
  45.  
  46. Procedures for computing these statistics have been available in
  47. BMDP for years (Morton B.  Brown, BMDP-77) and they are available
  48. in the more recent versions of SAS. I'm sure they're available
  49. in other packages as well.
  50.  
  51. As suggested by other comments, there are many other ways to slice
  52. and dice contingency tables < perhaps billions :-) >.  Another
  53. simple plotting method for smaller tables (now possibly available
  54. with correspondence anlaysis routines) was written up years ago by
  55. Ronald Snee, "Graphical Display of Two-way Contingency Tables",
  56. THE AMERICAN STATISTICIAN 28(Feb 74): 9-12.
  57.  
  58. (IMHO The overall chi-square test is is pitifully uninformative since
  59. it's just a go/no-go gauge of a "hypothesis" (independence) which
  60. is often untranslatable into any scientifically interesting statement
  61. about the phenomena under investigation.)
  62.  
  63. What with log-linear models (in a dizzying variety of forms) and
  64. correspondence analysis (and a plethora of disguises), it's a
  65. mystery to me why omnibus measures of association or fit like the
  66. standard chi-squared still seem to hold center stage in analysis
  67. of cross-tabs when several alternatives are more versatile and
  68. interesting as well as more consistent with mainline statistical
  69. modeling.  Go figure ??  !
  70.  
  71.   *------------------------------------------------*
  72.     Mark D. H. Miller (metrmdhm@suvm.syr.edu)
  73.     Syracuse University, Faculty Computing Services
  74.     Research Data Center   { +1 315 443-1144 }
  75.   *------------------------------------------------*
  76.