home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / bit / listserv / statl / 1211 < prev    next >
Encoding:
Text File  |  1992-07-28  |  6.2 KB  |  117 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!HILBERT.MATHS.UTAS.EDU.AU!MCPHERS
  3. X-Mailer: ELM [version 2.2 PL11]
  4. Message-ID: <9207290122.AA27829@hilbert.maths.utas.edu.au>
  5. Newsgroups: bit.listserv.stat-l
  6. Date:         Wed, 29 Jul 1992 11:22:32 EST
  7. Sender:       "STATISTICAL CONSULTING" <STAT-L@MCGILL1.BITNET>
  8. From:         "D. Glen McPherson" <mcphers@HILBERT.MATHS.UTAS.EDU.AU>
  9. Subject:      Association and interpretation in log-linear modeling
  10. X-To:         "stat-l list" <stat-l@vm1.mcgill.ca>
  11. Lines: 104
  12.  
  13. Given models based on a three-way table of frequencies, where the variables
  14. are designated A, B and C, it is intuitively reasonable that the table formed
  15. by collapsing over levels of C to give an A x B table is not generally
  16. meaningful if there is a three-way association between variables A, B and C.
  17. The reason is clear - a three-way association implies that the relation
  18. between A and B varies across the levels of C. Hence the association
  19. portrayed in the collapsed AxB table is a composite measure of association.
  20. Not only is information about the AxB association lost by the combination,
  21. but the composite measure of the AxB association is dependent on such,
  22. commonly irrelevant, information as the relative numbers of sample members at
  23. each level of C.
  24.  
  25. My problems arise when there is no three-way association between A, B and C,
  26. but the simplest model which fits the data must include all two-way
  27. associations, i.e. AxB, AxC and BxC. A number of authors establish that, in
  28. such circumstances, the parameter(s) defining the AxB association under the
  29. model which fits all three variables, are not the same parameters as those
  30. which apply when only the two-variable model for A and B is fitted to the
  31. collapsed table. (Technically, the three-way table is not 'strictly'
  32. collapsible' in this case). I am comfortable with the distinction - under the
  33. model based only on the AxB table, the parameters measure the association
  34. between A and B, whereas under the model based on the AxBxC table, the
  35. parameters measure the 'partial' association between A and B adjusting for
  36. relationships of A and B with C.
  37.  
  38. My problem is how do I estimate these 'partial' association parameters? From
  39. my reading, none of the books which counsel against collapsing the table over
  40. C to estimate the parameters defining the AxB association, actually tell me
  41. how to estimate these parameters. It is as though most authors in this area
  42. never venture beyond the world of academia, and they are quite content to say
  43. 'Stop the analysis if you reach this situation!'.
  44.  
  45. Can someone point me to a reference which might throw some light on the way
  46. to estimate these parameters, please?
  47.  
  48. My ultimate test of the usefulness of methodology is its practical
  49. application. This is one example of many difficulties I have in attempting to
  50. develop skills in the practical application of log-linear methodology for my
  51. non-statistics majors, and in interpreting results of analyses for consulting
  52. clients. Do others have the same problem or am I missing out on what should
  53. be intuitively obvious? Following is my non-fashionable way of viewing model
  54. formation and interpretation. I would appreciate comments on the approach.
  55.  
  56.  
  57. The usual parameterizations employed with linear models are both intuitively
  58. appealing for non-statistics majors and can be quickly introduced. By
  59. contrast, standard log-linear parameterizations are not easily grasped by
  60. non-mathematically oriented students, and require both a lengthy introduction
  61. and a long absorption period. The fact that log-linear models come within the
  62. framework of Generalized liner models, has led to the presentation of the
  63. linear predictor form of presentation of the equations. It seems to me that
  64. the multiplicative form is more appealing since it is a simple extension of
  65. the notion of probabilistic independence which is easily motivated. Thus, in
  66. a model based only on the two variables, A and B,
  67.  
  68. the independence model includes the equation
  69.  
  70.         Pr(A=i and B=j) = pi(A)i x pi(B)j
  71.  
  72. where pi(A)i is the marginal probability for variable A, and pi(B)j is the
  73. marginal probability for the  variable B. If the variables are not
  74. independent, there is need to adjust for this fact by introducing  'AxB
  75. association' parameters delta(AB)ij, i.e.
  76.  
  77.         Pr(A=i and B=j) = pi(A)i x pi(B)j x delta(AB)ij
  78.  
  79. This is the analogous development to the introduction of interactions in
  80. linear models, and, as such, sits comfortably with students who have
  81. previously been introduced to the concept of interactions in additive
  82. equations. The test of no association becomes a test that all delta(AB)ij =
  83. 1.
  84.  
  85. The approach extends simply and naturally to three variables. Thus, pairwise
  86. independence among all pairs is represented by the equation
  87.  
  88.         Pr(A=i and B=j and C=k) = pi(A)i x pi(B)j x pi(C)k.
  89.  
  90. The inclusion of a component which allows for an association between A and B,
  91. but independence between the other pairs, is represented by the equation
  92.  
  93.         Pr(A=i and B=j and C=k) = pi(A)i x pi(B)j x pi(C)k x delta(AB)ij.
  94.  
  95. Further associations are readily and obviously introduced with the inclusion
  96. of additional multiplicative components.
  97.  
  98. The role of model comparisons in hypothesis testing is readily tied to
  99. components in the multiplicative equations.
  100.  
  101. Given a model which fits the data, the matter of practical interpretation can
  102. follow. As part of this process, reparameterization can be discussed . The
  103. interpretive value of considering odds as ratios of 'pi' components, and odds
  104. ratios based on 'delta' components can be introduced - for their practical
  105. value rather than as mathematical artifacts.
  106.  
  107. Do others share my concerns about teaching the basis and application of this
  108. methodology to non-statistics majors? Am I missing something - can the
  109. log-linear approach be made intuitive and easy?
  110. --
  111.  ---------------------------------------------------------------------------
  112. |  Glen McPherson            |                                   |  _--_|\  |
  113. |  Department of Mathematics |-----------------------------------| /      \ |
  114. |  University of Tasmania    |               E-Mail:             | \_.--._/ |
  115. |  Australia.                | mcphers@hilbert.maths.utas.edu.au |       *  |
  116.  ---------------------------------------------------------------------------
  117.