home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / bit / listserv / statl / 1214 < prev    next >
Encoding:
Text File  |  1992-07-30  |  4.0 KB  |  86 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!IAF.UQUEBEC.CA!IMR2027
  3. Organization: Institut Armand Frappier
  4. Message-ID: <STAT-L%92073009024806@VM1.MCGILL.CA>
  5. Newsgroups: bit.listserv.stat-l
  6. Date:         Thu, 30 Jul 1992 08:52:21 EDT
  7. Sender:       "STATISTICAL CONSULTING" <STAT-L@MCGILL1.BITNET>
  8. Comments:     Adresse alternative de l'envoyeur: <IMR2027@UQUEBEC>
  9. From:         Eduardo Franco <IMR2027@IAF.UQUEBEC.CA>
  10. Subject:      logistic regression
  11. X-To:         stat-l@vm1.mcgill.ca
  12. Lines: 72
  13.  
  14. Quoting from lawhiteside%UALR.EDU@VM1.MCGILL.CA...
  15.  
  16. LW> I have a variable that I think is a very good predictor of my good/bad
  17. LW> outcome measure.  However, it is so good (and I have so few cases)
  18. LW> that all of the good outcome cases measure in the "good" category
  19. LW> of the predictor variable ... that is the situation is like
  20. LW> this (where the numbers are the N in each cell) :
  21. LW>
  22. LW>
  23. LW>                         Outcome Variable
  24. LW>   Predictor var         bad            good
  25. LW>        low            143               28
  26. LW>        high            25                0
  27. LW>
  28. LW>
  29. LW> What I really want is to compute odds ratio - but I don't know how to handl
  30. LW> the 0 cell .....
  31.  
  32. Add 0.5 to each cell frequency in the above crude table (if I'm not
  33. mistaken, this is known as Woolf's technique) if you must derive the OR
  34. as measure of association.
  35.  
  36. LW> On a related issue, I have another variable in the same model that is
  37. LW> "the number of people living in the home"  ... I want to be able to say
  38. LW> something like:   "Living with 4 or more people puts a child at risk of xxx
  39. LW> Is there a standard way to determine the cut point?  I know I could leave i
  40. LW> continuous but in the first place I don't think it is linear and in the sec
  41. LW> I want to know when the risk starts not just that more is worse....
  42. LW>
  43. LW> Thanks in advance,
  44. LW> Leanne Whiteside
  45. LW> LAWHITESIDE@UALR.EDU
  46.  
  47. Build your model using dummy covariates to represent contrasts. This method
  48. comes in handy when calculating ORs. For instance, assume that your variable
  49. for no. of people is named NUMP. The following set of dummy regressors would
  50. be used in place of NUMP in your LR model: (assuming hypothetical values)
  51.  
  52.         Value for             Coding for dummy variables
  53.           NUMP                NUMP2  NUMP3  NUMP4  NUMP5       Level
  54.           0-1                   0      0      0      0           1
  55.           2-3                   1      0      0      0           2
  56.           4-5                   0      1      0      0           3
  57.           6-7                   0      0      1      0           4
  58.           >=8                   0      0      0      1           5
  59.  
  60. Observe that for j levels in your original variable you need to
  61. specify j-1 dummy regressors.  The exponentiated regression coefficient
  62. for NUMPi will denote the OR for level i contrasted with level 1, taken as
  63. reference category.
  64.  
  65. By playing with the coding scheme you may be able to probe other interesting
  66. relations.  For instance, the somewhat modified scheme shown below would
  67. allow you to contrast adjacent levels (any j against j-1):
  68.  
  69.         Value for             Coding for dummy variables
  70.           NUMP                NUMP2  NUMP3  NUMP4  NUMP5       Level
  71.           0-1                   0      0      0      0           1
  72.           2-3                   1      0      0      0           2
  73.           4-5                   1      1      0      0           3
  74.           6-7                   1      1      1      0           4
  75.           >=8                   1      1      1      1           5
  76.  
  77. Now back to your question, the use of dummy regressors as shown above
  78. would allow you to model non-linear trends in dose-response between your
  79. predictor and the outcome. It would also allow you to spot sudden changes
  80. in effect, such as a threshold, as you mention. In fact, with the latter
  81. scheme you would use the Wald statistics for each coefficient to detect
  82. a significant difference in two consecutive ORs.
  83.  
  84. E. Franco, Univ. Quebec (imr2027@iaf.uquebec.ca)
  85. 
  86.