home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / sci / math / stat / 2650 < prev    next >
Encoding:
Text File  |  1992-12-21  |  3.9 KB  |  84 lines

  1. Newsgroups: sci.math.stat
  2. Path: sparky!uunet!spool.mu.edu!umn.edu!thompson
  3. From: thompson@atlas.socsci.umn.edu (T. Scott Thompson)
  4. Subject: Re: Binary Correlations. Was: Levels of Measurement?
  5. Message-ID: <thompson.724710645@daphne.socsci.umn.edu>
  6. Sender: news@news2.cis.umn.edu (Usenet News Administration)
  7. Nntp-Posting-Host: daphne.socsci.umn.edu
  8. Reply-To: thompson@atlas.socsci.umn.edu
  9. Organization: Economics Department, University of Minnesota
  10. References: <92351.201518U53076@uicvm.uic.edu> <thompson.724607838@daphne.socsci.umn.edu>
  11. Date: Fri, 18 Dec 1992 20:30:45 GMT
  12. Lines: 70
  13.  
  14. thompson@atlas.socsci.umn.edu (T. Scott Thompson) writes:
  15.  
  16. >Perhaps someone interested in the levels of measurement question might
  17. >be able to help me too.
  18.  
  19. >I have been acting as informal statistical consultant for my wife, who
  20. >is a physician with only an elementary statistical background, in a
  21. >project where she wants measures of association between a fairly large
  22. >number of binary variables in a sample with n=500 and in a subsample
  23. >with n = 260.  (These numbers may increase in the future.)  
  24.  
  25. >We have been calculating standard Pearson correlation coefficients,
  26. >which to my way of thinking are as good as anything else at describing
  27. >binary associations, since scaling is not an issue for binary data.  I
  28. >do not claim to have studied the issue in depth, however.
  29.  
  30. [stuff deleted]
  31.  
  32. >What is "the right way" to do this from the point of view of
  33. >statistical theory?
  34.  
  35. Many thanks to those who have responded so far.  I will summarize your
  36. responses to the net sometime in the future.  (Probably in early
  37. January.)
  38.  
  39. Since a few people have e-mailed me with requests for more detail
  40. about the problem/data, here is a summary:
  41.  
  42. The sample consists of data taken from the charts of pediatric
  43. patients who were seen in the pediatric outpatient clinic at one of
  44. the large public hospitals in Minnesota on certain days chosen at
  45. random.  The variables include age and sex of the child, various
  46. variables summarizing the history of contact with the pediatrics
  47. clinic (i.e.  whether or not it is their first visit, whether or not
  48. this is their primary care clinic, etc.).  These variables are used to
  49. define the smaller subsample, which can be thought of as the group
  50. that regularly visits the clinic for medical treatment, and for whom
  51. the medical history appears to be reasonably complete.
  52.  
  53. (Yes, we know that there is a selectivity problem.  No. We are not
  54. doing anything about it yet.  Any suggestions on how to handle it are
  55. welcome.)
  56.  
  57. The remaining variables consist of binary indicators coded from the
  58. patient's chart for whether or not the patient has certain "morbidity
  59. factors."  These come in three flavors, which I can loosely describe
  60. as "clinical conditions" (e.g. ear infections), "developmental
  61. conditions" (e.g. whether or not the child was born premature, whether
  62. or not the child's physical growth is delayed, diagnosis of speech
  63. problems), and "social conditions" (e.g. whether or not the mother is
  64. a teenager, whether or not the child has been refered to a family
  65. protection agency because of child abuse, whether or not the child has
  66. been placed in a foster home).  There are about 150 morbidities
  67. altogether, of which about 20 have an estimated incidence greater than
  68. 2 percent.  We are mostly looking at these 20.
  69.  
  70. The main goal, as nearly as I can tell, is to find patterns in the
  71. diagnostic groups, i.e. patterns of association among the morbidities
  72. and among the groups of morbidities.  Presumably these will be used to
  73. help identify the kinds of services that the hospital should be
  74. providing, and to aid in detection of problems that might otherwise go
  75. unnoticed in the usual chaos of the clinic.
  76.  
  77. As you might surmise from the above, the clinic serves a largely poor,
  78. inner city population, and most of the patients are seen on a "walk
  79. in" basis.
  80. --
  81. T. Scott Thompson              email:  thompson@atlas.socsci.umn.edu
  82. Department of Economics        phone:  (612) 625-0119
  83. University of Minnesota        fax:    (612) 624-0209
  84.