home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / sci / math / stat / 2337 < prev    next >
Encoding:
Internet Message Format  |  1992-11-11  |  2.0 KB

  1. Path: sparky!uunet!think.com!sdd.hp.com!spool.mu.edu!agate!graunt.qal.berkeley.edu!mwande
  2. From: mwande@graunt.qal.berkeley.edu (Mike Anderson)
  3. Newsgroups: sci.math.stat
  4. Subject: modelling distributions
  5. Date: 11 Nov 1992 19:47:23 GMT
  6. Organization: University of California, Berkeley
  7. Lines: 24
  8. Distribution: world
  9. Message-ID: <1dro0bINN8p9@agate.berkeley.edu>
  10. NNTP-Posting-Host: graunt.qal.berkeley.edu
  11.  
  12. Suppose I have data on two variables - age and income of a person. I would like
  13. to estimate income curves by age using spline regression, but my problem is
  14. this: to protect the identity of the individuals, incomes were topcoded, so
  15. that any person reporting incomes of > $100,000 gets coded at $100,000. I am
  16. interested in getting very accurate estimates, and given the long right tail
  17. of the income distribution, these truncated values may be throwing off my
  18. estimates quite a bit.
  19.     So I would like to replace the truncated values with my own "tail". My
  20. question is, how do I go about modelling the income distribution and tacking
  21. on my own tail? Off the top of my head, I would precede thusly: If there are
  22. Nt truncated observations and Nu untruncated observations, N = Nt + Nu, I would
  23. first scale the Nu incomes to mean 0, generate N obs from something like a
  24. log-normal, lop off the top Nt quantiles, and compare the generated data to the
  25. observed data with a Q-Q plot, choosing that level of variance in the log-normal
  26. which gives me the straightest fit. Then I would take the Nt random values I
  27. lopped off from the generated data and randomly assign them to the Nt truncated
  28. values. Does this sound reasonable? I'm sure there is a better way to go about 
  29. this, can someone tell me what it is or where to find it?
  30. Thanks in advance, Mike Anderson
  31. -- 
  32. Mike Anderson    Dept. of Demography   UC Berkeley   mwande@QAL.Berkeley.EDU
  33. "And I would say to those out around the country. 'Take a hard look now.
  34. Don't let that rabbit be pulled out of the hat by one hand and 25 other 
  35. rabbits dumped on you in another.'" - George Bush, 1/24/90 
  36.