home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / sci / math / stat / 2621 < prev    next >
Encoding:
Text File  |  1992-12-16  |  5.7 KB  |  137 lines

  1. Newsgroups: sci.math.stat
  2. Path: sparky!uunet!spool.mu.edu!umn.edu!thompson
  3. From: thompson@atlas.socsci.umn.edu (T. Scott Thompson)
  4. Subject: Re: Estimation of spline join points? References, suggestions?
  5. Message-ID: <thompson.724538009@kiyotaki.econ.umn.edu>
  6. Keywords: Splines, join points, Maximum-Likelihood
  7. Sender: news@news2.cis.umn.edu (Usenet News Administration)
  8. Nntp-Posting-Host: kiyotaki.econ.umn.edu
  9. Reply-To: thompson@atlas.socsci.umn.edu
  10. Organization: Economics Department, University of Minnesota
  11. References: <gyan.724455759@unixg.ubc.ca>
  12. Date: Wed, 16 Dec 1992 20:33:29 GMT
  13. Lines: 122
  14.  
  15. gyan@unixg.ubc.ca (Gyan P. Sinha) writes:
  16.  
  17. >    I am estimating the parameters of a censored regression model
  18. >(panel tobit), and one of the variables has a non-linear effect on
  19.         ^^^^^
  20. There are other estimators available that do not require the normality
  21. assumption even when you have fixed effects in your panel data model.
  22. See below.
  23.  
  24. >the dependent variable. I am trying to use a spline to model this, 
  25. >and its defined as:
  26.  
  27. >    V1 = THETA + MIN(DIFF-THETA,0)
  28. >    V2 = MAX(DIFF-THETA,0)
  29.  
  30. >so that if DIFF is less than THETA, then the effect on the dependent
  31. >variable is different than when it is larger, and V1 and V2 are the
  32. >two secondary independent variables created from the DIFF variable.
  33. >Instead  of imposing a value on THETA, I'd like to be able to estimate
  34. >it from the data itself.
  35.  
  36. >My questions are:
  37.  
  38. >(1) OPTIMIZATION STRATEGY: ML estimation will require some type of
  39. >non-gradient  technique (?), so how do I get the asymtotic t-stats and
  40. >such? 
  41.  
  42. Your model is continuous in THETA, and the only issue of
  43. differentiability occurs when THETA = DIFF.  The right and left
  44. derivatives are well defined even at this point, and the difference
  45. between them is everywhere bounded by |alpha_2 - alpha_1|, where
  46. alpha_1 and alpha_2 are the coefficients on V1 and V2 respectively.
  47. You should be able to use the right and left derivatives when
  48. implementing your maximization calculation.  The situation is similar
  49. to the one that occurs when you calculate a median by minimizing the
  50. sum of absolute deviations.  You might also have to deal with the
  51. possibility of multiple local maxima to the likelihood.  (I haven't
  52. checked.)
  53.  
  54. As for the asymptotics: All of the usual properties of ML estimation
  55. should hold, except that you can't use the second derivative
  56. formulation of the information matrix.  Instead, define the
  57. information matrix as the variance of the score vector and all will be
  58. well, provided that there is zero probability that THETA = DIFF at the
  59. true model, so that you can ignore the points of non-
  60. differentiability.  (The second derivative formulation of the
  61. information matrix will not be valid since the right and left first
  62. derivatives are not even continuous.)
  63.  
  64. It may happen that THETA = DIFF at the estimated model for at least a
  65. few of the sample points even if it is known that this has zero
  66. probability at the true model.  (The proportion of observations where
  67. this happens should be asymptotically negligible.)  You can use any
  68. number between the right and left derivatives of the likelihood when
  69. evaluating the score vector for these observations.
  70.  
  71. >(2) MEANING OF T-STATS: If I am estimating the join point from the
  72. >data itself, does that require some special tweaking on the t-ratios
  73. >to get legitimate tests of significance?
  74.  
  75. Not that I can see, unless Pr{ THETA = DIFF } > 0 at the true model.
  76. It will not be true that the information is equal to minus the
  77. expectation of the second derivatives of the log-likelihood, however,
  78. which is why you need the more general formulation in terms of the
  79. variance of the first derivatives.
  80.  
  81. >(3) REFERENCES: Can anyone suggest references that I can explore on
  82. >this problem?
  83.  
  84. You might get some insight into a general method for handling
  85. non-differentiabilities of your objective function from the analysis
  86. of the least absolute deviations estimator in:
  87.  
  88. "Asymptotics for Least Absolute Deviations Regression Estimators" by
  89. David Pollard, Econometric Theory, Vol. 7 No. 2 (June 1991), pp.
  90. 186-199.
  91.  
  92. You might also want to look at
  93.  
  94. "Trimmed LAD and Least Squares Estimation of Truncated and Censored
  95. Regression Models with Fixed Effects" by Bo Honore, Econometrica, Vol.
  96. 60, No. 3 (May, 1992), pp. 533-565.
  97.  
  98. This paper presents several estimators with continuous and piecewise
  99. differentiable objective functions.
  100.  
  101. You should probably look at Honore's paper anyhow, since he shows how
  102. to estimate a censored regression model from panel data without making
  103. any normality assumptions.  The normality assumption can lead to
  104. biased and inconsistent estimates in the censored regression setting,
  105. unless the true errors really are normally distributed.
  106.  
  107. >(4) ALTERNATIVES: Can anyone suggest alternatives that would allow for
  108. >similar effects, other than introducing a polynomial in DIFF, of which
  109. >I'm already aware of.
  110.  
  111. There are lots of ways to smooth out the kink in your model.  Here is
  112. one approach.  Your model is equivalent to one in which the two
  113. regressors are:
  114.  
  115.     V1 = DIFF
  116.     V2 = (DIFF - THETA)*1{ DIFF - THETA > 0 }
  117.  
  118. where 1{ } is the binary indicator function for whether or not the
  119. event in braces is true.  V2 can be written:
  120.  
  121.     V2 = (DIFF-THETA)*g(DIFF-THETA)
  122.  
  123. where g(z) = 1{ z > 0 }.  If you want a smoother function simply
  124. replace this g(z) with any other monotone increasing function from
  125. R->[0,1].  You can make your likelihood as smooth as you want in this
  126. way.  The function g might even have its own parameters.  Since it is
  127. bounded, you won't get the increased sensitivity to extreme values of
  128. DIFF that you are forced to live with when you use a polynomial.
  129.  
  130. >Seasons Greetings!
  131.  
  132. Same to you!
  133. --
  134. T. Scott Thompson              email:  thompson@atlas.socsci.umn.edu
  135. Department of Economics        phone:  (612) 625-0119
  136. University of Minnesota        fax:    (612) 624-0209
  137.