home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / sci / math / stat / 1800 < prev    next >
Encoding:
Internet Message Format  |  1992-09-03  |  3.1 KB

  1. Path: sparky!uunet!newsserver.pixel.kodak.com!kodak!eastman!b56vxg.kodak.com!ekdug
  2. From: ekdug@b56vxg.kodak.com (James Cox)
  3. Newsgroups: sci.math.stat
  4. Subject: Comparison Of Model With Historical Data
  5. Message-ID: <3SEP199216491106@b56vxg.kodak.com>
  6. Date: 3 Sep 92 21:49:00 GMT
  7. Sender: news@eastman.UUCP
  8. Organization: Eastman Kodak Company, Rochester NY
  9. Lines: 48
  10. News-Software: VAX/VMS VNEWS 1.41
  11.  
  12.  
  13. We have purchased a simplified model of a complex kinetic chemical reaction.
  14. This model uses as inputs data from an industrial scale process (and the data
  15. from that process has all the usual errors associated with real-life data:
  16. noise, drift, bias, etc).
  17.  
  18. The model produces six outputs (concentrations) that can be directly compared
  19. to composition analyses from the plant (which are also subject to all sorts
  20. of errors).  There is one tuning parameter (that has a semi-theoretical basis)
  21. for the model that adjusts the production of one key component (and indirectly
  22. all the other concentrations - there are a total of 19 predicted compositions).
  23.  
  24. The problem is when we tune the model to match the plant's production of the
  25. key component at one set of (historical) operating conditions, it cannot 
  26. accurately predict even the key component's concentration at other sets of
  27. operating conditions.
  28.  
  29. Naturally, we think that the model has been oversimplified to the point of 
  30. unusability, while the view of the company that developed the model is that
  31. our plant data is too noisy.  Their suggested approach is to use an average
  32. of the plant data inputs to develop an average tuning parameter value and use
  33. that.  Their justification for this is that the variation in the predicted 
  34. compositions from the model with an "average" tuning parameter should be less 
  35. than the variation in the plant's measured compositions.  (Even if the
  36. variations do turn out this way, I don't think it would take a model with a 
  37. theoretical basis to get this sort of behavior!)
  38.  
  39. We can analyze the variation in a large set of plant data.  We can also tune 
  40. the model to match the key component concentration for every point in the set
  41. of data.  If we then define a function which is the sum of the differences 
  42. between the six plant concentrations and the six predicted ones, we would know
  43. the variation in the defined function, the variation in the tuning parameter
  44. and the variation in the plant data inputs to the model.  
  45.  
  46. What we would like to say, based on the above information is something like:
  47.                                                                               
  48. "Ah hah!  Since the variation in the tuning parameter is larger (or has a 
  49. larger effect on the defined function) than any of the variations in the plant
  50. data, obviously the model is not valid!"
  51.  
  52. Is there any way to reach this conclusion in a valid statistical way? 
  53. Especially given the fact that we do not know the theoretical relationships 
  54. between the plant data inputs to the model and the model outputs?
  55.  
  56. Any help will be *most* appreciated (and might contribute to my job security!).
  57. Please reply here or to to james_cox@Kodak.COM (which may or may not actually
  58. get to me.)
  59.  
  60.