home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / comp / ai / neuraln / 2993 < prev    next >
Encoding:
Internet Message Format  |  1992-07-27  |  4.2 KB

  1. Path: sparky!uunet!usc!sdd.hp.com!uakari.primate.wisc.edu!relay!afterlife!hcbarth
  2. From: hcbarth@afterlife.ncsc.mil (Bart Bartholomew)
  3. Newsgroups: comp.ai.neural-nets
  4. Subject: Re: re:need for unique test sets
  5. Message-ID: <1992Jul28.060228.7607@afterlife.ncsc.mil>
  6. Date: 28 Jul 92 06:02:28 GMT
  7. References: <25633@life.ai.mit.edu> <1992Jul22.031319.15531@afterlife.ncsc.mil> <1992Jul27.101401.18276@cs.su.oz.au>
  8. Organization: The Great Beyond
  9. Lines: 74
  10.  
  11. In article <1992Jul27.101401.18276@cs.su.oz.au> tom@cs.su.oz.au writes:
  12. >In article <1992Jul22.031319.15531@afterlife.ncsc.mil>, hcbarth@afterlife.ncsc.mil (Bart Bartholomew) writes:
  13. [ really good stuff deleted :)]
  14. >|>     The point of having a test set (taken from the same 
  15. >|> source as the training set) is to make sure the net has found 
  16. >|> the right (or equivalent) function.
  17. >|>     On the other hand, if the net does well on the training
  18. >|> set but falls apart (scores badly) on the test set, you know that
  19. >|> the net has found a nice function that describes the training 
  20. >|> set well, but *is not the function that actually generated the 
  21. >|> data*.  In that case, the net is worthless. 
  22. >
  23. >    I guess this is pretty difficult to answer, but what
  24. >    basis do we have for expecting that the net should
  25. >    (or can) learn a function we have 'in mind', when there
  26. >    are infinite trivially different ways of mapping any
  27. >    given data set?
  28. >    If we have no organizational basis for our learning, then
  29. >    what inherent organizational concepts do we expect the
  30. >    net to extract?
  31. >
  32. >    tom
  33.  
  34.     Quite often we believe that there is some
  35. rational generator for our data, but we do not know
  36. what that generator is.  We observe some apparently cause
  37. and effect situation, encode the information, and ask the
  38. net to see if it can produce the effect from the 'cause'.
  39.     Sometimes it can, sometimes it can't.  We may have
  40. made an error and the relationship does not exist.  We may
  41. have an error in our net topology (too small, too big, no
  42. pinch point, inappropriate pinch point, lots of things).
  43.     Since we don't know what the generator is, we must
  44. try to determine if the network has found the right (or 
  45. equivalent (possibly congruent)) function.  Even if the
  46. net describes the test set perfectly, we still cannot *know
  47. absolutely* that the net is correct until we test it with
  48. some input and see if the output looks reasonable, or is
  49. acceptably close by some criterion.
  50.     At the moment, we don't have any tools that I know
  51. of to examine a BP net and understand what's going on except
  52. for some trivial cases.  I suspect I'd recognize an XOR net
  53. fairly easily, but there are only four distinct configurations
  54. for an XOR BP net.  More complicated functions are more difficult
  55. to analyze.  Not necessarily impossible, but definately more
  56. difficult.  At this point I expect Prof Armstrong to point
  57. to the inordinate ease with which an ALN can be analyzed.
  58. I remain unconvinced, however, of the universal applicability
  59. and/or superiority of ALNs over BP in all situations.
  60.     One advantage of using nets to hunt for a function
  61. to describe the data is where the dimension of the problem is
  62. too large, or where the amount of data is too small.  In either
  63. case, there is a distinct chance that the net will find the
  64. wrong function.  Sometimes, we get lucky.  Sometimes the net
  65. will tell us which of the input points don't matter, or which
  66. ones are the most informative.
  67.     If we can find a net which adequately describes both
  68. the training and the test set, we can sometimes use it without
  69. knowing the function.  You don't have to be a EE to use a 
  70. television, you just have to know how to operate it.  I'm not
  71. a mathematician, but I know how to feed an FFT and how to 
  72. interpret the output.  Similarly, nets have been used in 
  73. a variety of cases where we don't know what it's doing, but
  74. we have confidence that it is doing the right thing.
  75.     Like I said earlier, you pays your money and you
  76. takes your chances.  Sometimes we don't have any acceptable
  77. alternatives.
  78.     Bart
  79.  
  80. -- 
  81. "It's not the thing you fling, the fling's the thing." - Chris Stevens
  82.  If there's one thing I just can't stand, it's intolerance.
  83. *No One* is responsible for my views, I'm a committee. Please do not
  84. infer that which I do not imply.  hcbarth@afterlife.ncsc.mil
  85.