home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / ai / neuraln / 3275 < prev    next >
Encoding:
Internet Message Format  |  1992-08-22  |  11.4 KB

  1. Path: sparky!uunet!dtix!darwin.sura.net!jvnc.net!gmd.de!jargon!al
  2. From: al@jargon.gmd.de (Alexander Linden)
  3. Newsgroups: comp.ai.neural-nets
  4. Subject: Re: Network Inversion
  5. Message-ID: <al.714491544@jargon>
  6. Date: 22 Aug 92 13:52:24 GMT
  7. References: <BtCqHo.AtH.1@cs.cmu.edu> <37125@sdcc12.ucsd.edu>
  8. Sender: news@gmd.de (USENET News)
  9. Organization: GMD, Sankt Augustin, Germany
  10. Lines: 352
  11. Nntp-Posting-Host: jargon
  12.  
  13. demers@cs.ucsd.edu (David DeMers) writes:
  14.  
  15. >In article <BtCqHo.AtH.1@cs.cmu.edu> tjochem+@CS.CMU.EDU (Todd Jochem) writes:
  16. >>I'm looking for references to network inversion papers. The basic idea
  17.  
  18. The method Todd asked for is gradient descent in input
  19. space with respect to some error measure at the output.
  20.  
  21. >There has been a fair amount of work done on this.  Or at least 
  22. >See Jordan, Michael I. & David Rumelhart, "Forward Models: Supervised
  23. >Learning with a Distal Teacher" (probably in Cognitive Science
  24.  
  25. The work of Jordan and others David DeMers cites here IS quite related,
  26.  but they do not work in input space rather they utilize the gradient
  27. in input space of an action model network (or transition model) as the
  28. error information at the output layer of a second net, the controller.
  29. This kind of procedure has also used by Nguyen/Widrow (1989) IJCNN, and
  30. Werbos. An earlier publication of very related stuff is
  31.  
  32. @INPROCEEDINGS{Ersue87Y13,
  33. AUTHOR        = {Ers\"u, E. and Tolle, H.},
  34. TITLE        = {Hierarchical Learning Control -- An Appraoch with
  35.             Neuron-like Associative Memories},
  36. BOOKTITLE    = {Proceedings of IEEE Conference on Neural
  37.         Information Processing, Denver, November 8-12},
  38. YEAR        = 1987,
  39. EDITOR        = {Anderson, D.},
  40. ORGANIZATION    = {IEEE},
  41. PUBLISHER    = {AIP},
  42. ADDRESS        = {Denver, CO},
  43. KEYWORDS    = {associative memory | hierarchical learning control},
  44. REF        = {Y13}
  45. }
  46.  
  47. >Mike Dyer and Risto Mikkulainen have also looked at the
  48. >input deltas for some purpose which I've forgotten, also
  49. >the cite, but should be easy to find...
  50.  
  51. They have done work in the finding of proper coding schemes. Their work
  52. is published in
  53.  
  54. @INPROCEEDINGS{Miikkulainen88Q52,
  55. AUTHOR    = {Miikkulainen, R. and Dyer, M.~G.},
  56. TITLE    = {Forming Global Representations with Extended
  57.     Backpropagation},
  58. BOOKTITLE    = {Proceedings ICNN-88, San Diego},
  59. YEAR    = 1988,
  60. PAGES    = {285-292},
  61. REF    = {Q52}
  62. }
  63.  
  64. and also in the connectionist summer school proceedings of 1989.
  65.  
  66. >Mike Rossen in NIPS 3 has a paper on closed form inversion
  67.  
  68. I did not see that this method calculates the gradient in input space.
  69. A direct calculation of the input seems not possible because it is 
  70. often a many to one--mapping. Also the thresholds are not considered in
  71. his work...
  72.  
  73. A small history of inversion of neural nets:
  74. --------------------------------------------
  75.  
  76. The first publication I have found on this topic was Williams (1986).
  77. He trained a backprop net with the NETTALK database and inverted the
  78. mapping by backpropagating to the input layer.
  79.  
  80. Independently to his very early work in the ancient times of 
  81. connectionism other detected the potentials of inversion...
  82.  
  83. Miikkulainen and Dyer (1988,1989) Forming Input Representations
  84. Kindermann and Linden (1988, 1989) Minimal Microfeature detection,
  85.                experiments with recognition of handwritten digits.
  86.  
  87. Thrun and Linden (1990) extended inversion to recurrent neural nets (by
  88. unfolding)
  89.  
  90. Inversion of a forward model in neurocontrol, can be used to 
  91. generate goal directed behaviour. It can determine the action
  92. which produces a successor state which is as close as possible to the
  93. systems goal (due to gradient descent the can be local minima)
  94.  
  95. Thrun, Moeller and Linden (1990) derived  lookahead planning by inversion of
  96.                 forward models and applied it to 
  97.                 target tracking and cartpole ballancing.
  98. Kawato et al (1990) developed  this idea for trajectory formation.
  99.  
  100. Hwang et al (1990) used the idea of inversion to establish query
  101. learning. As pointed out in Linden/Kindermann (1989, IJCNN) it is easy
  102. possible to generate counterexamples by inversion. These
  103. counterexamples are very near at the class boundaries, thus with human
  104. interaction (telling the correct classification and extending the
  105. training set) the class boundaries can be moved.
  106.  
  107. Hoskins et al (1992) applied this inversion to inverse kinematics.
  108. Also we did some experiments with this (Linden and Weber (1992)).
  109.  
  110. Thrun and Moeller (1992) and Linden and Weber (1992) did experiments 
  111. with exploration by utilizing gradient descent in input space, where
  112. a minimization of a competence model is used to guide some autonomous
  113. agent into regions which are believed unknown.
  114.  
  115. Also Ron Chrisley (1990) has thought a bit on inversion in the context
  116. of neurocontrol. Also to mention is Steven Suddarth (1989).
  117.  
  118. Here is a list of references (UNSORTED!!!):
  119.  
  120. @INPROCEEDINGS{Williams86Z23,
  121. AUTHOR        = {Williams, R. J.},
  122. TITLE        = {Inverting a Connectionist Network Mapping by
  123. Backpropagation of Error},
  124. BOOKTITLE    = {8th Annual Conference of the Cognitive Science Society},
  125. YEAR        = 1986,
  126. PUBLISHER    = {Lawrence Erlbaum},
  127. ADDRESS        = {Hillsdale, NJ},
  128. KEYWORDS    = {backpropagation | inversion | natural language},
  129. REF        = {Z23}
  130. }
  131.  
  132. @ARTICLE{Hoskins92PP22,
  133.   AUTHOR    = {Hoskins, D. A. and Hwang, J. N. and Vagners, J.},
  134.   TITLE    = {Iterative Inversion of Neural Networks and its
  135.                  Application to Adaptive Control},
  136.   JOURNAL    = {IEEE Transactions on Neural Networks},
  137.   YEAR        = {1992},
  138.   VOLUME    = {3},
  139.   NUMBER    = {2},
  140.   PAGES    = {292 - 301},
  141.   KEYWORDS    = {},
  142.   REF        = {PP22}
  143. }
  144.  
  145. @UNPUBLISHED{Hwang90EE22,
  146.   AUTHOR    = {Hwang, J. N. and Choi, J. J. and Oh, S. and Marks, R. J.},
  147.   TITLE    = {Query Learning Based on Boundary Search and Gradient
  148.            Computation of Trained Multilayer Perceptrons},
  149.   NOTE        = {to appear in Proceedings of IJCNN 90, San Diego, June 17-21,
  150.            1990},
  151.   YEAR        = {1990},
  152.   KEYWORDS    = {inversion},
  153.   REF        = {EE22}
  154. }
  155.  
  156. @INPROCEEDINGS{Hwang90EE23,
  157.   AUTHOR    = {Hwang, J. N. and Chan, C. H.},
  158.   TITLE    = {Iterative Constrained Inversion of Neural Networks and its Applications},
  159.   BOOKTITLE    = {24th Conference on Information Systems and Sciences, Priceton,
  160.            March 1990},
  161.   YEAR        = {1990},
  162.   KEYWORDS    = {inversion},
  163.   REF        = {EE23}
  164. }
  165.  
  166. @INPROCEEDINGS{Miikkulainen88Q52,
  167. AUTHOR    = {Miikkulainen, R. and Dyer, M.~G.},
  168. TITLE    = {Forming Global Representations with Extended
  169.     Backpropagation},
  170. BOOKTITLE    = {Proceedings ICNN-88, San Diego},
  171. YEAR    = 1988,
  172. PAGES    = {285-292},
  173. REF    = {Q52}
  174. }
  175.  
  176.  
  177. @INPROCEEDINGS{Linden88Correlative,
  178. AUTHOR        = {Linden, A. and Kindermann, J.},
  179. TITLE        = {A Correlative View on Backpropagation},
  180. BOOKTITLE    = {Connectionism in Perspective},
  181. PAGES         = {377-384},
  182. EDITOR        = {Pfeifer, R. and Schreter, Z. and Fogelman, F. and Steels, L.},
  183. PUBLISHER    = {Elsevier},
  184. ADDRESS        = {Amsterdam},
  185. YEAR        = 1989,
  186. NOTE        = {Proceedings of the International Conference at the University
  187. of Z{\"u}rich, 10.-13.\ October 1988}
  188. }
  189.  
  190.  
  191. @INPROCEEDINGS{Kindermann89Microfeatures,
  192. AUTHOR        = {Kindermann, J. and Linden, A.},
  193. TITLE        = {Detection of Minimal Microfeatures by Internal Feedback},
  194. EDITOR        = {Retti, J. and Leidlmair, K.},
  195. BOOKTITLE    = {5. {\"O}sterreichische Artificial-Intelligence Tagung},
  196. YEAR        = 1989,
  197. PUBLISHER     = {Springer},
  198. ADDRESS    = {Berlin, Heidelberg}
  199. }
  200.  
  201. @INPROCEEDINGS{Linden89Inversion,
  202. AUTHOR        = {Linden, A. and Kindermann, J.},
  203. TITLE        = {Inversion of Multilayer Nets},
  204. BOOKTITLE    = {Proceedings of the First International Joint Conference on
  205.            Neural Networks, Washington DC},
  206. PUBLISHER    = {IEEE},
  207. ADDRESS        = {San Diego},
  208. YEAR        = 1989,
  209. REF        = {Inversion}
  210. }
  211.  
  212.  
  213. @MASTERSTHESIS{Linden90diplom,
  214.  AUTHOR    = {Linden, A.},
  215.   TITLE    = {{U}ntersuchung von {B}ackpropagation in konnektionistischen
  216.            {S}ystemen}, 
  217.   SCHOOL    = {Universit{\"a}t Bonn, Informatik-Institutsbericht Nr. 80},
  218.   TYPE        = {Diplomarbeit},
  219.   YEAR        = {1990},
  220.   REF        = {diplom}
  221. }
  222.  
  223. @ARTICLE{Kindermann90PC,
  224.   AUTHOR    = {Kindermann, J. and Linden, A.},
  225.   TITLE    = {Inversion of Neural Networks by Gradient Descent},
  226.   JOURNAL    = {Journal of Parallel Computing},
  227.   YEAR        = {1990},
  228.   VOLUME    = {14},
  229.   NUMBER    = {3},
  230.   PAGES    = {277-286},
  231.   KEYWORDS    = {},
  232.   REF        = {PC}
  233. }
  234.  
  235. @INPROCEEDINGS{Thrun90Inversion,
  236. AUTHOR        = {Thrun, S. and Linden, A.},
  237. TITLE        = {Inversion in Time},
  238. BOOKTITLE    = {Proceedings of the EURASIP Workshop on Neural Networks},
  239. ADDRESS    = {Sesimbra, Portugal},
  240. YEAR        = 1990,
  241. REF        = {Inversion}
  242. }
  243.  
  244. @INPROCEEDINGS{Thrun90Mental,
  245.   AUTHOR    = {Thrun, S. and Linden, A. and M{\"o}ller, K.},
  246.   TITLE    = {Planning with a mental modell},
  247.   BOOKTITLE    = {Proceedings of NeuroNimes 90, France},
  248.   YEAR        = {1990},
  249.   REF        = {Mental}
  250. }
  251.  
  252. @INPROCEEDINGS{Thrun91NIPS,
  253.   AUTHOR    = {Thrun, S. and M{\"o}ller, K. and Linden, A.},
  254.   TITLE    = {Planning with an Adaptive World Model},
  255.   BOOKTITLE    = {Advances in Neural Information Processing Systems 3},
  256.   YEAR        = {1991},
  257.   EDITOR    = {Touretzky, D. S. and Lippmann, R.},
  258.   PAGES    = {},
  259.   ORGANIZATION    = {},
  260.   PUBLISHER    = {Morgan Kaufmann},
  261.   ADDRESS    = {San Mateo},
  262.   MONTH    = {},
  263.   KEYWORDS    = {},
  264.   REF        = {NIPS}
  265. }
  266.  
  267. @INCOLLECTION{Kindermann92IEEE,
  268.   AUTHOR    = {Kindermann, J. and Linden, A.},
  269.   TITLE    = {Inversion of Neural Networks by Gradient Descent},
  270.   BOOKTITLE    = {Artificial Neural Networks: Concepts and Control
  271.            Applications},
  272.   EDITOR    = {Vemuri, R.},
  273.   PUBLISHER    = {IEEE Computer Society Press},
  274.   YEAR        = {1992},
  275.   REF        = {Kindermann92IEEE}
  276. }
  277.  
  278.  
  279. @INPROCEEDINGS{Linden92AIREADER,
  280.   AUTHOR    = {Linden, A. and Weber, F.},
  281.   TITLE    = {Exploring the Kinematics of a Robot Arm by Competence
  282.                  Modelling },
  283.   EDITOR      = {Becker, B. and Gordon, T.},
  284.   BOOKTITLE    = {AI-Reader},
  285.   PUBLISHER = {Erscheint als Arbeitspapier der GMD}, 
  286.   YEAR        = {1992}
  287. }
  288.  
  289. @INPROCEEDINGS{Thrun92OO8,
  290.   AUTHOR    = {Thrun, S. and M\"oller, K.},
  291.   TITLE    = {Active Exploration in Dynamic Environments},
  292.   BOOKTITLE    = {Advances in Neural Information Processing Systems 4},
  293.   YEAR        = {1992},
  294.   EDITOR    = {Moody, J. E. and Hanson, S. J. and Lippmann, R. P.},
  295.   PAGES    = {},
  296.   ORGANIZATION    = {},
  297.   PUBLISHER    = {Morgan Kaufmann},
  298.   ADDRESS    = {},
  299.   MONTH    = {},
  300.   KEYWORDS    = {},
  301.   REF        = {OO8}
  302. }
  303.  
  304. @UNPUBLISHED{Suddarth89Z4,
  305. AUTHOR        = {Suddarth, S. C. and Bourrely, J. C.},
  306. TITLE        = {A Back-Propagation Associative Memory for Both Positive and
  307. Negative Learning},
  308. YEAR        = 1989,
  309. NOTE        = {Poster Presentation at IJCNN-89},
  310. KEYWORDS    = {backpropagation | associative memory | negative training},
  311. REF        = {Z4}
  312. }
  313.  
  314.  
  315. @ARTICLE{Kawato90JJ16,
  316.   AUTHOR    = {Kawato, M. and Maeda, Y. and Uno, Y. and Suzuki, R.},
  317.   TITLE    = {Trajectory Formation of Arm Movement by Cascade
  318.            Neural Network Model Based on Minimum Torque-Change
  319.            Criterion},
  320.   JOURNAL    = {Biological Cybernetics},
  321.   YEAR        = {1990},
  322.   VOLUME    = {62},
  323.   NUMBER    = {},
  324.   PAGES    = {275 - 288},
  325.   KEYWORDS    = {},
  326.   REF        = {JJ16}
  327. }
  328.  
  329.  
  330. @UNPUBLISHED{Chrisley90JJ19,
  331.   AUTHOR    = {Chrisley, R.~L.},
  332.   TITLE    = {Cognitive Map Construction and Use: A Parallel
  333.            Distributed Processing Approach},
  334.   NOTE        = {To appear in:  Touretzky, D.~S. and Elman, J.~L.,
  335.            Sejnowski, T.~J. and Hinton, G.~E. (eds.) (1990)
  336.            Proceedings of the 1990 Connectionist Models Summer
  337.            School. San Mateo, CA: Morgan Kaufmann.},
  338.   YEAR        = {1990},
  339.   KEYWORDS    = {},
  340.   REF        = {JJ19}
  341. }
  342.  
  343.  
  344.  
  345. @INPROCEEDINGS{Rossen90NN31,
  346.   AUTHOR    = {Rossen, M. L.},
  347.   TITLE    = {Closed-Form Inversion of Backpropagation Networks: Theory
  348.            and Optimiation Issues},
  349.   BOOKTITLE    = {Conference for Neural Information Processing (NIPS)},
  350.   YEAR        = {1990},
  351.   EDITOR    = {},
  352.   PAGES    = {},
  353.   ORGANIZATION    = {},
  354.   PUBLISHER    = {},
  355.   ADDRESS    = {Denver},
  356.   MONTH    = {November},
  357.   KEYWORDS    = {},
  358.   REF        = {NN31}
  359. }
  360. --
  361. Alexander Linden             | TEL. (49 or 0) 2241/14-2435, FAX. -2618 or -2889
  362. GMD - AI Research Division   | TELEX 889469 gmd d
  363. P. O. BOX 1316               | email:  A.Linden@gmd.de
  364. D-5205 Sankt Augustin 1, FRG
  365.