home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #20 / NN_1992_20.iso / spool / comp / ai / neuraln / 3503 < prev    next >
Encoding:
Internet Message Format  |  1992-09-15  |  1.7 KB

  1. Path: sparky!uunet!mcsun!uknet!cam-eng!ajr
  2. From: ajr@eng.cam.ac.uk (Tony Robinson)
  3. Newsgroups: comp.ai.neural-nets
  4. Subject: Re: NNs in chess or other games
  5. Message-ID: <1992Sep15.220149.6819@eng.cam.ac.uk>
  6. Date: 15 Sep 92 22:01:49 GMT
  7. References: <18psroINNnek@nestroy.wu-wien.ac.at>
  8. Sender: ajr@eng.cam.ac.uk (Tony Robinson)
  9. Organization: Cambridge University Engineering Department, UK
  10. Lines: 30
  11. Nntp-Posting-Host: dsl.eng.cam.ac.uk
  12.  
  13. In comp.ai.neural-nets bruhn@uxe.wu-wien.ac.at (Peter Bruhn) writes:
  14.  
  15. >Does anyone of you know something about an application of neural nets
  16. >in strategic games (esp. chess). What I think about is that a NN could
  17. >be trained to evaluate a position or some aspects of a position (e.g.
  18. >the structure of your pawns, how safe is the position of your king,...).
  19. >
  20. >.... Once a chess master (I don't remember his
  21. >name) was asked how many moves he prefigures in advance and he answered
  22. >"normally: none".
  23.  
  24. There has been some interesting work done in this area.  Perhaps the best
  25. complete system is for backgammon and is described in:
  26.  
  27.   Gerald Tesauro, "Practical Issues in Temporal Difference Learning",
  28.   Machine Learning, vol 8, no 3/4, May 1992.
  29.  
  30. The basic idea is to learn a connectionist position evaluator though self
  31. play.  Supporting this are ideas from control theory, especially the backing
  32. up of lookahead using dynamic programming.  A good reference is:
  33.  
  34.   Andrew G. Barto and Steven J. Bradtke and Satinder P. Singh,
  35.   "Real-Time Learning and Control using Asynchronous Dynamic Programming",
  36.   Department of Computer Science, University of Massachusetts, Amhurst MA,
  37.   no 91-57, Aug 1991.
  38.  
  39. Also, vol 8 of Machine Learning 1992 is a special issue on reinforcement
  40. learning and would be a good place to start.
  41.  
  42. Tony [Robinson]
  43.