home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / ai / edu / 594 < prev    next >
Encoding:
Text File  |  1993-01-04  |  7.1 KB  |  189 lines

  1. Newsgroups: comp.ai.edu
  2. Path: sparky!uunet!elroy.jpl.nasa.gov!swrinde!news.dell.com!milano!milano.mcc.com!wshen
  3. From: wshen@nanook.mcc.com (Wei-Min Shen)
  4. Subject: CFP: AAAI93 Workshop on Learning Action Models
  5. Message-ID: <WSHEN.93Jan4094905@nanook.mcc.com>
  6. Sender: news@mcc.com
  7. Organization: MCC, Austin, TX 78759, U.S.A.
  8. Distribution: comp.ai
  9. Date: Mon, 4 Jan 1993 15:49:05 GMT
  10. Lines: 177
  11.  
  12.  
  13.  
  14.     The AAAI-93 Workshop on Learning Actions Models 
  15.                           held at the 
  16.        Eleventh National Conference on Artificial Intelligence
  17.  
  18.  
  19. DESCRIPTION OF WORKSHOP:
  20.  
  21. The goal of this workshop is to develop/communicate technologies that
  22. enable active learning systems, based on their own percepts and actions, to
  23. abstract a model from their environment and incorporate the model into
  24. their actions, thereby improving the long-term performance of the system.
  25.  
  26. Learning action models has been a fundamental problem in fields such as
  27. adaptive control and system identification.  Recent progress in
  28. reinforcement learning and robot learning shows clearly that the learning
  29. of such models is a very important topic within the AI learning community
  30. as well. It affords an opportunity for high-level representations for
  31. reasoning about the environment to interact usefully with the low-level
  32. action model. It seems the time has come for researchers from different
  33. fields to start working together to surmount the gap between the high-level
  34. cognitive models and the robotic hardware.
  35.  
  36. The workshop is intended to bring several otherwise separated research
  37. groups together to share recent developments. In particular, we encourage
  38. contributed papers in reinforcement learning, adaptive control, robot
  39. learning, learning to predict, and control-oriented learning neural
  40. networks. A list of specific topics are listed below. Survey papers of
  41. selected field are also welcome.
  42.  
  43.  
  44. TOPICS:
  45.  
  46. The topics of the workshop include, but are not limited to, the following:
  47.  
  48. Model Representation:
  49.  
  50. The representation of the model can be critical to the success of learning
  51. and effective using of the model. Examples of representations include State
  52. Machines with $Q$-values, Neuron Networks, Linear/nonlinear Functions, and
  53. Logical and Qualitative prediction rules. Questions related to model
  54. representation include: What are the pros and cons of each representation
  55. with regard to learning, generalization, abstraction, approximation, and
  56. prediction?  How do the models scale? Can you model continuous actions?
  57. How can you balance the tradeoff between detail and generality?  And is
  58. representation even one of the critical issues in designing such learning
  59. systems? (Most would say so, but anti-representationism is growing within
  60. AI.)
  61.  
  62. The Utility of Models:
  63.  
  64. When is modeling useful? For many (low-level) control tasks, it would be
  65. impossible or very expensive to learn a complete and accurate model, and it
  66. might be easier to learn to control without learning a model in the first
  67. place.  On the other hand, for many (mostly high-level) tasks, a model is
  68. essential. A related question is how to measure the usefulness of a model.
  69. One choice is to be task-specific, the other may be the readiness of
  70. dealing with new tasks.
  71.  
  72. Balancing Exploration and Planning:
  73.  
  74. This problem is better known as the explore/exploit tradeoff, and it is
  75. modeled in the statistics and GA communities by k-armed bandit problems.
  76. Action models enable the agent to "mentally" plan its actions for the
  77. goals. However, since the environment and the goals may change, models
  78. cannot always be perfect and must be revised by exploring.  How to balance
  79. these two activities is a challenging problem.
  80.  
  81. Discovering Hidden States:
  82.  
  83. Environments may have states that cannot be perceived directly by the
  84. learner.  To learn an accurate and useful action model, these hidden states
  85. may need to be discovered and utilized in the learned model. Still, there
  86. is the likelihood that the action model will be incomplete. To what extent
  87. can an incomplete model be useful in achieving the agent's goals?
  88.  
  89. Experiment Design and Learning from Experiments:
  90.  
  91. Besides exploring the environment more or less randomly, how does the agent
  92. design experiments and learn from them? The design of experiments may be
  93. based on the status of the current model, on deficiencies found while using
  94. the model, on changes in the overall system goals, etc. The problem is
  95. closely related to action selection or active learning. How do the negative
  96. theoretical results---e.g., a theorem stating that neither membership
  97. queries nor equivalence queries alone are sufficient to learn the model
  98. effectively---impact on this practical problem?
  99.  
  100. Reasoning about the Models:
  101.  
  102. Techniques that can effective apply the models to the goals of the system,
  103. keeping models responsive to sudden changes in the environment.
  104.  
  105. Comparison of Learning Methods:
  106.  
  107. There are quite a few existing methods for learning action models.
  108. Comparison of them may yield inspiration for new methods. Questions related
  109. to this topic include: In what type of environment can a learning method
  110. function? How fast does it converge? Can it handle noise or incomplete
  111. state information? Does it support model abstraction? etc.
  112.  
  113.  
  114.  
  115. FORMAT OF WORKSHOP:
  116.  
  117. The research papers will be organized by topics and presented sequentially.
  118. Panels and discussion sessions for each topic will be organized after
  119. papers have been accepted.
  120.  
  121.  
  122. ATTENDANCE:
  123.  
  124. The workshop will be attended by authors of accepted papers as well as
  125. researchers that are willing to contribute/participate in the discussions.
  126. All submitted papers will be included in the proceedings distributed to the
  127. participants, among which about 8 to 10 papers will be selected for
  128. presentation. The committee is working actively to publish the papers as
  129. citable ``AAAI Press Technical Reports.'' The workshop lasts one day and
  130. the number of attendees will be no more than forty (40). People who are
  131. interested are invited to submit a summary of their research and
  132. publications and on that basis will be invited to attend.
  133.  
  134.  
  135. SUBMISSION REQUIREMENT:
  136.  
  137. Please send four (4) copies of a short paper or an extended abstract of the
  138. research. Neither abstracts nor papers may exceed five (5) pages in length.
  139. Standard LaTex or pure ASCII text may be sent by email. Hard copy and email
  140. must both arrive by the submission deadline.
  141.  
  142.  
  143. SUBMISSION DEADLINE:   March 12, 1993.
  144.  
  145. NOTIFICATION DATE:  April 2, 1992
  146.  
  147. FINAL DATE FOR PAPERS:
  148.  
  149. Camera-ready full papers are due April 30, 1992. Beyond this date, they
  150. may not be published in the working notes.
  151.  
  152.  
  153. SUBMIT TO:
  154.  
  155. Wei-Min Shen
  156. Information System Division
  157. Microelectronics and Computer Technology Corporation
  158. 3500 West Balcones Center Drive
  159. Austin, TX 78759
  160. TEL 512-338-3295
  161. FAX 512-338-3890
  162. wshen@mcc.com
  163.  
  164.  
  165. WORKSHOP COMMITTEE:
  166.  
  167. Phil Laird
  168. NASA Ames Research Center 
  169. Moffett Field, CA 94035
  170. laird@ptolemy.arc.nasa.gov
  171.  
  172. Sridhar Mahadevan
  173. IBM T.J. Watson Research Center, Box 704
  174. Yorktown Heights, NY 10598
  175. sridhar@watson.ibm.com
  176.  
  177. Wei-Min Shen (Chair)
  178. Microelectronics and Computer Technology Corporation
  179. 3500 West Balcones Center Drive
  180. Austin, TX 78759
  181. wshen@mcc.com
  182.  
  183. Richard Sutton
  184. GTE Laboratories Incorporated 
  185. 40 Sylvan Rd. 
  186. Waltham MA 02254 
  187. sutton@gte.com
  188.  
  189.