home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / comp / ai / 2919 < prev    next >
Encoding:
Internet Message Format  |  1992-07-29  |  5.5 KB

  1. Xref: sparky comp.ai:2919 comp.ai.shells:373 comp.lang.prolog:1471
  2. Path: sparky!uunet!mcsun!uknet!edcastle!aisb!aifh!xindongw
  3. From: xindongw@aisb.ed.ac.uk (Xindong Wu)
  4. Newsgroups: comp.ai,comp.ai.shells,comp.lang.prolog
  5. Subject: HCV: A New Efficient Attribute-Based Induction Algorithm
  6. Keywords: rule induction, extension matrix approach
  7. Message-ID: <1992Jul29.160052@aifh.ed.ac.uk>
  8. Date: 29 Jul 92 15:00:52 GMT
  9. Sender: news@aisb.ed.ac.uk (Network News Administrator)
  10. Reply-To: xindongw@aisb.ed.ac.uk (Xindong Wu)
  11. Followup-To: ai.msgs,comp.sources.misc
  12. Organization: Dept of AI, University of Edinburgh, Scotland
  13. Lines: 142
  14.  
  15.  
  16. HCV: A New Efficient Attribute-Based Induction Algorithm
  17. --------------------------------------------------------
  18.  
  19. 1. Introduction
  20.  
  21. The HCV induction algorithm is invented by Xindong Wu in the Department of
  22. Artificial Intelligence at the University of Edinburgh (UK) and the Department
  23. of Computer and Information Engineering at Hefei University of Technology
  24. (China). It is a representative of the extension matrix approach based family
  25. of attribute-based induction algorithms, originating with J.R. Hong's AE1.
  26.  
  27. By dividing the positive examples (PE) of a specific concept in a given example
  28. set into intersecting groups and adopting a set of strategies to find a
  29. heuristic conjunctive rule in each group which covers all the group's positive
  30. examples and none of the negative examples (NE), the HCV algorithm can find a
  31. rule in the form of variable-valued logic for the concept based on PE against
  32. NE in low-order polynomial time.  If there exists at least one conjunctive rule
  33. in a given training example set for PE against NE, the rule produced by the HCV
  34. algorithm must be a conjunctive one. The rules in variable-valued logic
  35. generated by the HCV algorithm have been shown empirically to be more compact
  36. than the decision trees or their equivalent decision rules produced by the ID3
  37. algorithm (the best-known induction algorithm to date) and its successors in
  38. terms of the numbers of conjunctive rules and conjunctions.
  39.  
  40. The term ``HCV'' in this prospectus indicates the current implementation
  41. (Version 1.0) of the HCV algorithm in SICStus Prolog which runs on SUN3 and
  42. SPARC workstations. In this implementation, HCV can classify more than 2
  43. classes of examples by incorporating the AQ technique developed in the
  44. generalization-specialization strategy based family of induction algorithms.
  45. It takes a set of pre-classified training examples (vectors of
  46. attribute-values)
  47. as its input and produces a set of rules as its output classifying the
  48. training
  49. examples. It also allows you to evaluate the rules' accuracy in terms of a
  50. set
  51. of pre-classified testing examples.
  52.  
  53. 2. Inputs
  54.  
  55. HCV's examples are vectors of attribute-values. Values can be either symbolic
  56. or numeric. Don't Cares (denoted by `*') are permitted.
  57.  
  58. 3. Outputs
  59.  
  60. The output is an unordered set of rules in the form of the variable-valued
  61. logic
  62. adopted in the generalisation specialisation strategy based AQ family of
  63. induction algorithms.
  64.  
  65. 4. User interaction
  66.  
  67. To use the program, you must prepare your training and testing examples in
  68. the
  69. form of ASCII files in a fixed format. During the program execution, all you
  70. need to do is provide your file names. All outputs and some intermediate
  71. results
  72. are given on the screen.
  73.  
  74. 5. Application domains
  75.  
  76. HCV works with any classification problems (such as diagnosis, prediction,
  77. and
  78. decision-making) that fit its input grammar.
  79.  
  80.  
  81. 6. Example
  82.  
  83. Input: Cases of T and F
  84.  
  85.     attrilist(['X1','X2','X3','X4']).
  86.     eg([1,a,*,1],'F').
  87.     eg([1,a,a,0],'F').
  88.     eg([1,b,c,1],'T').
  89.     eg([0,b,b,0],'T').
  90.     eg([0,a,c,1],'T').
  91.     eg([1,b,a,*],'T').
  92.     eg([1,c,c,0],'F').
  93.     eg([1,c,b,1],'F').
  94.     eg([0,c,b,0],'T').
  95.     eg([0,a,a,0],'T').
  96.     eg([0,c,c,1],'F').
  97.     eg([0,c,a,0],'T').
  98.     eg([1,a,b,0],'F').
  99.     eg([0,a,a,1],'T').
  100.     eg([0,b,a,1],'T').
  101.  
  102. Output: Rules in variable-valued logic
  103.  
  104.     [ X2=[b] ] 
  105.     v                [ X2=[c,a] ] 
  106.     [ X1=[0] ]        [ X1=[1] ]
  107.     [ X2=[a] ]         v 
  108.     v                 [ X2=[c] ]
  109.     [ X1=[0] ]        [ X4=[1] ]
  110.     [ X4=[0] ]       -->
  111.    -->                The F class. 
  112.     The T class. 
  113.  
  114. 7. Main references
  115.  
  116. [1] Xindong Wu, Optimization Problems in Extension Matrixes, Science in China
  117.     (Series A),  English edition: 35}(1992), 3: 363--373; Chinese edition: 
  118.     35(1992), 2: 200-207.
  119. [2] Xindong Wu,  HCV: A Heuristic Covering Algorithm for Extension Matrix
  120.     Approach, DAI Research Paper No. 578, Department of Artificial
  121. Intelligence,
  122.     University of Edinburgh, 1992.
  123. [3] Xindong Wu, Inductive Learning:  Algorithms and Frontiers, Artificial
  124.     Intelligence Review}, 6(1992).
  125.  
  126. 8. Availability
  127.  
  128. HCV (Version 1.0) is available electronically for academic use at no cost,
  129. and
  130. for commercial use by arrangement with the author. It may not be
  131. redistributed.
  132. To obtain a copy, send e-mail to 'xindongw@uk.ac.ed.castle' (the recipient
  133. must
  134. sign a condition-of-use agreement).
  135.  
  136. For people in the Artificial Intelligence Department at Edinburgh, there are
  137. 2
  138. programs, 'HCV_Sun3' and 'HCV_Sparc', in the ~xindongw/HCV directory for SUN
  139. 3
  140. and SUN 4 (SPARC) workstations respectively. You can run HCV by simply
  141. entering 
  142. ~xindongw/HCV/HCV_Sun3 or ~xindongw/HCV/HCV_Sparc according to the machine
  143. you
  144. are using.
  145.  
  146. All the files with the suffix _data in the same directory with the HCV
  147. program(s) are example sets which can be used as training and/or testing
  148. examples to run HCV.
  149.  
  150. 9. For further information, please contact
  151.  
  152.     Xindong Wu
  153.     Department of Artificial Intelligence    Telephone: +44 (0)31 650 2727
  154.     University of Edinburgh            Fax: +44 (0)31 650 6516
  155.     80 South Bridge                Email: xindongw@uk.ac.ed.castle
  156.     Edinburgh EH1 1HN, U.K.
  157.