home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / comp / ai / 3308 < prev    next >
Encoding:
Internet Message Format  |  1992-09-02  |  2.4 KB

  1. Path: sparky!uunet!olivea!decwrl!purdue!yuma!ld231782
  2. From: ld231782@LANCE.ColoState.Edu (L. Detweiler)
  3. Newsgroups: comp.ai
  4. Subject: online thesaurus + travelling salesman = word spectrum
  5. Message-ID: <Sep02.180231.79999@yuma.ACNS.ColoState.EDU>
  6. Date: 2 Sep 92 18:02:31 GMT
  7. Sender: news@yuma.ACNS.ColoState.EDU (News Account)
  8. Organization: Colorado State University, Fort Collins, CO  80523
  9. Lines: 41
  10.  
  11.  
  12. - - -
  13.  
  14. Hello. Since the subject of online thesauruses pops up here and is in the
  15. FAQ, I thought I would ask a question of people involved in this area.
  16.  
  17. Suppose I have a (large) set of words. A thesaurus can be represented as
  18. a graph with words as vertices and edges denoting synonymnity. Now, suppose
  19. the shortest path can be found that visits all vertices.  In a sense this
  20. collapses the multidimensional graph into a linear listing.  The 
  21. structure of this listing would be very interesting from the point of view
  22. of a lexicographer.  It would be a listing of all the words in the set
  23. in the order of `shades of meaning', and even gives a metric for this--
  24. the similarity of two words can be defined as their distance from each 
  25. other in the list.  
  26.  
  27. In a sense, this could be used to give a new kind of reference in addition
  28. to a thesaurus or dictionary, combining some of the best features of both.
  29. If a person wants to learn the meaning of a word, s/he looks in the index
  30. to find the location of the word. Then, looking it up, examines neighboring
  31. words, hopefully more familiar, to grasp at the meaning of the newer word.
  32. It could be used as a thesaurus in a similar fashion.
  33.  
  34. Depending on the scheme, weights may be assigned to edges of the graph as
  35. either unit lengths or some other measure based on the "nearness" of
  36. two words (for example, the average distance of all paths connecting them).
  37. If the weights of edges are nonuniform, the endpoints of the optimal path
  38. may be determined uniquely. It would be interesting to speculate on what two
  39. words would fall at the endpoints--`good'/`evil'?  `true'/`false'?
  40. `love'/`hate'?
  41.  
  42. The question, then--has anybody attempted to implement such a scheme?  I
  43. know that Travelling Salesman is apropos and in NP, so that the optimum 
  44. path is intractable for larger sets, but even approximations would be useful.
  45. The project may be feasible and even lucrative to an inventor, considering
  46. the importance and ubiquity of language reference materials.
  47.  
  48.  
  49. --
  50.  
  51. ld231782@longs.LANCE.ColoState.EDU
  52.