home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / bit / listserv / notabene / 3074 < prev    next >
Encoding:
Text File  |  1992-12-21  |  1.9 KB  |  48 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!!HELSINKI,
  3. X-Envelope-to: NOTABENE@TAUNIVM.BITNET
  4. X-VMS-To: IN%"NOTABENE@TAUNIVM.BITNET"
  5. X-VMS-Cc: JTAKALA
  6. MIME-version: 1.0
  7. Content-type: TEXT/PLAIN; CHARSET=US-ASCII
  8. Content-transfer-encoding: 7BIT
  9. Message-ID: <01GSH5XGTF4IAC2XG2@hylk.Helsinki.FI>
  10. Date:         Fri, 18 Dec 92 22:31:38 IST
  11. Sender:       Nota Bene List <NOTABENE@TAUNIVM.BITNET>
  12. From:         "J-P Takala, University of Helsinki,
  13.               Sociology" <JTAKALA@FINUHA.BITNET>
  14. Subject:      separators, NB, Orbis
  15. Newsgroups: bit.listserv.notabene
  16. Lines: 30
  17.  
  18.  
  19. Got a familiar looking table for
  20. Separators for Words, Sentences, and Paragraphs
  21. SE:3
  22. ....etc
  23. from Mervyn. (Was it really supposed to be in nb3's DEFAULT.SET? Why
  24. haven't I been punished--or in which way have I been punished--for
  25. not having it, at least for quite some time now?)
  26.  
  27. Anyway, it did not seem to affect the way Orbis (format 1) treated
  28. hyphens.  I added the separator definitions to NBCUSTOM.SET, restarted
  29. NB and created a brand new test Orbis textbase.  The result was the
  30. same as I described earlier.  "Eeva riitta" would not find "Eeva-Riitta"
  31. but "eeva-riitta" would, and that's just the way I like it, and I hope
  32. this is taken as a feature and not a bug by those who are fixing this
  33. thing until it's perfect and flawless.
  34.  
  35. BUT. I guess that this hyphen thing (which I like) is _of a piece_
  36. with commas and (as I now notice) even hard spaces being treated as
  37. parts of words (which I would rather not see).  And now that I'm
  38. looking at it, I see that also the period gets treated as part of
  39. the keyword, as in a Finnish date format: "18.12.1992", which I also
  40. rather like than dislike.  Periods I can only spot in cases where a
  41. regular alphanumeric immediately follows.
  42.  
  43. I've heard nobody confirm or disconfirm these things about commas and
  44. hyphens.  Mervyn, does your Orbis treat hyphens as separators?
  45.  
  46. j-p takala
  47. jtakala@cc.helsinki.fi
  48.