home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #20 / NN_1992_20.iso / spool / comp / os / msdos / programm / 9162 < prev    next >
Encoding:
Internet Message Format  |  1992-09-08  |  2.9 KB

  1. Path: sparky!uunet!utcsri!bonnie.concordia.ca!hobbit.ireq.hydro.qc.ca!beaurega
  2. From: beaurega@ireq.hydro.qc.ca (Denis Beauregard)
  3. Newsgroups: comp.os.msdos.programmer
  4. Subject: Re: The Box-Drawing Charachters
  5. Message-ID: <Bu9Lv8.6pL@ireq.hydro.qc.ca>
  6. Date: 8 Sep 92 15:04:20 GMT
  7. References: <5265@krafla.rhi.hi.is> <1992Aug31.184726.1583@mits.mdata.fi> <la5apvINN8kb@exodus.Eng.Sun.COM>
  8. Sender: news@ireq.hydro.qc.ca (Netnews Admin)
  9. Organization: Institut de recherche d'Hydro-Quebec, Varennes, Canada
  10. Lines: 47
  11.  
  12. In article <la5apvINN8kb@exodus.Eng.Sun.COM> falk@peregrine.Sun.COM (Ed Falk) writes:
  13. >In article <1992Aug31.184726.1583@mits.mdata.fi> kennu@mits.mdata.fi (Kenneth Falck) writes:
  14. >>>and if so how are the ordered?
  15. >>
  16. >>You know, it'd be interesting to find any intelligent order for
  17. >>the entire extended IBM ASCII character set... The characters
  18. >>seem to be organized by groups of 32's, but there are still
  19. >>some very strange symbols among the accented characters, and
  20. >>you can't even dream of finding some sort of organization 
  21. >>inside these groups. (I wonder why they included only some
  22. >>characters of the Greek alphabet etc...)
  23. >
  24. >Go look at IBM's EBCDIC character set (where, for example, '~' comes
  25. >between 'r' and 's') and ask yourself if you'd dream of finding some
  26. >sort of organization in their extended IBM ASCII character set.
  27. >
  28. >        -ed falk, sun microsystems
  29. >         sun!falk, falk@sun.com
  30. >    "Towards the end, the smell of their air began to change"
  31.  
  32. There is a "natural" method of sorting according to which language
  33. (i.e. French, not Basic :-)  ).  DOS sort in recent versions takes care
  34. of that.  The method is quite simple (no idea if they do that, but I
  35. do that in my own qsort-based psort program) : if under 0x80, keep it
  36. as is (lowercase or lowercase if needed), if over, using a table lookup,
  37. remap the character.  Obviously, it is a bit faster if you use a 256
  38. characters table instead of a 128 entries with checking for 8th bit.
  39. In my program, I duplicate the sort key (I use a 8000 line table with
  40. one pointer to original line and possibly extended memory address, and
  41. onepointer to re-coded line [I have a lot of re-coding schemes] ).
  42.  
  43. In your case, only use I see for giving a logical order is for sorting.
  44. Otherwise, you could use a table to re-code.
  45.  
  46. There is a lot of standards.  EBCDIC is available on many FTP site
  47. if you transfer text files using BINARY more.  ASCII is standard if
  48. under 0x80 and not over.  IBM-ASCII is available on DOS machines.
  49. ANSI-ASCII is available in DOS Windows (and it does not match IBM-ASCII)
  50. and in many UNIX systems.  MAC-ASCII is also different (Macintosh).
  51. Names (i.e. IBM-ASCII) are not the official ones (if they exist).
  52.  
  53.  
  54. -- 
  55.   \_\    Denis Beauregard  *  internet:beaurega@ireq.hydro.qc.ca
  56.  /   \   Genealogiste officiel : Beauregard/Jarret/Jarest/Vincent
  57. J   __>  Un Quebec renouvele dans une Amerique renovee
  58. \_.-===                                                  Opinions ? Et pis non !
  59.