home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / unix / bsd / 10989 < prev    next >
Encoding:
Internet Message Format  |  1993-01-07  |  4.8 KB

  1. Xref: sparky comp.unix.bsd:10989 comp.std.internat:1077
  2. Path: sparky!uunet!spool.mu.edu!sgiblab!nec-gw!nec-tyo!wnoc-tyo-news!cs.titech!titccy.cc.titech!necom830!mohta
  3. From: mohta@necom830.cc.titech.ac.jp (Masataka Ohta)
  4. Newsgroups: comp.unix.bsd,comp.std.internat
  5. Subject: Dumb Terry
  6. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  7. Message-ID: <2637@titccy.cc.titech.ac.jp>
  8. Date: 7 Jan 93 06:41:06 GMT
  9. References: <2615@titccy.cc.titech.ac.jp> <1993Jan5.090747.29232@fcom.cc.utah.edu> <2628@titccy.cc.titech.ac.jp> <1993Jan7.045612.13244@fcom.cc.utah.edu>
  10. Sender: news@titccy.cc.titech.ac.jp
  11. Followup-To: comp.unix.bsd
  12. Organization: Tokyo Institute of Technology
  13. Lines: 118
  14.  
  15. In article <1993Jan7.045612.13244@fcom.cc.utah.edu>
  16.     terry@cs.weber.edu (A Wizard of Earth C) writes:
  17.  
  18. >Before I proceed, I will [ once again ] remove the "dumb Americans" from my
  19. >original topic line.
  20.  
  21. I changed the subject to reflect the content better.
  22.  
  23. >>>>>This I don't understand.  The maximum translation table from one 16 bit value
  24. >>>>>to another is 16k.
  25.  
  26. >>>>WHAAAAT? It's 128KB, not 16k.
  27.  
  28. >It is still a translation of one 16 bit value to another.  In is *not* an
  29. >*arbitrary* translation we are talking about, since the spanning sets will
  30. >be known.
  31.  
  32. You wrote MAXIMUM.
  33.  
  34. >>>>>This means 2 16k tables for translation into/out of
  35. >>>>>Unicode for Input/Output devices,
  36.  
  37. >Sorry; I misspoke (mistyped?) here.  
  38.  
  39. You are dumb.
  40.  
  41. >I meant to refer to any arbitrary 8-bit
  42. >set for which a localization set is available (example: and ISO 8859-x set).
  43.  
  44. Do you know what HASHING is? If not, read Knuth. 
  45.  
  46. >Obviously, by this response, you meant "cat two files to a third file" rather
  47. >than what you stated,
  48.  
  49. You don't have to create a third file, as the output might be piped.
  50.  
  51. >what you stated, which would have resulted in the files going to the
  52. >screen.  Display device attribution based on supported character
  53.  
  54. While you may not know UNIX at all, "cat" has nothing to do with display.
  55. Instead, some device drivers and terminal emulators might.
  56.  
  57. >Obviously what you are asking is "how do I make two monolingual/bilingual/
  58. >multilingual files of different language attribution into a single bilingual/
  59. >multilingual file using cat" -- not the question as you have phrased it, nor
  60. >as I have answered it, but in the context of the discussion, clearly the
  61. >intended tack.
  62.  
  63. "How to "cat" files with different attributes" is the classic question
  64. to piss off attribute-lovers, which all UNIX lovers know.
  65.  
  66. Of course, there are several other reasons why not to use file attributes,
  67. which yuu don't know. But, I'm tired.
  68.  
  69. >Rather than pretending I don't know what you are getting at,
  70.  
  71. Then, don't post anymore.
  72.  
  73. >The answer is "you don't use 'cat'".  The "cat" command does not deal with
  74.  
  75. OK, say it in comp.unix.misc and see what happens.
  76.  
  77. >What this means is that all files which are multilingual in nature require
  78. >a compound document architecture.
  79.  
  80. No thank you. I do want to grep my multilingual files.
  81.  
  82. >What this means is that a utility to combine documents (let's call it
  83. >"combine") must have the ability to either generate language attributed
  84. >files (if the source files are all of a single language attribution) or
  85. >our default compound document format (TBD).
  86.  
  87. You are making simple problem unsolvable.
  88.  
  89. >The correct approach is to note that since Unicode does not provide a
  90. >mechanism directly for language attribution, and that file attribution
  91. >is only a partial soloution,
  92.  
  93. So, the correct aproach is not to use Unicode as it is.
  94.  
  95. >What this means is that a utility to combine documents (let's call it
  96. >"combine")
  97.  
  98. Wow!
  99.  
  100. >Does this answer your "cat" question sufficiently?  
  101.  
  102. Conglaturations! You are now prepared to accept the second question.
  103.  
  104. Under internationalized environment, we often create a file with Japanese
  105. name. At the same time,
  106.  
  107.     1) we might have a file having Chinese name in the same directory.
  108.     2) we might have a file having Chinese name in the different directory.
  109.     3) the Japanses file's full pathname might contain Chinese at its
  110.        intermediate directory name.
  111.  
  112. Could you design a replacement of "ls" for such a situation?
  113.  
  114. Then, the third:
  115.  
  116. >Attribution of output and clever construction of out output device drivers
  117. >would even allow us to switch fonts as dictated by the compound document
  118. >architecture controls embedded in the file and/or the attribution of the
  119. >file descriptor (the absence of such attribution being an indicator of a
  120. >compund document).
  121.  
  122. Given the above situation for "ls", I'm afraid that "argv" to any command
  123. be the compound document. Am I correct? Is it still have a type "char"?
  124. Do you think the entire OS still UNIX?
  125.  
  126. >The problem seemed to
  127. >be that there was not a means around the problem from your point of view.
  128.  
  129. Just include language information in character code, and the problem
  130. disappears.
  131.  
  132.                         Masataka Ohta
  133.