home *** CD-ROM | disk | FTP | other *** search
/ Play and Learn 2 / 19941.ZIP / 19941 / JAPANESE / ZIPFILES / KANJI20.ZIP / JIS-FILE.DOC < prev    next >
Encoding:
Text File  |  1989-07-03  |  5.8 KB  |  118 lines

  1. Shin-JIS code tables
  2. Michael J. Imber (CIS 71631,563)
  3.  
  4.         This arc file contains a set of files which display two
  5. charcter Shin-JIS ascii codes along with the corresponding Japanese
  6. character when viewed with the display program, Kanjiview 2.0, by
  7. Steven Johnston. The files were constructed so that a single file
  8. would contain all the possible characters encoded by character com-
  9. binations C1-C2, where C1 is a constant character throughout the file,
  10. and C2 is a variable character.
  11.  
  12.         The files are designed to display as a single screen when
  13. viewed with an IBM-compatible PC with VGA graphics. Each file will ap-
  14. pear as a five double rows separated by an empty row. Each double row
  15. includes 20 code-character combinations, with the two-character ascii
  16. code appearing above the corresponding Japanese character. I generated
  17. these files using XyWrite III+ as part of a project to develop XPL
  18. routines to convert roman text to the appropriate JIS codes. Perhaps
  19. the material as organized herein may be of use to others with similar
  20. interests.
  21.  
  22.         Below are a number of empirical observations and comments
  23. regarding the organization of the JIS codes and corresponding Japanese
  24. characters. The files and the following observations are based entire-
  25. ly on my experimenting with Steve Johnston's KanjiView 2.0 program
  26. using different character combinations. Any errors in observation or
  27. interpretation are entirely due to my own inadequate efforts.
  28.  
  29. 1.      The range of ascii characters employed in these JIS codes in-
  30. clude the 94 characters represented by ascii 33-126, inclusive; that
  31. is beginning with character ! (#33) and ending with ~ (#126). These are
  32. all within the 7-bit, printable ascii range, unlike the Shift-JIS
  33. codes which employ ascii characters above 128.
  34.  
  35. 2.      Each Japanese character is represented by a two-character com-
  36. bination. Therefore 94x94, or 8836 codes are possible. Study of the
  37. various ascii combinations, however, reveals that not all such codes
  38. are employed for unique characters.
  39.  
  40. 3.      The included files display all possible ascii character com-
  41. binations "C1-C2" where the first character, C1, is constant, and the
  42. second character "C2" varies between ascii 33(!) and 126(~). All files
  43. have the filename SHIN2. The extension of each filename reflects the
  44. constant first character, C1, used in that file. For example, all
  45. files in which C1 is an alphanumeric character, i.e. ascii #48-57
  46. (0123456789), #65-79 (A-P), have the extension corresponding to the
  47. alphanumeric character. Therefore the files displaying code combina-
  48. tions in which the first character is a numeral are shin2.0, shin2.1,
  49. shin2.3, etc. Likewise for roman letters: shin2.A, shin2.B, shin2.C,
  50. etc. Those files representing non-alphanumeric first characters have
  51. the extension corresponding to the ascii code itself. For example,
  52. shin2.33 includes all character combination with ! as the first
  53. character. Those files which display a degenerate set of characters
  54. are omitted from this collection, with the exception of shin2.P.
  55.  
  56. 4.      The range of characters, C1, which yield unique sets of
  57. characters are limited to the following:
  58.         ascii 33-40  !"#$%&'(
  59.         ascii 48-57  0123456789
  60.         ascii 58-64  :;<=>?@
  61.         ascii 65-79  ABCDEFGHIJKLMNO
  62. Other characters, C1, from ascii ranges 41-47 and 80-126 generate a
  63. degenerate set of characters or noise which is similar from set to
  64. set. The collection of files includes shin2.P as an example of such a
  65. degenerate set.
  66.  
  67. 5.      The JIS codes appear to segregate into two groups of two-
  68. character combinations. Those combinations where the first character
  69. ranges from ascii 33-40 represent non-Kanji characters, whereas com-
  70. binations in which the first character ranges from 48-79 represent the
  71. Kanji.
  72.  
  73. 6. The non-Kanji code combinations appear to segregate as follows, ac-
  74. cording to the first character:
  75.         ascii 33  !  blank space, punctuation marks, symbols, opera-
  76. tors
  77.         ascii 34  "  symbols, operators, musical notations
  78.         ascii 35  #  Arabic numerals, Roman alphabet
  79.         ascii 36  $  Hiragana
  80.         ascii 37  %  Katakana
  81.         ascii 38  &  Greek alphabet
  82.         ascii 39  '  Russian alphabet
  83.         ascii 40  (  line graphic characters
  84. Within each file displaying all 94 character combinations, many Kanji
  85. and occasionally other characters may be observed occupying degenerate
  86. stretches of JIS code. The display of alphanumeric characters is easy
  87. to remember since the second character of the two-character combina-
  88. tion corresponds to the actual JIS display; i.e #5 displays 5, #D dis-
  89. plays D, #r displays r, etc.
  90.  
  91. 7. The Kanji are represented by code combinations in which the first
  92. character ranges from 48 (Arabic numeral 0) to 79 (Roman letter O).
  93. The final code combination actually corresponding to a unique Kanji
  94. character is OS. Code combinations following appear degenerate. The
  95. ordering of Kanji characters by JIS code combinations 0! to OS appears
  96. to be primarily according to "on" phonetizations, and secondarily to
  97. "kun" where no "on" exists. Therefore, random identification of
  98. several Kanji from each file will enable construction of a rough a-i-
  99. u-e-o glossary of phonetizations, from which other characters and cor-
  100. responding JIS codes may be retrieved.
  101.  
  102.  
  103.         I must emphasize that Steve Johnston's KanjiView 2.0 has been
  104. a tremendous contribution to all interested in the use of IBM-PC ap-
  105. plications and the study of Japanese. I eagarly await the introduction
  106. of his editor which will should make an even greater impact.
  107.  
  108.         I hope that these files may be of interest to other CIS or
  109. FLEFO members interested in the Japanese language and JIS coding. I
  110. look forward to any comments or criticisms that others using this
  111. material might have.
  112.  
  113.  
  114. Michael J. Imber
  115. Boston, MA
  116. CIS 71631, 563
  117.  
  118.