home *** CD-ROM | disk | FTP | other *** search
/ DOS/V Power Report 1997 November / VPR9711A.ISO / VPR_DATA / Special / Tmedt180 / tmedt180.exe / TMFMT1.TXT < prev    next >
Text (UTF-16)  |  1997-08-25  |  4KB  |  77 lines

  1. :932:#-----------------------------------------------#
  2. :932:# ToolMan のファイルフォーマットについて        #
  3. :932:# ESC:(エスケープコロン)フォーマットについて    #
  4. :932:#   前寺正彦<SGQ00310@niftyserve.or.jp>         #
  5. :932:#     96/12/01 - 97/02/05                       #
  6. :932:#-----------------------------------------------#
  7. :932:
  8. :932:(注意) このテキストファイルを正常に読むためには、
  9. :932:「文字コードの設定ダイアログ」で編集時文字コードを
  10. :932:ESC: にしてください。
  11. :932:
  12. :932:1.設定目的
  13. :932:2.仕様
  14. :932:3.Unicode+CodePage ---> Unicode
  15. :932:4.Unicode+CodePage ---> ローカルコードセット
  16. :932:
  17. :932:1.設定目的
  18. :932:
  19. :932:    Unicode は多言語の文字を単一のコードセットで
  20. :932:  表示できるように設定されたコードセットですが、
  21. :932:  使用環境でフォント形状を変化させなければ実用的な
  22. :932:  コードセットにならないという矛盾を持っています。
  23. :932:  ワープロソフト等は独自のファイルフォーマット内に
  24. :932:  フォント情報を持たせることで対応していますが、
  25. :932:  この方法だとファイルフォーマットが複雑になり、
  26. :932:  作成されたファイルをすべての環境で簡単に利用することが
  27. :932:  困難になります。
  28. :932:    そこでツールマンエディターは単純な制御コードを
  29. :932:  含んだテキストフォーマットを採用しています。
  30. :932:    また、このフォーマットを他の環境で利用することに
  31. :932:  対して制限はありません。
  32. :932:
  33. :932:2. 仕様
  34. :932:
  35. :932:    各構成文字はすべて Unicode 文字で構成されており、
  36. :932:  各文字は次の形式のヘッダーをもちます。
  37. :932:
  38. :932:    ESC:コードページ:文字コード
  39. :932:    (ESC はコード番号 0x001B です。)
  40. :932:
  41. :932:    (例 1)
  42. :932:      大文字           A  ESC:932:A
  43. :932:      円マーク         \  ESC:932:\
  44. :932:      バックスラッシュ :1252:\:932:  ESC:1252:\
  45. :932:      ウォンマーク     :949:\:932:  ESC:949:\
  46. :932:
  47. :932:    (例 2)
  48. :932:      カタカナ     アイウエオカキクケコサシスセソ
  49. :932:      ラテン文字   :1252:ÀÈÌÒÙÁÉÍÓÚÂÊÎÔÛ
  50. :932:
  51. :932:    (例 3)
  52. :932:      Japanese こんにちは
  53. :932:      Hangeul  :949:안녕하세요
  54. :932:      Chinese  :936:你好
  55. :932:
  56. :932:   ここで、各文字コード毎にこのヘッダーをつけると
  57. :932:   ファイルサイズに無駄が生じます。
  58. :932:   したがって前の文字と同じコードページのときは省略します。
  59. :932:   ただし、行単位で処理を行うフィルター等のために
  60. :932:   各行頭のヘッダーは省略できません。
  61. :932:
  62. :932:3.Unicode+CodePage ---> Unicode
  63. :932:
  64. :932:    この形式ではすべてのヘッダー情報が Unicode で構成されて
  65. :932:  いるので Unicode に対応したツールなら正常にあつかえます。
  66. :932:  また、ESC:...: のヘッダー情報を読み飛ばすことで、
  67. :932:  普通の Unicode テキストに変換可能です。
  68. :932:
  69. :932:4.Unicode+CodePage ---> ローカルコードセット
  70. :932:
  71. :932:    この形式からローカルコードセットに変換するには
  72. :932:  各ヘッダーのコードセット番号に応じて変換します。
  73. :932:  環境によってはすべてのコードセットに変換できませんが、
  74. :932:  必要な部分だけを抜き出すことで変換可能です。
  75. :932:  変換不可能な部分は ESC:1200:(Unicode) とすることで、
  76. :932:  Unicode 情報の保持も可能です。
  77.