入力-2Mac
■漢字を探す

●テキストを入力していて、必ず悩まされる問題があります。それは目的の漢字が、かな漢字変換ソフト(インプット・モジュール、略してIMともいいます。Macintoshでは標準装備の「ことえり」、ジャストシステム社の「ATOK」、エルゴソフト社の「EGBRIDGE」が代表的です)の候補に出てこないことです。
●例えば、「聚落」を入力したいときに「じゅらく」とひらがなで入力して変換すると、「ことえり」では「聚落」が候補として表示されますが、「ATOK」で表示されるのは「入洛」だけです。これは「聚」と「落」という2つの漢字がコンピュータ上で使える文字であるにもかかわらず、「聚落という熟語」が「ATOKの辞書には登録されていない」ことを示します。
●変換しても目的の漢字や熟語が表示されない場合、ことえりやATOKでは、
1)文字パレットの「漢字表(部首別漢字表)」を使って同じ部首の文字群の中から該当文字を探す。
2)漢字辞典などでJISで定められたコードを調べ、文字パレットまたはコード入力を使って入力する。
などの方法で単漢字入力をします。
【必要な装備】
●テキスト入力にあたっては、JISで定められたコードが掲載された漢字辞典が必須です。少々高価ですが『JIS漢字字典』(日本規格協会)、または複数の出版社から刊行されている『ワープロ漢字辞典』『パソコン・ワープロ漢字辞典』の部類をぜひ用意してください。
●最近では、『新版漢語林』(大修館書店)など、コンピュータ用のコードを併記した漢和辞典も増えています。『ワープロ漢字辞典』とは違って、当然ながらJIS外の文字を調べることができますから、これも必須の装備です。
【文字パレットの活用】
●ことえりやATOKには文字パレットというツールがあり、「漢字表(部首別漢字表)」「記号表」「区点コード表」「JISコード表」「シフトJISコード表」などから構成されています。漢字や記号が、マウスの操作1つで入力できるので便利です。
●文字パレットの表示は、メニューバーの右から3番目に出る鉛筆のアイコンをマウスでプレスし、「文字パレット表示」を選択するだけです。上記のコード表はそこに含まれています。
●文字パレットからの入力は、目的の漢字や記号をマウスで選択し、クリックするだけです。全角のアルファベットも、文字パレットの「区点(JIS、シフトJIS)コード表」から入力できます。
【コード入力】
●コードには、「区点コード」「JISコード」「シフトJISコード」の3種があります。これらは「JIS漢字コードをどう表記し、JIS漢字コード中に含まれる文字に対してどんな符号を割り当てるか」の違いであり、元になるJIS漢字コードそのものは共通です。詳しくは、専門書などをご覧ください。
【コード入力の実際】
●ことえりの場合
1)全角数字でコード番号を入力し、スペースバーを2回押します。
2)表示される一覧表から該当文字を選択し、リターンキーを押します。
3)再度リターンキーを押して確定します。
(この方法が使用できるのは、「区点コード」に限られます。ただし、古いバージョンのことえりでは「4桁数字のJISコード」にも適用されます。)
●ATOK11の場合
1)ATOKパレットを表示していない場合は、鉛筆メニューのアイコンから「ATOKパレット表示」を選びます。
2)ATOKパレットの「R漢」をクリックし、現れたポップアップメニューから「コード入力」を選びます。
3)現れた入力ウィンドウの左のボタンをクリックすると、「JIS 」、「シフトJIS」、「区点」のいずれかを選べます。
4)コード番号を入力します。
5)入力ウインドウに、該当の文字が表示されます。
6)リターンキーを押すと、該当の文字が入力されます。
【JISと外字】
●コンピュータ上で共通に使える和文文字は、基本的には、JIS(日本工業規格。現在使用されているのは、JIS X0208)で定められた「第一水準漢字(2965字)」「第二水準漢字(3390字)」「非漢字」「記号」だけです。これらに含まれない文字を、外字といいます。
●外字の一部は、JISの空き領域に埋め込まれています。しかしながら、このような処理をした外字は異機種間の互換性がありませんので、使用しないでください。(→異機種間の互換性
●入力にワープロ・ソフトを使う場合は、JISの空き領域やASCIIコードを割り当てた市販の外字専用フォントにも注意が必要です。この種のフォントには異機種間だけでなくMacintoshユーザー間の互換性までが失われる懸念がありますので、使用しないでください。
【外字の処理】
●外字は、入力者注で処理してください。例えば、

の場合には、
   喉を掻き※[#「※」は「てへん+劣」、読みは「むし」、30-16]って
のように、代わりに「※」(区点コード0208、JISコード2228、シフトJISコード81A6)を入れ、さらに元の文字の形についての説明と読みを加えます。そのあとには、「ページ-行」の形式で底本の何ページ・何行目にあるかを記述します。
●外字は、多くの場合、底本でもルビ付きで使われています。上記の例にルビがついて、

となっている場合には、
   喉を掻き※[#「※」は「てへん+劣」、30-16]《むし》って
のように入力します。
【異機種間の互換性】
●JISの空き領域にどんな外字が埋め込まれているかは、メーカー(OS)によって異なります。例えば、Macintoshで入力した修飾数字「○付きの1」(区点コード0901、JISコード2921、シフトJISコード8540)は、Windowsでは「(日)」と表示されます。
●このような「異機種間の互換性のない文字」は、
   1[#「1」は底本では○付き数字] インターネット
のように、JIS漢字コードに含まれる文字に置き換えた上で、入力者注を付けてください。
●区点コード0833から1594まで、JISコード2841から2F7Eまで、シフトJISコード84BFから889Eまでに割り振ってある文字や記号は、異機種間の互換性がありません。
29moji 【微妙な字体差と包摂規準】
●底本で使われている漢字と入力したものとで、細部の形が微妙に異なっていることがあります。「果たしてこの字を使ってよいのか?」、迷う場合もあるでしょう。その際、「よいか悪いか」の判断は、用いている漢字コードが「字体の揺れ幅」について定めた、「包摂規準」にのっとって下します。青空文庫はJIS漢字コードを使っていますから、その規準に従って、判断します。
●包摂規準とは、「この差は区別しない」という約束事の集まりです。その全体と詳細に関しては、JIS漢字コードの規格書(『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』日本規格協会)の、「漢字の字体の包摂規準」(11〜23ページ)を参照してください。この規準にそって、区別するかしないか一目で分かるように工夫した『JIS漢字字典』(芝野耕司編、日本規格協会)に当たれば、より簡単に判断が付きます。info@aozora.gr.jp宛てに問い合わせてもらえれば、私たちが調べて答えます。
●JIS漢字コードの包摂規準に従えば、本来、ここに示す29文字のAとBのパターンは区別されなければいけません。ところが過去の規格改定時に犯した誤りとつじつまを合わせるために、例外として「同じものとして扱う」とされています。これらに関しては、底本と表示文字が異なっていたり、フォントを切り替えた際に字体が変わったりしても、気にしないでください。(2000年はじめの制定を目指して、現在、JIS漢字コードの拡張作業が進められています。拡張規格では、この29文字は区別されます。ただし、呼びかけ人からの明確な方針変更の案内があるまでは、区別せずに扱ってください。)
●JIS漢字コードの包摂規準では、しんにゅうの点が一つか二つか、草冠の横画が切れているか否かは区別されません。画面やプリントアウトの表示と底本が異なっていても、違いは無視してください。

■文書の保存

●入力データの保存は、「テキスト・ファイル(プレーン・テキスト・ファイル)」と呼ばれるファイル形式で行います。テキスト・ファイルとは、「フォント(書体)や文字サイズ、行間、字送りなどの書式指定」をしない、「JIS漢字コードで定められている文字と、ASCII規格で定められている欧文文字だけで構成された」最も単純な文書形式を指します。
●ワープロ・ソフトやワープロ機能をもつ統合ソフト、例えばクラリスワークス4.0で入力したテキストを「ファイル形式」の項目で「クラリスワークス4.0」を選択すると独自フォーマットで保存され、クラリスワークス4.0の所有者以外はそのファイルを開くことができません。入力にこの種のソフトをお使いの場合は、必ずフォーマット指定の項目で「テキスト」「TEXT」などを選択してください。
●保存の際には、ファイル名は「sansiro.txt」のようにします。Macintoshではふだん使うことは少ないと思いますが、末尾には拡張子「.txt」または「.TXT」を付けてください。
【改行コードの処理】
●Macintoshで入力されたテキスト・データは、改行コードが「CR」になっています。テキスト・ファイルを青空文庫に登録する際には、改行コードはすべてMS-DOS方式の「CR+LF」で統一しています。テキスト・エディターのJeditなど、保存時に改行コードの選択ができるソフトをお使いの場合は、「CR+LF」を指定してください。

■入力者校正

●プロの入力者、プロの校正者、プロの編集者の共同作業でつくられる市販の書籍でさえ誤植があります。アマチュアである私たちが入力したテキストには「確実にミス入力が含まれている」と見なすべきでしょう。
●そこで、入力が完了したら、必ず「入力者校正」を行い、入力データを修正しておいてください。入力者校正は、後述する「原稿つきあわせ」と「素読み」の二段階に分けて行っていただくのがベストです。(→校正の実際
●ファイルの精度を高めるためには、「できるだけ早い段階でミスを修正しておく」ことが鉄則です。ぜひご協力ください。

■文書の送信

●入力者校正が済んだファイルは、info@aozora.gr.jp宛にインターネット・メールで送信してください。その際、ファイルには「圧縮」をかけ、「添付ファイル」として処理するようにしてください。
【圧縮】
●インターネットは、デスクトップでお使いのパソコンに比べ、処理速度が極度に遅いメディアです。ファイルを圧縮しておけば、送信時間が短縮でき、電話料金などのコストも軽減できます。
●ファイルの圧縮には、専用のソフトが必要です。また、圧縮されたファイルの解凍(復元)にも専用のソフトが必要です。MacintoshではStuffIt Lite(シェアウェア)、DropStuff with Expander Enhancer(シェアウェア)、StuffIt Delux(製品版)を使って「StuffIt形式」に圧縮するか、Compact Pro(シェアウェア)を使って「Compact Pro形式」に圧縮するのが一般的ですが、後者はMacintosh専用です。青空文庫宛の送信の際はできれば「StuffIt形式」を使ってください。
●それ以外では、MacintoshとWindowsで共通に使える「LHA形式」(圧縮はフリーウェアのMacLHAで行います)でも結構です。
【ファイル添付】
●インターネット・メールで送信できるのは、「テキスト・データ」だけです。そこで、画像などのバイナリー・データを送信する際には、ファイルを「特殊なテキスト・ファイルに変換して、メールに添付する」必要があります。このような変換を「エンコード」、変換されたファイルを元に戻すことを「デコード」といいます。
●入力ずみのテキスト・ファイルは、エンコードなしでそのまま添付できますし、メールの本文にコピー&ペーストで組み込むこともできます。しかしながら、メール本文に組み込まれたテキストには、1行1行に強制的に改行コードが付加されてしまいます。また、添付されたテキスト・ファイルは、メール・ソフトによっては、受信の際に自動的に本文に組み込まれてしまいます。圧縮→添付という方法で処理すれば、このようなトラブルを防ぐことができます。
●エンコードは、Macintoshでは、BinHexという方式を使うのが一般的です。これに対し、WindowsではBase64という方式が一般的です。ほとんどのMacintosh用メール・ソフトはどちらの方式にも対応していますので、送信の際には「Base64」(メール・ソフトによっては、名称はMIME、Apple Doubleなど)を指定してください。
●この項でご紹介したフリーウェアやシェアウェアは、一部はMac OSに付属していますし、パソコン雑誌の付録CD-ROMでも入手できます。また、最新版は下記のウェブサイトからダウンロードできます。
◆StuffIt Lite、DropStuff with Expander Enhancer、StuffIt Expander(解凍専用)=http://www.aladdinsys.com/(Aladdin Systems)またはhttp://www.act2.co.jp/(ACT2)
◆MacLHA=http://www.vector.co.jp/(Vector)
【底本の用意】
●送信していただいたテキスト・ファイルは、校正担当の呼びかけ人もしくは工作員の方のところへとまわされ、校正作業に移ります。このとき、当然ながら入力に使用された底本が必要になります。
●現在は、入手が容易であれば、同じ書籍の一番新しい版を購入するようにしています。しかしながら、ときには絶版・品切れのため、古書店などをまわっても入手が不可能な場合があります。そのため、底本もしくはそのコピーを送付していただく必要が出るかもしれません。ご協力をお願いします。



「校正」へ|◆作業マニュアル目次へ