入力-2Win
■漢字を探す

●テキストを入力していて、必ず悩まされる問題があります。それは目的の漢字が、かな漢字変換ソフト(フロント・エンド・プロセッサ、略してFEPともいいます。Windowsでは標準装備の「MSIME」、ジャストシステム社の「ATOK」が代表的です)の候補に出てこないことです。例えば、「聚落」を入力したいときに「じゅらく」とひらがなで入力して変換すると、「ATOK11」で表示されるのは「入洛」だけです。これは「聚」と「落」という2つの漢字がコンピュータ上で使える文字であるにもかかわらず、「聚落という熟語」が「ATOK11の辞書には登録されていない」ことを示します。
●変換しても目的の漢字や熟語が表示されない場合には、
1)漢字辞典などでJISで定められたコードを調べ、コード入力もしくは文字パレットを使って入力する。
2)FEPの文字パレットを使って同じ部首や読みなどの文字群の中から該当文字を探す。
などの方法で単漢字入力をします。
【必要な装備】
●テキスト入力にあたっては、JISで定められたコードが掲載された漢字辞典が必須です。少々高価ですが『JIS漢字字典』(日本規格協会)、または複数の出版社から刊行されている『ワープロ漢字辞典』『パソコン・ワープロ漢字辞典』の部類をぜひ用意してください。
●最近では、『新版漢語林』(大修館書店)など、コンピュータ用のコードを併記した漢和辞典も増えています。『ワープロ漢字辞典』とは違って、当然ながらJIS外の文字を調べることができますから、これも必須の装備です。
【文字パレットの表示】
●MSIME97、98の場合は、MSIMEツールバーの「鉛筆と虫眼鏡(漢字辞典)」、MSIME95の場合は、「虫眼鏡(単漢字変換)」のアイコンをクリックすると、文字パレットが出てきます。

総画数、部首などのタブをクリックし、さらに、それぞれに含まれるフォルダのアイコンをクリックすると、文字の一覧が表示されます。一覧から必要な文字をクリックすると、カーソルのある位置に入力されます。
●ATOK11、ATOK12の場合は、ATOKツールバーの「鉛筆とパレット(文字パレット)」のアイコンをクリックすると、文字パレットが出てきます。「漢字検索」のタブをクリックすると、部首、読みで漢字を検索することができます。(ATOK12の場合は、総画数でも検索できます。)「検索結果」のボックスに表示された文字をクリックすると、カーソルのある位置に入力されます。ATOK9、ATOK10にも、文字パレットは用意されています。
【コード入力】
●コードには、「区点コード」「JISコード」「シフトJISコード」の3種があります。これらは「JIS漢字コードをどう表記し、JIS漢字コード中に含まれる文字に対してどんな符号を割り当てるか」の違いであり、元になるJIS漢字コードそのものは共通です。詳しくは、専門書などをご覧ください。
【コード入力の実際】
●MSIMEの場合
1)日本語入力をオンにして、下左図のように入力モードを「全角英数」か「半角英数」にします。
2)目的の漢字のコード(JISコードまたはシフトJISコード)を入力します。
3)キーボードのF5キーまたはCtrl+Yキーを押します。これで、目的の文字が現れます。クリックするか、Enterキーを押すと、カーソルのある位置に入力されます。(下中右図)

●ATOKの場合
1)日本語入力をオンにすると、下図のようなツールバーが表示されます。

2)キーボードのF10キーを押すと、半角モードになります。さらにもう一度押すと、下図のようにシフトJISコードの入力モードになります。「シフトJIS」と書かれているボタンをクリックすると、「区点」「JIS」と切り替わります。

3)目的の文字のシフトJISコード(区点コード、JISコード)を入力します。これで、目的の文字が現れます。現れた文字をクリックすれば、カーソルのある位置に入力されます。
●この他に、ATOKの場合は、F10を押してコード順の一覧を表示することもできます。F10を1回押すと半角モードに、もう一度押すとコード入力モードになり、さらにもう1度押すと記号モードになって、該当するコード表の先頭から10文字ずつ一覧が出てきます。上下矢印でページ移動が、左右矢印で文字選択ができます。文字をクリックするか、選択してEnterキーを押すと、カーソルのある位置に入力されます。「記号モード」と名付けられていますが、Windowsで扱える文字コードの文字は、すべてこの方法で入力できます。
●MSIMEの場合も、環境設定で「テンプレート」を「ATOK」にしておけば、F10キーを2回押すと該当するコードの先頭から一覧が出てきます。ただし、この設定では、前述したF5キーまたはCtrl+Yキーによる変換はできません。
【JISと外字】
●コンピュータ上で共通に使える和文文字は、基本的には、JIS(日本工業規格。現在使用されているのは、JIS X0208)で定められた「第一水準漢字(2965字)」「第二水準漢字(3390字)」「非漢字」「記号」だけです。これらに含まれない文字を、外字といいます。
●外字の一部は、JISの空き領域に埋め込まれています。しかしながら、このような処理をした外字は異機種間の互換性がありませんので、使用しないでください。(→異機種間の互換性
●入力にワープロ・ソフトを使う場合は、JISの空き領域やASCIIコードを割り当てた市販の外字専用フォント(書体)にも注意が必要です。この種のフォントには異機種間の互換性だけでなくWindowsユーザー間の互換性までが失われる懸念がありますので、使用しないでください。
【外字の処理】
●外字は、入力者注で処理してください。例えば、

の場合には、
   喉を掻き※[#「※」は「てへん+劣」、読みは「むし」、30-16]って
のように、代わりに「※」(区点コード0208、JISコード2228、シフトJISコード81A6)を入れ、さらに元の文字の形についての説明と読みを加えます。そのあとには、「ページ-行」の形式で底本の何ページ・何行目にあるかを記述します。
●外字は、多くの場合、底本でもルビ付きで使われています。上記の例にルビがついて、

となっている場合には、
   喉を掻き※[#「※」は「てへん+劣」、30-16]《むし》って
のように入力します。
【異機種間の互換性】
●JISの空き領域にどんな外字が埋め込まれているかは、メーカー(OS)によって異なります。例えば、Windowsで入力した修飾数字(MSIMEの特殊文字、ATOKの丸数字)の「○付きの1」(区点コード1301、JISコード2D21、シフトJISコード8740)は、Macintoshでは「(日)」と表示されます。
●このような「異機種間の互換性のない文字」は、
   1[#「1」は底本では○付き数字]インターネット
のように、JIS漢字コードに含まれる文字に置き換えた上で、入力者注を付けてください。
●区点コード0833から1594まで、JISコード2841から2F7Eまで、シフトJISコード84BFから889Eまでに割り振ってある文字や記号は、異機種間の互換性がありません。
●また、区点コード8901〜9294、11501〜11994の拡張文字はWindows独自の割り当てなので異機種間の互換性がありません。
●以上のほか、9301〜11494のユーザ登録外字は、同一機種間でも互換性がありません。
29moji 【微妙な字体差と包摂規準】
●底本で使われている漢字と入力したものとで、細部の形が微妙に異なっていることがあります。「果たしてこの字を使ってよいのか?」、迷う場合もあるでしょう。その際、「よいか悪いか」の判断は、用いている漢字コードが「字体の揺れ幅」について定めた、「包摂規準」にのっとって下します。青空文庫はJIS漢字コードを使っていますから、その規準に従って、判断します。
●包摂規準とは、「この差は区別しない」という約束事の集まりです。その全体と詳細に関しては、JIS漢字コードの規格書(『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』日本規格協会)の、「漢字の字体の包摂規準」(11〜23ページ)を参照してください。この規準にそって、区別するかしないか一目で分かるように工夫した『JIS漢字字典』(芝野耕司編、日本規格協会)に当たれば、より簡単に判断が付きます。info@aozora.gr.jp宛てに問い合わせてもらえれば、私たちが調べて答えます。
●JIS漢字コードの包摂規準に従えば、本来、ここに示す29文字のAとBのパターンは区別されなければいけません。ところが過去の規格改定時に犯した誤りとつじつまを合わせるために、例外として「同じものとして扱う」とされています。これらに関しては、底本と表示文字が異なっていたり、フォントを切り替えた際に字体が変わったりしても、気にしないでください。(2000年はじめの制定を目指して、現在、JIS漢字コードの拡張作業が進められています。拡張規格では、この29文字は区別されます。ただし、呼びかけ人からの明確な方針変更の案内があるまでは、区別せずに扱ってください。)
●JIS漢字コードの包摂規準では、しんにゅうの点が一つか二つか、草冠の横画が切れているか否かは区別されません。画面やプリントアウトの表示と底本が異なっていても、違いは無視してください。

■文書の保存

●入力データの保存は、「テキスト・ファイル(プレーン・テキスト・ファイル)」と呼ばれるファイル形式で行います。テキスト・ファイルとは、「フォント(書体)や文字サイズ、行間、字送りなどの書式指定」をしない、「JIS漢字コードで定められている文字と、ASCII規格で定められている欧文文字だけで構成された」最も単純な文書形式を指します。
●ソフトによっては、保存用に複数のファイル・フォーマットが用意されています。例えば、Windows95に付属のWordpadでは下図のような画面で「テキスト文書」を選択します。

その他のソフトの場合には、「テキスト」「TEXT」などを選択してください。
●保存の際には、ファイル名は小文字のアルファベットを使用します。ファイルフォーマットで「テキスト」を選択して保存すると、大半のソフトでは.txtという拡張子が自動的につきます。
■入力者校正
●プロの入力者、プロの校正者、プロの編集者の共同作業でつくられる市販の書籍でさえ誤植があります。アマチュアである私たちが入力したテキストには「確実にミス入力が含まれている」と見なすべきでしょう。
●そこで、入力が完了したら、必ず「入力者校正」を行い、入力データを修正しておいてください。入力者校正は、後述する「原稿つきあわせ」と「素読み」の二段階に分けて行っていただくのがベストです。(→校正の実際
●ファイルの精度を高めるためには、「できるだけ早い段階でミスを修正しておく」ことが鉄則です。ぜひご協力ください。

■文書の送信

●入力者校正が済んだファイルは、info@aozora.gr.jp宛にインターネット・メールで送信してください。その際、ファイルには「圧縮」をかけ、「添付ファイル」として処理するようにしてください。
【圧縮】
●インターネットは、デスクトップでお使いのパソコンに比べ、処理速度が極度に遅いメディアです。ファイルを圧縮しておけば、送信時間が短縮でき、電話料金などのコストも軽減できます。
●ファイルの圧縮には、専用のソフトが必要です。また、圧縮されたファイルの解凍(復元)にも専用のソフトが必要です。WindowsではWinZip(シェアウェア)を使って「ZIP形式」に圧縮するか、LHA(フリーウェア)を使って「LHA形式」に圧縮するのが一般的です。(ZIP形式、LHA形式に圧縮するソフトは、この他にも多くの種類があります。)青空文庫の呼びかけ人にはMacintoshユーザーもおりますが、Macintoshではどちらの方式にも対応できます(ただし、LHAは「lh5」形式まで)ので、使い慣れた圧縮方式を使ってください。
【ファイル添付】
●インターネット・メールで送信できるのは、「テキスト・データ」だけです。そこで、画像などのバイナリー・データを送信する際には、ファイルを「特殊なテキスト・ファイルに変換して、メールに添付する」必要があります。このような変換を「エンコード」、変換されたファイルを元に戻すことを「デコード」といいます。
●入力ずみのテキスト・ファイルは、エンコードなしでそのまま添付できますし、メールの本文にコピー&ペーストで組み込むこともできます。しかしながら、メール本文に組み込まれたテキストには、1行1行に強制的に改行コードが付加されてしまいます。また、添付されたテキスト・ファイルは、メール・ソフトによっては、受信の際に自動的に本文に組み込まれてしまいます。圧縮→添付という方法で処理すれば、このようなトラブルを防ぐことができます。
●エンコードは、Windowsの標準であるBase64を指定してください。
●この項でご紹介したフリーウェアやシェアウェアは、パソコン雑誌の付録CD-ROMで入手できます。また、最新版は下記のウェブサイトからダウンロードできます。
◆WinZip=http://www.winzip.com/
◆LHAおよび各種=http://www.forest.impress.co.jp/(窓の杜)、http://www.vector.co.jp/(Vector)
【底本の用意】
●送信していただいたテキスト・ファイルは、校正担当の呼びかけ人もしくは工作員の方のところへとまわされ、校正作業に移ります。このとき、当然ながら入力に使用された底本が必要になります。
●現在は、入手が容易であれば、同じ書籍の一番新しい版を購入するようにしています。しかしながら、ときには絶版・品切れのため、古書店などをまわっても入手が不可能な場合があります。そのため、底本もしくはそのコピーを送付していただく必要が出るかもしれません。ご協力をお願いします。



「校正」へ|◆作業マニュアル目次へ