TeX i ogonki...

czyli jedynie s│uszne ogonki w TeX-u


Ze swej strony uwa┐am, ┐e temat ten nale┐y o tyle poszerzyµ, by nie zacie╢niaµ swojego widoku na sprawy TeX-owe li tylko do kwesti ogonk≤w --- proponujΩ przygl▒dn▒µ siΩ zjawisku ,,TeX a Sprawa Polska''.



Opr≤cz ,,wrodzonej'' wiedzy typograficznej i drukarskiej, jak▒ Ojciec Knuth wpakowa│ w ,,bebchy'' TeX-a, daje on pe│n▒ swobodΩ w dostosowaniu go do lokalnych potrzeb, czy to jΩzykowych, czy te┐ typograficznych. Nie jestem odosobniony w twierdzeniu, ┐e TeX najlepiej ze wszystkich dostΩpnych w naszym kraju program≤w, przystosowany zosta│ do pisania tekst≤w w jΩzyku polskim. Niebagatelne zas│ugi na tym polu nale┐y przypisaµ autorom pakietu MeX: Bogus│awowi Jackowskiemu i Markowi Ryµko. MeX jest adaptacj▒ format≤w PLAIN i LaTeX do sk│adu w jΩzyku polskim z uwzglΩdnieniem polskich zwyczaj≤w drukarskich. Przewag▒ tego pakietu nad innymi, dotychczas stosowanymi, jest niezaprzeczalny fakt wyj▒tkowo starannego (jak na TeX-a przysta│o) opracowania problemu od samego pocz▒tku.

Spolszczenie programu nie polega li tylko na mniej lub bardziej przypadkowym przyklejeniu protezy ogonka w pewnym miejscu litery alfabetu │aci±skiego. Typowym przyk│adem takiego podej╢cia ,,po polsku'' do TeX-a, jest wspomniana metoda historyczna uzyskiwania polskich znak≤w, tu i ≤wdzie nazwywana do╢µ adekwatnie do rezultat≤w --- TeX-ochida. Wykorzystuje ona TeX-owe mechanizmy budowy znak≤w akcentowanych: doklejanie znaku akcentu, kropki lub ogonka (cedilla) do odpowiedniej litery. Pomimo swojego ,,ochidego'' wygl▒du, tego typu teksty masowo s▒ jeszcze tworzone przez pewne ,,nierefolmowalne'' jednostki, a nawet... akceptowane przez niekt≤re wydawnictwa!

Stworzony przez tandem Jackowski & Ryµko pakiet MeX zawiera:

Szczeg≤│owy opis pakietu zawiera plik mexinfo.pl (mexinfo.eng) --- bΩd▒cy w standardowej dystrybucji pakietu. Pakiet dostΩpny jest na wiΩkszo╢ci serwer≤w zawiaraj▒cych oprogramowanie TeX-owe, np.: ( ftp.gust.org.pl/TeX/language/polish/).


Przystosowanie TeX-a do pisania ,,po polsku''

1. Instalacja format≤w MeX i LaMeX

Do rozpoczΩcia pracy z polsk▒ wersj▒ format≤w PLAIN oraz LaTeX niezbΩdne jest utworzenie za pomoc▒ wersji inicjalizacyjnej programu TeX (iniTeX) plik≤w mex.fmt i lamex.fmt i umieszczenie ich w odpowiednim katalogu, zale┐nym od u┐ywanego systemu operacyjnego i od implementacji TeX-a. Plik *.fmt jest to plik binarny, zawieraj▒cy skondensowane do postaci bezpo╢rednio zrozumia│ej dla kompilatora TeX-a, makra oraz regu│y przenoszenia wyraz≤w.

Do utworzenia tych format≤w nale┐y:

,,Zdobycie'' *.tfm-≤w polega na ╢ci▒gniΩciu z odpowiedniego miejsca pliku (np. ftp.gust.org.pl/TeX/language/polish)

Przed utworzeniem plik≤w MEX.FMT i LAMEX.FMT u┐ytkownik powinien przygotowaµ w miejscu dostΩpnym dla TeX-a, np. w bie┐▒cym katalogu, zestaw plik≤w ╝r≤d│owych:

  mex.tex,
  lamex.tex,
  mex1.tex,
  mex2.tex,
  mexconf.tex,
  plhyph.tex

oraz ╝r≤d│owe wersje oryginalnych format≤w angielskojΩzycznych przystosowanych do TeX-a 3.x, tj.:

  plain.tex,
  latex.tex,
  lplain.tex,
  lfonts.tex,
  hyphen.tex.

Pliki PLAIN.TEX i LFONTS.TEX zawieraj▒ miΩdzy innymi listΩ font≤w wykorzystywanych przez angielskojΩzyczne wersje format≤w PLAIN i LaTeX. W typowych wersjach plik≤w PLAIN.TEX i LFONTS.TEX wiΩkszo╢µ font≤w ma nazwy rozpoczynaj▒cych siΩ od ,,cm''. W czasie generacji plik≤w MEX.FMT i LAMEX.FMT przedrostek ,,cm'' zamieniany jest automatyczne na ,,pl'' -- nie myliµ z ,,p1'' -- i do plik≤w FMT s▒ wbudowywane informacje o fontach PL. Plik≤w z fontami CM mo┐e w tym czasie w og≤le nie byµ w pamiΩci.

Spos≤b generowania plik≤w FMT zale┐y od systemu operacyjnego i od implementacji TeX-a.

WiΩkszo╢µ najnowszych implementacji TeX-a, w tym emTeX (Eberhard Mattess production), ma mo┐liwo╢µ automatycznej zamiany kod≤w znak≤w czytanych z pliku na kody wewnΩtrzne TeX-a. Pozwala to na wykorzystanie pe│ni mo┐liwo╢ci TeX-a przy jednoczesnym uniezale┐nieniu siΩ od sposobu kodowania polskich liter w danej instalacji komputera.

W pakiecie MeX znajduj▒ siΩ pliki wsadowe (ang. batch files) s│u┐▒ce do generowania plik≤w FMT pod kontrol▒ systemu operacyjnego MS-DOS przy u┐yciu emTeX-a (TEX186.EXE). Pliki te wykorzystuj▒ tabele konwersji zapisane w postaci ╝r≤d│owej w plikach MAZ2PL.PCT i LAT2PL.PCT, a w postaci przygotowanej do pracy z INITEX-em w plikach MAZ2PL.TCP i LAT2PL.TCP. Pliki *.TCP powstaj▒ z plik≤w *.PCT po wykonaniu komendy MK-TCP.BAT.

Je╢li u┐ytkownik wykorzystuje kodowanie polskich liter w systemie Mazovia, powinien utworzyµ pliki *.FMT za pomoc▒ komend GM-MEX.BAT (generowanie MEX.FMT) oraz GM-LAMEX.BAT (generowanie LAMEX.FMT); je╢li wykorzystuje kodowanie w systemie Latin 2 --- za pomoc▒ komend GL-MEX.BAT oraz GL-LAMEX.BAT; w ostatniej wersji dystrybucyjnej pakietu znajduje siΩ r≤wnie┐ zestaw plik≤w do generowanie formatu wykorzystuj▒cego formatowanie w systemie ISO Latin2.

Utworzone w ten spos≤b pliki FMT nale┐y przenie╢µ do odpowiednich kartotek: np. w standardowej dystrybucji emTeX-a s▒ to katalogi BTEXFMTS/TEXFMTS (w zale┐no╢ci od u┐ywanego komplilatora TeX-a) --- w instalacji ,,indywidualnej'' nale┐y te katalogi podaµ z pe│n▒ ╢cie┐k▒ dostΩpu w zmiennych systemowych BTEXFMT/TEXFMT.

Ten spos≤b polonizowania TeX-a, pozwala na pisanie tekstu ╝r≤d│owego z kodowaniem jakie aktualnie jest u┐ytkownikowi wygodniejsze w zastosowaniu --- utworzony format *.fmt rozpoznaje zakodowane w ten spos≤b polskie znaki narodowe i zamienia je na odpowiednie kody wewnΩtrzne odpowiadaj▒ce ich miejscu w pliku fontu.

Dodatkowym sposobem kodowania polskich znak≤w narodowych, jaki dodali autorzy pakietu MeX --- jest notacja slash-owa (,,ciachowa''). Polski znak reprezentowany jest przez parΩ znak≤w: slash-a oraz odpowiedniej litery alfabetu │aci±skiego. Ten spos≤b kodowania niejednokrotnie jest najw│a╢ciwszym sposobem u┐ywania polskich liter w plikach przenoszonych pomiΩdzy kilkoma r≤┐nymi systemami i instalacjami.

2. Polonizacja LaTeX2e.

W przypadku ,,wsp≤│czesnej'' wersji LaTeX-a (wersjΩ 2.09 uwa┐a siΩ obecnie za ,,gatunek gin▒cy'') --- reprezentacja lokalnych sposob≤w kodowania znak≤w, np. znak≤w narodowych, odbywa siΩ na poziomie odpowiednich pakiet≤w makr, i w wersji ,,ustandaryzowanej'' przekazywana jest formatowi latex2e a nastΩpnie kompilatorowi --- dok│adny opis tych mechanizm≤w znajduje siΩ w literaturze (np. LaTeX Companion).

Sk│ad w jΩzyku polskim dokonywany za pomoc▒ latex2e wspomagany jest przez pakiet Mariusza Olko ,,popolsku''. Zapewnia on (tu --- wyci▒g z dokumentacji pakietu):

Szczeg≤│y instalacji i budowy pakietu --- zainteresowani znajd▒ w pakiecie dystrybucyjnym popolsku.zip (np. ftp.gust.org.pl/TeX/language/polish/ )

UWAGA: Wymieniono tu tylko dwa podstawowe sposoby uzyskiwania polskich znak≤w diakrytycznych w dokumentach (La)TeX-owych --- pozosta│ych sposob≤w uzyskiwania polskich znak≤w ╢wiadomie nie podajΩ, uznaj▒c ww. za ,,jedynie s│uszne'' i jedyne (!!!) godne upowszechnienia w╢r≤d adept≤w TeX-owej sztuki...

3. ,,Indexowanie'' po polsku czyli Skorowidz

Podstawowym problemem przy tworzeniu skorowidz≤w i innego rodzaju alfabetycznych wykaz≤w, by│o do tej pory prawid│owe sortowanie uwzglΩdniaj▒ce zasady pisowni polskiej i dodatkowych regu│ (okre╢lonych w Polskich Normach) --- na szczΩ╢cie czasy te mamy ju┐ za sob▒, przynajmniej w TeX-u.

Do tworzenia skorowidz≤w publikacji sk│adanych TeX-em, s│u┐y program PLINDEX, autorstwa Bogus│awa Licho±skiego. Dystrybucja wraz z dodatkowym opisem (bardzo dok│adnym! po polsku!) znajduje siΩ w ftp.gust.org.pl/TeX/GUST/contrib/plindex/ .


Przygotowa│:
Jacek Kmiecik, 4.07.1996 r.