taka jedna reklama

Po co ogonki?

C≤┐, esperanto siΩ nie przyjΩ│o i ludzie m≤wi▒ i pisz▒ w r≤┐nych jΩzykach. A r≤┐ne jΩzyki to nie tylko r≤┐ne gramatyki i s│ownictwo, ale tak┐e r≤┐ne alfabety. Niemcy maj▒ swoje umlauty, inne nacje jeszcze co╢ innego, a my "ogonki" - dodatkowe znaki alfabetu, wyra┐aj▒ce takie dzwiΩki jak "▒" czy "│". W sumie, we wsp≤│czesnym jΩzyku polskim wystΩpuje 9x2 dodatkowych (w stosunku do alfabetu │aci±skiego) znak≤w:

▒µΩ│±╢≤╝┐í╞╩ú╤ª╙¼»

Okaza│o siΩ niestety, ┐e te g│upie 18 znaczk≤w potrafi narobiµ ca│kiem niez│ego zamieszania, gdy przychodzi do pisania po polsku na komputerze. Dlaczego? Proste - najwiΩkszym rynkiem komputerowym jest rynek ameryka±ski a tam siΩ po polsku nie pisze.

W sytuacji gdy np. programy poczty elektronicznej nie posiada│y polskich liter, ludzie po prostu "jako╢" sobie radzili. Mozna bylo pisac nie uzywajac polskich liter - na og≤│ dawa│o to zadowalaj▒ce efekty, choµ w takich s│owach jak "┐▒danie" trzeba sobie by│o radziµ w spos≤b bardziej wyuzdany, tj. specjalnie oznaczaµ polskie literki - zwykle pisz▒c: \z\adanie albo z~a~danie.

Nie czarujmy siΩ - takie rozwi▒zanie by│o mo┐e do przyjΩcia na listach technicznych czy naukowych, gdzie i tak dominuje ┐argon, ale gdzie indziej jest zwyczajnie ra┐▒ce. To podobnie jak z ortografi▒ - niby nie jest to takie kluczowe, ale spr≤bujcie np. napisaµ reklamΩ waszych us│≤g, gdzie bΩdziecie zachwalaµ swoje d≤rze umiejΩtno╢ci, to zobaczycie jak to zostanie potraktowane. Po prostu jako niechlujstwo i lekcewa┐enie adresata. I podobnie bΩdzie z tekstem bez polskich liter.

(Pojawi│y siΩ te┐ g│osy by "upraszczaµ" jΩzyk polski, ale to oczywi╢cie raczej tylko temat do ┐art≤w).

Kodowania

SprzΩt komputerowy stawa│ siΩ coraz doskonalszy i choµ nadal na og≤│ oprogramowanie nie uzglΩdnia│o polskiej specyfiki, to jednak polskie litery coraz czΩ╢ciej dawa│y siΩ uzyskaµ, metodami mniej lub bardziej "radosnymi".

Przy bajtowym zapisie ka┐dego znaku oko│o setki kod≤w (z 256 mo┐liwych) by│o w praktyce do wykorzystania - wielcy producenci co╢ tam ju┐ powstawiali (np. znaki do rysowania ramek czy niemieckie umlauty), ale nie wszystkie te znaki by│y niezbΩdnie konieczne - mo┐na je by│o podmieniµ polskimi literami. Tylko kt≤re?

Na to pytanie odpowiedziano na oko│o 20 sposob≤w plus mutacje zwi▒zane ze specyfik▒ r≤┐nych program≤w (np. program Ventura znak o kodzie 158 traktuje specjalnie, wiΩc kod Mazovia u┐ywaj▒cy tego znaku nie w pe│ni siΩ nadawa│ - u┐ywano Mazovii "odrobinkΩ poprawionej").

Wszystkie te "spolszczania" program≤w by│y wykonywane po to ┐eby jaki╢ program zadzia│a│ a nie po to ┐eby tworzyµ standardy - chaos zrobi│ siΩ straszliwy. Przez chwilΩ pr≤bowano lansowaµ kod Mazovii jako "standard faktyczny" (istotnie bardzo wiele drukarek i monitor≤w Hercules mia│o ten zestaw znak≤w), ale wtedy przyszed│ Microsoft z IBM-em i wprowadzili nam kolejny "standard" - CP852. Potem Microsoft siΩ rozmy╢li│ i do polskich MS Windows wprowadzi│ CP1250. I teoretycznie takie jest teraz stanowisko Microsoftu - w Polsce i innych krajach Europy ªrodkowej ma byµ u┐ywane CP1250.

Polska Norma

A co na to wielce szanowne grona normalizacyjne? Ano przede wszystkim nie ╢pieszy│y siΩ - gdy w ko±cu ustalono Polsk▒ NormΩ, to wed│ug wielu ju┐ by│o zbyt p≤╝no na prze│amanie dominacji Microsoftu. Tym bardziej, ┐e pozornie wygl▒da│o na to, ┐e szanowne gremium sprawi│o nam kolejny "standard".

Nie by│o to wcale jednak takie g│upie - Polska Norma zosta│a ustalona jako zgodna ze standardem miΩdzynarodowym: ISO-8859-2. To, jakie to wa┐ne, zobaczyli╢my dopiero, gdy pojawi│ siΩ:

Internet

Pocz▒tkowo polski Internet by│ domen▒ jΩzyka "polskawego", ale wraz z upowszechnieniem siΩ WWW a z nim ╢rodowiska graficznego, stosowanie polskich liter sta│o siΩ powszechne. I tu niespodzianka - okaza│o siΩ, ┐e do Internetu wcale nie musi siΩ przenosiµ problem mnogo╢ci "standard≤w". Bo w Internecie ten problem jest rozwi▒zany - standard ISO-8859-2 jest stary i co wa┐ne: uznawany przez najr≤┐niejsze programy i us│ugi sieciowe. I to w│a╢nie ten standard wybrano nam na Polsk▒ NormΩ.

Co to znaczy uznawany przez us│ugi sieciowe? Ot≤┐ chodzi o to, ┐e Internet jako sieµ miΩdzynarodowa musia│ wykszta│ciµ mechanizmy na wsp≤│istnienie w sieci r≤┐nych jΩzyk≤w. Rozwi▒zano to tak, ┐e ustandaryzowano tzw. nag│≤wki dokument≤w (WWW, listy e-mail, itp.), w kt≤rych mo┐na zapisaµ miΩdzy innymi, w jakim jΩzyku/alfabecie jest zapisany w│a╢ciwy tekst. To tzw. MIME.

DziΩki tym nag│≤wkom programy internetowe wiedz▒ z jakim tekstem maj▒ do czynienia i mog▒ dostosowaµ do tego swe dzia│anie. Je╢li np. jaki╢ Polak w Urugwaju dostanie list z polskimi literami, ale z poprawnymi nag│≤wkami MIME, to mo┐e przeczyta go nawet gdy nie ma u siebie polskich czcionek (font≤w) - po prostu dobry program obs│uguj▒cy MIME mu to przekoduje.

Dla stron WWW dostosowanie siΩ do standard≤w MIME zwykle oznacza konieczno╢µ dopisania do dokumentu specjalnych 3 linijek.

Microsoft

PiΩknie. A co na to Microsoft? Hmm. Podszed│ do tego ambiwalentnie - z jednej strony w swoich programach wprowadzi│ obs│ugΩ standardu, ale z drugiej strony ci▒gle wygl▒da, ┐e z uporem godnym lepszej sprawy lansuje swoje CP1250.

Sytuacja jest do╢µ dziwna - z jednej strony Microsoft zapytany wprost, przyznaje ┐e standardem jest ISO 8859-2 i faktycznie internetowe programy Microsoftu wspomagaj▒ ten standard. Z drugiej strony jednak stanowisko to nie jest zbyt jasno przedstawione u┐ytkownikom tych┐e program≤w - wydaje siΩ, ┐e Microsoftowi wcale na tym nie zale┐y - ┐e wrΩcz chcia│by by powstawa│y np. wadliwe strony WWW - takie kt≤re da siΩ czytaµ jedynie przy u┐yciu oprogramowania pod MS Windows. C≤┐.

Ale tego typu problemy marketingowe du┐ych firm Ciebie nie musz▒ obchodziµ: je╢li jaki╢ program internetowy Microsoftu czy jakiejkolwiek innej firmy nie uwzglΩdnia standardu, albo upiera siΩ przy wysy│aniu w sieµ CP1250 (np. serwer WWW czy program pocztowy), to zwr≤µ go sprzedawcy jako produkt nie nadaj▒cy siΩ do u┐ytku - jak poszukasz, to znajdziesz podobny program konkurencji, kt≤ry bΩdzie dzia│a│ dobrze. NaprawdΩ!

WszΩdzie ogonki!

Ostatni▒ ostoj▒ jΩzyka "polskawego" by│a do niedawna poczta elektroniczna i UseNet (news-y) - zbyt wiele os≤b u┐ywa│o przestarza│ych program≤w nie obs│uguj▒cych MIME i ogonki by│y dla nich zwyczajnie nieczytelne.

Prze│om nast▒pi│ w lecie 1996. Stopniowo coraz wiΩksza czΩ╢µ u┐ytkownik≤w przestawia│a siΩ na programy u┐ywaj▒ce MIME. Nowe wersje program≤w Netscape i Microsoftu r≤wnie┐ w pe│ni radz▒ sobie z MIME. I w tej sytuacji apel jednego z u┐ytkownik≤w polskiego UseNetu o powszechne stosowanie polskich znak≤w spotka│ siΩ z akceptacj▒ - nieomal┐e z dnia na dzie± wiΩkszo╢µ zaczΩ│a pisaµ z ogonkami. Oczywi╢cie dla niekt≤rych by│ to problem, ale dostosowali siΩ - teraz na polskich newsach pisze siΩ po polsku!

Dla poczty elektronicznej (e-mail) nie ma tak │atwo - ci▒gle wszystko zale┐y od tego z kim siΩ rozmawia. Ale w zasadzie mo┐na przyj▒µ, ┐e domy╢lnie pisze siΩ po polsku, a na "polskawy" przerzuca siΩ dopiero na wyra╝ne ┐yczenie rozm≤wcy. Po prostu je╢li piszesz do kogo╢ bez polskich liter, to mo┐e to zostaµ odebrane jako objaw lekcewa┐enia (podobnie jak b│Ωdy ortograficzne).

Unikod

WiΩkszo╢µ problem≤w ze znakami narodowymi by│aby do unikniΩcia, gdyby znaki zapisywaµ nie na jednym ale na dwu bajtach - dostΩpnych znak≤w wtedy by│oby nie 256 ale ca│e mn≤stwo. To w│a╢nie jest Unikod (Unicode). A w│a╢ciwie bΩdzie. Ju┐ poma│u mo┐na go w zasadzie zacz▒µ u┐ywaµ - szczeg≤│y tutaj.

Unikod jest niezast▒piony dla kodowania tekst≤w wielojΩzycznych, ale warto by go stosowaµ tak┐e dla tekst≤w polskich. Na pocz▒tek proponujΩ by dla serwer≤w WWW by│o sprawdzane czy client obs│uguje Unikod (podaje to w ┐▒daniu dostΩpu) - je╢li tak, to daµ mu Unikod zamiast ISO-8859-2. Chwilowo chyba na cokowiek innego jest jeszcze za wcze╢nie - zbyt ma│o program≤w (w zasadzie tylko najnowsze przegl▒darki WWW) obs│uguje Unikod.


A jak te ogonki uzyskaµ?

Aaa, faktycznie. Mi│o mi, ┐e dotrwa│e╢ przy moim opowiadaniu a┐ dot▒d, ale przecie┐ Ty tu przyszed│e╢ nie po to by czytaµ moje wypociny, ale by siΩ dowiedzieµ, jak ogonki uzyskaµ na swoim komputerze.

A to w│a╢nie opisuje reszta strony ogonkowej - wybierz rodzaj systemu jaki CiΩ interesuje (pod jakim pracuje Tw≤j komputer) i tam znajdziesz opisy jak skonfigurowaµ lub jakich program≤w u┐yµ dla Twoich potrzeb.

A je╢li nie znajdziesz tego, co CiΩ interesuje? C≤┐ - ta strona powstaje na bie┐▒co dziΩki informacjom od u┐ytkownik≤w - napisz do mnie - mo┐e jednak opis jest, tylko masz problem ze znalezieniem, a je╢li nie, to mo┐e akurat Ty spr≤bujesz znale╝µ rozwi▒zanie i opiszesz je na stronie ogonkowej?

Powodzenia!


Jaros│aw Strza│kowski, Sierpie± 1996.