pl.comp.www FAQ | ||||
---|---|---|---|---|
Następny | Następny rozdział | Rozdział 5. ,,Tkanie pajęczyny'' | Poprzedni rozdział | Poprzedni |
W jaki sposób mogę tworzyć poprawne strony z polskimi znakami diakrytycznymi?
Przede wszystkim należy używać 8 bitowego kodowania w ISO-8859-2 (na podstawie punktu 3. RFC 2047 --- ``Internationalization of the Hypertext Markup Language'') Jeśli masz większe potrzeby niż może Ci zaoferować ISO-8859-x i MIME rozwiązaniem może być UNICODE (a zwłaszcza jego ośmiobitowe kodowanie --- UTF-8). Poza tym jeśli nie jesteś administratorem (oraz masz ograniczony dostęp do opcji konfiguracyjnych serwera --- np. w postaci .htaccsess na Apache --- i nie możesz spowodować, żeby serwer dodawał do nagłówka stron z polskimi literami deklaracji typu dokumentu: Content-Type: text/html; charset=iso-8859-2 należy dodać w nagłówku strony (pomiędzy <HEAD> i </HEAD>, a w miarę możliwości przed <TITLE>) następującą instrukcję: <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-8859-2"> Nie jest to rozwiązanie najbardziej eleganckie: powoduje (na niektórych serwerach i z niektórymi przeglądarkami (np. stary Netscape Navigator ) dwukrotne interpretowanie zawartości dokumentu, nie jest w pełni uwzględnione w specyfikacji HTML. Tym nie mniej dopóki nie doczekamy się (bądź, sami nie przyczynimy się ;-) do uznania przez grona normalizacyjne i producentów oprogramowania faktu, że w WWW stosuje się i inne, poza anglosaskim zestawy znaków, pozostaje nam stosowanie półśrodków. Jeśli używasz już HTML 4.0. warto abyś do znaczników
<HTML>i
<Body>dodał atrybut LANG="pl" --- nie jest on jeszcze szeroko wykorzystywany, ale czas najwyższy by zacząć go używać dla odróżniania dokumentów w różnych językach.
Osobną sprawą jest udostępnianie dokumentów wielojęzycznych. W takich wypadkach należy dobrać najmniejszy z zestawów znaków obejmujących docelowe potrzeby... Np. w wypadku języka polskiego i niemieckiego będzie to ISO-8859-2 (ew. z SGML ISO-Latin-1 entitles), zaś w wypadku Cyrylicy będzie to (niestety) Unicode (tu zalecałbym stosowanie kodowania UTF-8).
Patrz też:.
Następny | Spis treści | Poprzedni |
Terminologia | Początek rozdziału | Formaty publikowanych danych |