Dione
Z. KotalaP. Toman: Java
Predchozi (Obsah) Dalsi

C. Unicode

Unicode je ╣estnßctibitov² systΘm k≤dovßnφ znak∙, kter² je urΦen pro v²m∞nu, zpracovßnφ a zobrazenφ textu v r∙zn²ch souΦasn²ch a historick²ch jazycφch. Toto k≤dovßnφ zavedlo Unicode Consorcium a nadßle ho vyvφjφ. V souΦasnΘ dob∞ je k dispozici verze 2.0, kterß je podporovanß i v Jav∞. Unicode je skoro shodn² s normou ISO 10646, kterß jej p°ejala.

K≤dovßnφ znak∙ \u0020 a╛ \u007E je stejnΘ jako v ASCII. Rovn∞╛ znaky \u00A0 a╛ \u00FF odpovφdajφ ASCII k≤dovßnφ. To je v²hodnΘ pro konverzi text∙ z k≤dovßnφ Latin-1 do Unicode a naopak. P°evod mezi jin²m k≤dovßnφm je v╣ak pon∞kud komplikovan∞j╣φ, co╛ je malß nev²hoda.

Druhou a to hlavnφ nev²hodou je malß podpora Unicode v souΦasn²ch operaΦnφch systΘmech. To je zap°φΦin∞no velkou datovou nßroΦnostφ text∙ (jsou dvakrßt del╣φ), ale hlavn∞ font∙, kterΘ by m∞ly obsahovat p°es 30 000 znak∙.

Bli╛╣φ a aktußlnφ informace lze nalΘzt na [WWW17].

C.1. UTF-8

Jeliko╛ je podpora Unicode zatφm velmi malß a je zapot°ebφ zajistit p°enos t∞chto znak∙ mezi platformami, byla vyvinuta k≤dovßnφ pro p°enos na systΘmech, kterΘ podporujφ jen osmibitovΘ k≤dovßnφ znak∙ (ASCII).

Java nabφzφ podporu k≤dovßnφ UTF-8, co╛ je k≤d s prom∞nnou ╣φ°kou znaΦky - jeden znak m∙╛e b²t k≤dovßn jedno-, dvou- nebo t°φ-bytov∞. JednoznaΦnost k≤du umo╛≥uje p°esn∞ stanovit zaΦßtek znaku, co╛ je v²hoda p°i obnov∞ po╣kozenΘho souboru. Princip k≤dovßnφ shrnuje nßsledujφcφ tabulka:

Znaky Bit∙ K≤dovßnφ
0000-007F 7 0xxxxxxx
0080-07FF 11 110xxxxx 10xxxxxx
0800-FFFF 16 1110xxxx 10xxxxxx 10xxxxxx

C.2. AkcentovanΘ znaky v Unicode

V tabulce je zobrazeno k≤dovßnφ n∞kter²ch znak∙ v Unicode.

Unicode Znak
0x00C1
0x00C2 ^A
0x00C4
0x00E1 ß
0x00E2 ^a
0x00E4 Σ
0x00DF B (ostrΘ s)
0x010C
0x010D Φ
0x010E
0x010F
0x00C9
0x00CB "E
Unicode Znak
0x011A
0x00E9 Θ
0x00EB "e
0x011B
0x00CD
0x00CE ^I
0x00ED φ
0x00EE ^i
0x013D
0x013E σ
0x0147
0x0148
0x00D3
Unicode Znak
0x00D4
0x00D6
0x00F3
0x00F4
0x00F6 ÷
0x0154
0x0158
0x0155 α
0x0159 °
0x0160
0x0161
0x0164 ½
0x0165
Unicode Znak
0x016E
0x00DA
0x00DC
0x016F
0x00FA ·
0x00FC
0x00DD
0x00FD ²
0x017D «
0x017E


Predchozi
Converted by Selathco v0.9 on 25.09.1999 19:46
Dalsi