Sv─¢t hardware Sv─¢t PDA DigiManie Sv─¢t s├¡t├¡  
vyhledávání
separator separator

Nově v diskusích

Re: 25-30fps nehratelne ? (dnes 10:28)

No, televize m├í si­ce 25 "fps" - ale­ prokl├ídan─¢, co┼╛ ve­ v├╜sledku pohyb sku­te─ìn─¢ "rozplizne­" (nesn├í┼í├¡m

Re: Pnp (dnes 10:27)

Tak bohuzel - vse­chno je jinak :-(. Ma­ teorie pada. S ji­nym zdrojem je na­ PCI karte +11.98V a­le chov

pasiv (dnes 10:18)

a co ti brani tam ho­dit nejaky pasiv? na­pr. Zalman ma ce­lkom dobre. mozno­ bude stacit ked le­n povodn

Re: 25-30fps nehratelne ? (dnes 10:16)

Uz vidim jak pozna­te rozdil mezi 25 ci­ 50 FPS ... poku­d tech 25FPS neni­ prumer. Jinak po­kud budu hra

Rozdiely (dnes 10:13)

clanok je podla mna­ v pohode, ale mu­sim povedat, ze tych hla­vnych rozdielov a­ko otocenie pati­ce pre


ATi Radeon X800 - grafická (r)evoluce - Pixel shader

ATi Radeon X800 - grafická (r)evoluce - Pixel shader

(Zdeněk Kabát, 10.5.2004, zpráva)


─ì├ísti ─ìl├ínku 
Doporu─ìit ─ìl├ínek  Tisknout ─ìl├ínek

Pixel shader
Jako vždy se nejdříve podívejme na schéma celého pixel shaderu. Radeon X800 obsahuje dvojici výpočetních jednotek v každé pipeline, což znamená celkem 32 ALU, k čemuž musíme ještě přičíst dalších 16 texturovacích jednotek.


Obr. 8 ΓÇô Detail pixel shaderu

Celkem tedy R420 obsahuje 2 vektorové, 2 skalární a jednu texturovací ALU, tedy stejně jako u R300. Obě ALU jednotky jsou schopné pracovat buď zvlášť, nebo společně, což znamená, že v nejlepším případě je zpracováno 5 operací za cykl (dvě Vect-3, dvě skalární a jedna s texturou). Vektorová ALU je zde složena jen ze tří komponentů, takže pokud je třeba provést 4-složkovou operaci (Vect-4), je nutné zapojit i druhou ALU.

Pokud srovnáme toho jádro s GeForce 6800, najdeme několik rozdílů. nVidia má obě jednotky rozděleny na 4 komponenty, takže může provádět různé množství operací (Vect-3 + skalární nebo Vect-4 jako u ATi). Protože ale nemá pevně danou vektorovou a skalární část, může NV40 také provádět současně dvě Vect-2 operace nebo dokonce čtyři skalární. Problém nVidie tkví ale v tom, že pro operace s texturami je využita celá první jednotka, zatímco ATi obsahuje vlastní a plně samostatnou texturovací jednotku.


Obr. 9 – Možnost rozdělení operací mezi vektorovou a skalární jednotku

To se posléze projevuje v určitých kódech. Zatímco ATi může provádět operace s texturou paralelně s výpočty ve vektorové a skalární ALU, nVidia musí obětovat velkou část výkonu celého shaderu a pro výpočty jí zůstane jen jedna ALU. Od toho se pak odvíjí závislost na kódu a výhody R420 v některých programech. Obecně lze říci, že kód, který obsahuje zároveň matematické operace a zároveň texturovací, bude prospívat Radeonu X800 více než GeForce 6800.

Pixel shadery R420 obsahují ale i další změny. Počet dočasných registrů byl rozšířen z 12 na 32 a navíc byly přidány tzv. „facing“ registry. Do těchto registrů se ukládá informace o tom, zda polygon směřuje („čelí“) k místu pozorovatele nebo od něj. Toho budou moct využít programátoři v případě, že budou chtít použít jiné osvětlení pro polygony natočené k pozorovateli přední a zadní částí.

Zásadně byl také rozšířen počet maximálních možných instrukcí v jednom pixel shaderu. Z původních 160 byl nyní rozšířen na 512 pro každou ALU (vektorovou, skalární a texturovou), takže celkem lze provést až 1536 instrukcí. Jistého vylepšení se dočkal také F-Buffer. Jedná se o jakousi vyrovnávací paměť, do které je ještě uvnitř shaderu ukládán pixel, na kterém bude třeba provést další operace. Není tak nutné pixel posílat do frame bufferu a znovu zpátky skrz celou pipeline.

Radeon X800 stále využívá 24-bitovou přesnost (fp24), což mu dává jistou výhodu oproti nVidii. GeForce 6800 potřebuje se svou fp32 provést cca o 25% více práce, což má za následek pokles výkonu oproti ATi. Protože se navíc ATi rozhodlo nepřecházet na Shader Model 3.0, nepotřebuje fp32 implementovat. Zde je tabulka rozdílů mezi jednotlivými verzemi Pixel Shaderu:


PS 2.0
PS 2.0a
PS 2.0b
PS 3.0
Dependant Texture Limit
4
No Limit
4
No Limit
Texture Instruction Limit
32
Unlimited
Unlimited
Unlimited
Position Register
-
-
-
x
Instruction Slots
32 + 64
512
512
>= 512
Executed Instructions
32 + 64
512
512
>=65535
Interpolated Registers
2 + 8
2 + 8
2 + 8
10
Instruction Predication
-
x
-
x
Index Input Registers
-
-
-
x
Temp Registers
12
22
32
32
Constant Registers
32
32
32
224
Arbitrary Swizzling
-
x
-
x
Gradient Instructions
-
x
-
x
Loop Count Register
-
-
-
x
Face Register (2-sided Lighting)
-
-
-
x
Dynamic Flow Control
-
-
-
24
Tab. 2 – Jednotlivé verze Pixel Shaderu dle specifikace DirectX 9

Radeon X800 se drží specifikace 2.0b a navíc přidává facing registry, zatímco GeForce 6800 obsahuje plnou podporu PS 3.0. Uvidíme, jestli se tento handicap projeví v budoucnu.


 Pr┼»m─¢r 1.24
nejnej
hodnoceni
stupnice
  Hodnotilo 17 ─ìten├í┼Ö┼»  
1 2 3 4 5  

Další články na podobné téma

Diskuzní příspěvky
 Omluva┼át─¢p├ín Mr├ízek11.5.2004  9:03:34
 well..danno11.5.2004  14:32:35
 rubydanno11.5.2004  14:36:24
 dalsi smejd od ATIavakar11.5.2004  16:18:40
+ Re: dalsi smejd od ATIPrcek11.5.2004  18:13:11
++ Re: dalsi smejd od ATIavakar11.5.2004  18:25:36
++ Re: dalsi smejd od ATIPedro.A12.5.2004  10:58:54
++ Re: dalsi smejd od ATIMaYo312.5.2004  16:02:22
++ Re: dalsi smejd od ATIjuja14.5.2004  4:08:18
+ Re: dalsi smejd od ATIirian11.5.2004  21:18:58
+ Re: dalsi smejd od ATIdanno12.5.2004  8:50:41
+ Re: dalsi smejd od ATIxBl4d3x13.5.2004  0:06:16
+ Re: dalsi smejd od ATIRadka13.5.2004  12:19:19
+ Re: dalsi smejd od ATIRadka13.5.2004  14:47:45
 Je┼╛kovi o─ìi zase flame...starmen11.5.2004  23:50:33
+ Re: Je┼╛kovi o─ìi zase flame...Zden─¢k Kab├ít12.5.2004  7:10:35
+ Re: D─¢kujistarmen12.5.2004  9:06:33
 Radeon X800 - super!Watcher12.5.2004  15:56:14
 ceny?TRTL13.5.2004  4:24:54
 ATi coolCreatorr13.5.2004  13:14:38
+ Re: ATi cool[aMd]Mica13.5.2004  15:22:39
+ Re: ATi coolCreatorr14.5.2004  11:25:18
 skutecna flame war :-)Zden─¢k Kab├ít13.5.2004  18:52:01
+ Re: skutecna flame war :-)Elefant14.5.2004  10:19:14
 mal├í pozn├ímka na trochu jin├⌐ t├⌐maBorg14.5.2004  20:03:10
 Nen├¡ v┼íe tak jednozna─ìn├⌐.Begomot17.5.2004  12:42:18
+ Re: Nen├¡ v┼íe tak jednozna─ìn├⌐.starmen17.5.2004  14:53:40
++ Re: Nen├¡ v┼íe tak jednozna─ìn├⌐.Borg18.5.2004  22:51:18
+ Re: Nen├¡ v┼íe tak jednozna─ìn├⌐.Borg18.5.2004  22:35:33
      

ISSN 1213-0818    © 1998-2004 ProMON spol. s r.o.
Tento server dodržuje právní předpisy o ochraně osobních údajů. Používáme redakční systém oXyMEDIA.