home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 4462 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  10.9 KB

  1. Path: informatik.tu-muenchen.de!fischerj
  2. From: fischerj@Informatik.TU-Muenchen.DE (Juergen "Rally" Fischer)
  3. Newsgroups: comp.sys.amiga.programmer
  4. Subject: Re: Amiga doesn`t need Pl
  5. Date: 25 Feb 1996 01:05:56 GMT
  6. Organization: Technische Universitaet Muenchen, Germany
  7. Distribution: world
  8. Message-ID: <4goclk$odk@sunsystem5.informatik.tu-muenchen.de>
  9. References: <john.hendrikx.4gpu@grafix.xs4all.nl>
  10. NNTP-Posting-Host: hphalle5.informatik.tu-muenchen.de
  11. X-Newsreader: TIN [version 1.2 PL2]
  12.  
  13. John Hendrikx (john.hendrikx@grafix.xs4all.nl) wrote:
  14. : In a message of 20 Feb 96 Juergen "rally" Fischer wrote to All:
  15.  
  16. :  >> > JrF> But when it comes to games, I say: AGA is still very usable today
  17.  
  18. :  >> >How can you say that?  What do you mean 'games'?  I think your definiti
  19.  
  20. :  JrF> DOOM. DESCENT. On a A1200 with megaturbo cpu, it'll run not much slower
  21. :  JrF> like on VLB + megaturbo cpu. Just because those games still need some
  22. :  JrF> frames even on a megaturbo.
  23.  
  24. : You're wrong.  On A1200 with mega-turbo you spend a *FIXED* amount of time
  25. really ? what is wrong ?
  26.  
  27. : doing 'copying' (C2P).  No matter how fast your CPU is this time is always
  28. : there, so if you use a 320x240 screen it will never go faster than a fixed FPS
  29. : rate even if your mapping stuff takes 0 cycles.  This gets far worse for
  30. : 640x480 screens (which is quite doable on a fast clone).
  31.  
  32. yes. so what ? lets assume a 320x160 screen running in 3 frames on a
  33. A1200 turbo. 16.6 fps that is. The copy part is about half a frame
  34. (assuming c2p is at about 6mb/sec. we're talking about fast cpus).
  35.  
  36. Now let's see what happens if copy is 4 times faster: 2.625 frames. 19fps.
  37.  
  38. wow. 19fps with a card at about 25mb/sec, 16.6 fps with AGA. so what ???
  39.  
  40. While 19fps IS smother, 16.6 fps is really not the "can't do DOOM"
  41. everyone is talking about! think about it.
  42.  
  43. This numeric example should make things clear.
  44.  
  45. Yes, if your cpu can do DOOM in 1 frame, AGA IS a brake.
  46. If your cpu rather does the speed of the given example, or even slower,
  47. then AGA is NOT "the big doom problem".
  48.  
  49. : The 'copying' loop simply doesn't exist on the clones, just paste it wherever
  50. well, doom runs well on my friends vlb, the 16bit vlb doing lot below
  51. 25mb/sec. See my example, makes things clear.
  52.  
  53. : You're thinking the wrong way, with megacpu you are actually likely to use LESS
  54. : frames, so the more important AGA bandwidth becomes.  Or maybe you didn't
  55.  
  56. yes. but megacpus are used to do more than doom today. doom is 486.
  57. a todays 1230 or 1240 should be able to do same (wasn't doom busy
  58. waiting for vblank bit? I think so!)
  59.  
  60. megacpu is rather descent or above, those canyon-racing-games. back
  61. at 3 frame animations again. AGA gets the big problem if you use the
  62. megacpu for rotzoom...
  63.  
  64. : notice that with TextDemo the time needed for C2P goes UP relatively on faster
  65. : CPU's?
  66. I guess the c2p doesn't run the possible 6mb/sec on A1200 ;)
  67. You must admit the problem is far less when using free c2p.
  68. Yes, it will go up for faster cpus.
  69.  
  70. :  JrF> You rely on _programming crap_ in combination with low cpu.
  71. : No, a game which is unplayable because it uses a fuzzy 2x2 160x120 display (or
  72. : less!) and jerks like hell is CRAP.
  73. fuzzy 2x2 due to low cpu, jerk due to low cpu. not AGA.
  74.  
  75. As I showed, 3 frame animations on A1200 are not that worse if running
  76. AGA instead on card. So if your game jerks, i.e. rather 6 frames, 
  77. it can't be AGAs fault _by definition_. see the values.
  78.  
  79. : There are limits to what a programmer will do to speed up his game.  Tricks
  80. : like Blitter assistance, BlitterScreen, Chunky Copper and so on all are
  81. : incredibly hard to implement or distort the display or limit your game in some
  82. : way:
  83. aaah, that's what you refer to. not 6mb/sec. 3mb/sec. or maybe 1mb/sec? :->>
  84. No wonder you tell it's not possible.
  85.  
  86. :  Blitter assistance: Requires non-interleaved bitmaps, impossible to
  87. that's no problem.
  88. :                      C2P a smaller part of the whole screen
  89. that's no problem concering games like doom.
  90.  
  91. :                      on factors like CPU, fast-memory, etcetera...
  92. The disadvantage is that you got to code more, right.
  93. no technical argument.
  94.  
  95. :                      Try to get it to work on Intuition-screen and make
  96. :                      your DOOM-clone support multiple window sizes.
  97. closescreen. openscreen.
  98.  
  99. :       Chunky Copper: Crappy resolution, wastes lots of ChipRAM bandwidth
  100. demo only.
  101.  
  102. :       BlitterScreen: Problems similair to Blitter assistance, but
  103. :                      additionally you will need to turn up the contrast
  104. :                      on your monitor, because the result of masking out
  105.  
  106. Wow that's the big problem ;) No user would accept putting up contrast,
  107. even if it was the only method to get games smooth ;)
  108. Ever seen a 1x1 blitterscreen ? ghost-look disappears!
  109.  
  110. The only true argument against: PAL/NTSC only, copper overtake.
  111. both no problem on A1200+1084, which should be 90% of all users.
  112.  
  113. No argument to not support also 4pass versions and writeparr8...
  114.  
  115. : Any idea of how much C2P routines you could end up with when your game is done?
  116. yes :)
  117.  
  118. :  Blitter+CPU C2P optimized for A1200 specifically
  119. :  Blitter+CPU C2P optimized for 16-bit ChipRAM machines (ECS)
  120. this is no argument. not only blitterscreen algos have to be
  121. changed for ECS, also the 4passers. really no argument.
  122. I wouldn't flame if there was only a AGA implementation of 3pass.
  123. On ECS, 4 pass should be faster anyway and blitter is relative more
  124. quick to fast->chip copy.
  125.  
  126. :  Blitter+CPU C2P optimized for 030 32-bit ChipRAM machines (4000/030)
  127. :  CPU C2P optimized for 040 16-bit ChipRAM machines (ECS + 040)
  128. dito.
  129. :  CPU C2P optimized for 040 32-bit ChipRAM machines (4000/040)
  130. this one exists.
  131.  
  132. you need cpu 1pass and maybe cpu 2passes. no cpu3passes needed for doom, 
  133. as those a cpu that can go beyond 25fps (the speed of blitter doing
  134. fullscreen 1x1 for the remaining pass if cpu2pass) is a 040 -> 040cpu
  135. 4pass.
  136.  
  137. I already got 1pass. still got 2pass to write, ludde is said to have it
  138. done free.
  139.  
  140. : and probably one which uses AKIKO, and of course for each of these routines a
  141. FORGET AKIKO.
  142.  
  143. : version which does 2x1 displays, and versions for 16, 64 and 256 colors. Maybe
  144. : also add ChunkyCopper and BlitterScreen C2P?  It looks like we've gone C2P
  145. FORGET COPPER.
  146.  
  147. blitterscreen is only nessesary for fast clones, otherwise use 4pass.
  148.  
  149. : crazy...
  150. Well, lot's of sources on aminet.
  151.  
  152. KEEP 6MB/sec and you get the specs I calculated!
  153.  
  154. : On top of that you will also want to support gfx-cards... and you need to write
  155. already running on intuition-screens, it should be not that problem
  156. to use writeparr8() ;)
  157.  
  158. : the rest of the game as well (but that's just a small part compared to all
  159. : those C2P routines).  Have we reached the programmer's limit yet?
  160.  
  161. what ? writing doom is a small part compared to c2p ?
  162. c2p is already written. doom not.
  163.  
  164. :  >> fully texturemapped/shaded games in two frames.
  165.  
  166. :  JrF> In two frames ? You must rely on a P133 system, with very good board &
  167.  
  168. : There is no Amiga with the same power as the P133.  And my 'average' (and 2
  169. : year old $100) VLB Gfx card handles 15 MB/sec easily, more than enough to do
  170. : 640x480 in 2 frames.
  171.  
  172. If 15mb/sec is more than enough to do 640x480 gfx, 6mb/sec surely are
  173. no problem doing 320x160 ;) you contradict yourself :)
  174.  
  175. :  >> > JrF> Later AGA+ having 10 planes etc, would be a nice thing, yes.
  176. :  JrF> 10bit is for example faster than 16bit, for your information.
  177.  
  178. : At what?  I bet it is slower than 16-bit for anything CPU calculated (ie,
  179. : gouraud polygons, tmapping, rotating, and so on).
  180.  
  181. why do you think he told "10 planes would be slow" ? Because he thought
  182. in AGA bandwidth. With enhanced bandwidth 10planes would be ok. For
  183. a wb-screen, see the flame about planar and 2d operations ;)
  184.  
  185. ok, 10 planes would need a faster cpu. Maybe one of the faster PPCs
  186. could do c2-10p in 15mb/sec ? :) If so this would outrule non-paletted
  187. 16bit displays (smother shading) and 24bit displays in terms of shding
  188. speed (with 10 bit just use 4 for shading, doing shading with just
  189. adding a register, no table-lookup -> more speed. Imagine descent real
  190. gouraudshaded :).
  191.  
  192. :  >> >You forget that you still need a 68040 atleast to do DOOM even if you h
  193. :  >> >super-fast Chunky card.  That's why there is no clone, the C2P problem 
  194.  
  195. :  JrF> huh logic ? There is no clone because nobody programed it. A clone is
  196. :  JrF> software, exisiting independent from the fact if a 040 exists.
  197.  
  198. : There is no (good) clone because it requires a 040 + fast Chunky gfx-card,
  199. : period.  Caused of course by the fact that 040 + fast Chunky gfx-card is a rare
  200. : combination found in the Amiga world.
  201.  
  202. "That's why there is no clone, the C2P problem...". What he wanted to say,
  203. is a technical argument. You give me a marketing argument, which I am not
  204. interested in now.
  205.  
  206. I still insist: AGA makes 19fps doom run 16.6fps. I guess users would be
  207. very happy with 16.6 fps!
  208.  
  209. So if something keeps us from having 16.6fps doom, it's either the cpu
  210. (how much could a 030-50 do when using same algo like doom ?) or
  211. the programmers. not AGA. yes, the 16.6 fps doom would run 19fps on
  212. a PCI gfx-card. I hope we all got this now...
  213.  
  214. :  >> >makes it worse though, on Amiga you'd require a 68060 to do fast DOOM (
  215.  
  216. :  JrF> the C2P problem on 040 is a PCer myth! C2P doesn't make it worse.
  217.  
  218. : Yes it does, see TextDemo.  The percentage of CPU time used for the C2P is
  219. He said "require a 68060...". If 040 does the c2p already at bandwidth speed,
  220. you don't need a 060. => the c2p is not the problem.
  221.  
  222. : NON-EXISTANT on the clones, because the 'fast-ram buffer' we use on Amiga is
  223. : called 'the screen' on the clones.  No extra copying (or converting for that
  224. : matter) needed.
  225.  
  226. really ? they render to gfx-card ram ?
  227.  
  228. :  >> >runs only 15-20 FPS on a 68060/50, 320x240x8 1x1, floors, walls, ceilin
  229. :  >> >depressing).
  230. :  JrF> huh ? first you tell me there is no clone and then you tell  YOU know
  231. :  JrF> about how much it'll run on a 060 ? logic ?
  232.  
  233. : That's TextDemo 5.7x (unreleased version) someone tested for me.  15-20 FPS for
  234. : a 68060/50 which is supposed to be 2-3 times as powerfull as a 486DX2/50 is
  235. : quite depressing, considering that that 486 will do it at 30 FPS.  Now just
  236.  
  237. running DOOM... are you sure doom does as complicated mapping...
  238. 2-3 times... IMHO in that range it depends much more on the mem interface.
  239. cache ? Reading textures is a quite mem intensive job, especially if you do
  240. a table lookup for reach pixel (which is hopefully in cache sometimes).
  241.  
  242. : translate that to the slower Amiga's (ie, the ones only equipped with 030's and
  243. : 040's).
  244. well, imho there is nothing against using the 11cycle mapper for floor,
  245. using coppershading. at least for 020/030.
  246.  
  247. 12 cycles 320x160 on my 020-14 is 0.044sec...
  248.  
  249. : Grtz John
  250.  
  251. : -----------------------------------------------------------------------
  252. :  John.Hendrikx@grafix.xs4all.nl   TextDemo/FastView/Etc... development
  253. : -----------------------------------------------------------------------
  254. : -- Via Xenolink 1.985B5, XenolinkUUCP 1.1
  255. ------------------------------------------------------------------------
  256.    fischerj@Informatik.TU-Muenchen.DE (Juergen "Rally" Fischer)   =:)
  257.