home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 4363 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  5.6 KB

  1. Path: grafix.xs4all.nl!john.hendrikx
  2. Date: Tue, 27 Feb 96 12:17:18 GMT+1
  3. Newsgroups: comp.sys.amiga.programmer
  4. Distribution: world
  5. Subject: Re: Amiga doesn`t need Pl
  6. MIME-Version: 1.0
  7. Content-Type: text/plain; charset=iso-8859-1
  8. Content-Transfer-Encoding: 8bit
  9. From: john.hendrikx@grafix.xs4all.nl (John Hendrikx)
  10. Message-ID: <john.hendrikx.4hkq@grafix.xs4all.nl>
  11. Organization: Private
  12.  
  13. In a message of 24 Feb 96 Stephan Schaem wrote to All:
  14.  
  15.  >> John Hendrikx (john.hendrikx@grafix.xs4all.nl) wrote:The 'copying' loop
  16.  >> simply doesn't exist on the clones, just paste it whereveryou want it
  17.  >> in the gfx-buffer and be done with it.  This is likely to be asfast as
  18.  >> a DOOM clone of the A1200 but with the C2P pass disabled (ie, no
  19.  >> display).
  20.  
  21.  SS>  By past you mean copy from local mem to gfx card mem.... like fastmem
  22.  
  23. That's a possibility, but on the clones you could even get away with writing
  24. each byte directly to the gfx-card (if this is slow, then meanwhile the CPU can
  25. continue to process the next pixel).
  26.  
  27.  SS> to chipmem. C2P is a small factor added to the copy, mainly because the
  28.  SS> problem is really slow 'gfx card'/chip mem on the amiga. 
  29.  
  30. Not all gfx-cards on Amiga are slow, but you're gonna need to have a Z-III card
  31. to get good performance.  It's only because ChipRAM is so slow that we can get
  32. C2P for 'free'.
  33.  
  34.  >> There is no Amiga with the same power as the P133.  And my 'average' (and
  35.  >> 2 year old $100) VLB Gfx card handles 15 MB/sec easily, more than enough
  36.  >> to do 640x480 in 2 frames.
  37.  
  38.  SS> I would like to compare the latest gouraud/tmap loop on 68060 VS P5
  39.  SS> runing all in the L1 cache. My guess is that is take more then 2x
  40.  SS> the mhz for the pentium to get the same number of pixel rendered.
  41.  SS> But out of the chip, expensive l2 cache and boosted mhz make a
  42.  SS> diference in the overall performance. 
  43.  
  44. And you forget to mention that the Pentium has 64-bit memory access.
  45.  
  46.  SS> The cpu is not the problem, the amiga HW (From CBM) sux big time.
  47.  
  48. I never said the 060 was the problem, for most Amiga's however even a 68060
  49. won't make a whole lot of a difference, unless you got a gfx-card (and
  50. preferably a Z-III one).
  51.  
  52.  >> There is no (good) clone because it requires a 040 + fast Chunky
  53.  >> gfx-card, period.  Caused of course by the fact that 040 + fast Chunky
  54.  >> gfx-card is a rare combination found in the Amiga world.
  55.  
  56.  SS> The CPU is not the problem... and 030 can render doom in 'fastmem'
  57.  SS> 'easy'.
  58.  
  59. I don't think so, maybe the 50 MHz version, but they still won't get 25 FPS
  60. orso at 320x256 1x1 (talking DOOM here, not some WolfenStein clone with floors
  61. which I see all too often).
  62.  
  63.  SS> The killing factor is the slow video memory. an 030 compete easy with
  64.  SS> a 486 in integer operation (mhz for mhz, not on an inst basis but on
  65.  SS> an overall small cached loop... like tmap)
  66.  
  67. Do you really think so?  On 030 the fastest instructions available take 2
  68. cycles, while most instructions on 486 take 1 cycle.  486 also has much faster
  69. Mul and Div instructions. You would be better of comparing the 040 with the
  70. 486.
  71.  
  72.  >> Yes it does, see TextDemo.  The percentage of CPU time used for the C2P
  73.  >> is NON-EXISTANT on the clones, because the 'fast-ram buffer' we use on
  74.  >> Amiga is called 'the screen' on the clones.  No extra copying (or
  75.  >> converting for that matter) needed.
  76.  
  77.  SS> Again the problem is not c2p but slow video memory...Does PC alway
  78.  SS> cache video memory on the L1 cache? I hear many people rendering in
  79.  SS> local mem then doing a copy.
  80.  
  81. Of course the video memory is not cached in the L1 cache, for the same reason
  82. as ChipRAM isn't cached on Amiga.  To copy the stuff to video ram why not
  83. simply ask the DMA controller to copy that shit for you while you render the
  84. next frame?  Also why wouldn't the same trick to get 'free' cycles on Amiga
  85. while doing ChipRAM writes work with the clones much faster Video RAM? While
  86. writing the pixel to video ram the processor continues to calculate the next
  87. TMapped pixel.
  88.  
  89.  >> That's TextDemo 5.7x (unreleased version) someone tested for me.  15-20
  90.  >> FPS for a 68060/50 which is supposed to be 2-3 times as powerfull as a
  91.  >> 486DX2/50 is quite depressing, considering that that 486 will do it at 30
  92.  >> FPS.  Now just translate that to the slower Amiga's (ie, the ones only
  93.  >> equipped with 030's and 040's).
  94.  
  95.  SS> 1.2 meg, around 15 frames second used to copy the fastmem buffer to
  96.  SS> chip. So 100mips*75% / 320*200*20 = 58.5 cycle per pixel rendered
  97.  SS> in 060 local mem! that is HUGE! when you know that a 040 need ~10
  98.  SS> cycle per pixel to do floor/ceiling gouraud shaded texture mapping.
  99.  
  100. I doubt this 10 cycle routine of yours is very usefull for realistic purposes
  101. judging from all the 'unrealistic' TMap routines I've seen here lately (ones
  102. with rely on 64K boundaries or too big or too small Textures).
  103.  
  104. The routine used to do (plain shaded) wall-mapping in TD takes 18 cycles/pixel
  105. (030 cycles).  The floor/ceiling mapper is not the best possible anymore (I've
  106. seen a *usefull* trick presented here recently which I could have used in the
  107. floor/ceiling mapper).
  108.  
  109.  SS> why would a 50mhz 060 be 6 time slower then a 40mhz 040 when working
  110.  SS> only in local fastmem?!?!!!?!??!!? (I assume here that you do gouraud
  111.  SS> shade your quads)
  112.  
  113. It DIDN'T work in local fastmem (did I say that?).  This included C2P time.  It
  114. was run in 320x240 1x1, 8-bit, full floors, ceilings and walls in DOOM style.
  115.  
  116. Grtz John
  117.  
  118. -----------------------------------------------------------------------
  119.  John.Hendrikx@grafix.xs4all.nl   TextDemo/FastView/Etc... development
  120. -----------------------------------------------------------------------
  121. -- Via Xenolink 1.985B5, XenolinkUUCP 1.1
  122.