home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 3694 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  3.8 KB

  1. Path: informatik.tu-muenchen.de!fischerj
  2. From: fischerj@Informatik.TU-Muenchen.DE (Juergen "Rally" Fischer)
  3. Newsgroups: comp.sys.amiga.hardware,comp.sys.amiga.programmer
  4. Subject: Re: Blizzard 1230IV how good ?
  5. Followup-To: comp.sys.amiga.hardware,comp.sys.amiga.programmer
  6. Date: 23 Feb 1996 00:07:55 GMT
  7. Organization: Technische Universitaet Muenchen, Germany
  8. Distribution: world
  9. Message-ID: <4gj0gr$f5l@sunsystem5.informatik.tu-muenchen.de>
  10. References: <4eqhoj$nit@sunsystem5.informatik.tu-muenchen.de> <42116493@phoenix.owl.de> <1219.6615T886T2318@Redrobe.demon.co.uk> <4fnn4q$e19@sunsystem5.informatik.tu-muenchen.de> <42116524@phoenix.owl.de>
  11. NNTP-Posting-Host: hphalle5.informatik.tu-muenchen.de
  12. X-Newsreader: TIN [version 1.2 PL2]
  13.  
  14. Frank Wille (frank@phoenix.owl.de) wrote:
  15. : Juergen "Rally" Fischer wrote on 12 Feb 1996 15:42:18 GMT
  16. : about "Re: Blizzard 1230IV how good ?" :
  17.  
  18.  
  19. : JF> |> >Type            read            write
  20. : JF> |> >Chip Ram        4553 kB/s      4566 kB/s
  21. : JF> |> >Fast Ram       11340 kB/s      6020 kB/s
  22. : JF> 
  23. : JF> huh ? slower write in fastmem ? fastmem slower than a A1200 chipmem ?
  24.  
  25. : Yes. This is the sad truth. First, I couldn't believe it either. :(
  26. : The slow writing into a 128k Fast buffer is caused by the 040's
  27. : data cache copyback mode. When I disable data cache, I get 10.6
  28. : MB/sec both for reading and writing.
  29.  
  30. I guess you do linear write ? why copyback makes it slower ?
  31. is it useful for average code ? copyback means "will be written
  32. back to mem some time, and maybe in different order", right ?
  33.  
  34. : JF> could you please also test (a0)+,(a1)+ which might give different
  35. : JF> timings than (a0)+,dn & dn,(a1)+ ?
  36.  
  37. : I enhanced my little utility today, implementing copy- and ROM read
  38. : tests. It will be on Aminet, replacing the old version, in the next
  39. : days.
  40.  
  41. mhm I got additional ideas:
  42.  
  43. testing free cycles :) i.e. adding up to 3x add.l d0,d0 after a write. 
  44. Are there free cycles after a write to fastmem on A4000?
  45.  
  46. on 020 there are 2 free cycles after a move.l Dn,(an)+!!!
  47.  
  48. i.e. a write is generally done in 2 cycles, both in chip or fast.
  49. but if next instruction also acesses mem, you get additional cycles.
  50.  
  51. btw measuring 6 cycles for a copy on 020 already includes free cycles
  52. (020 working on next copy instruction while doing the buffered write).
  53.  
  54. : Running it on my 4000/040 with Cybervision screen mode (i.e. *no*
  55. : bitplane DMA at all), it looks like this:
  56.  
  57. : Type              read           write            copy
  58. : Chip RAM          4554 kB/s       4566 kB/s       2283 kB/s
  59. : Fast RAM         11333 kB/s       6022 kB/s       4000 kB/s
  60. : ROM              11300 kB/s          -               -
  61.  
  62. I really got to add the timings of A1201, because it's so much fun
  63. to overtake a Mercedes with a Volkswagen :))
  64.  
  65.        read            write                        copy
  66. chip   4.1 mb/sec      6.6 mb/sec (hehe)            3.4mb/sec
  67. fast   8.4 mb/sec     12.6 mb/sec :)))) A1200 rulz  8.4mb/sec (hehe!)
  68.  
  69. CHIPdma was 2 planes hires, if I remember right, and it's all very
  70. inaccurate, but the timings are about that.
  71.  
  72. I'd really be interested, how fast my 020 can aproach a A4000 when
  73. doing a megafake routine that is to do texturemapping. Due to the
  74. fact that it does almost just memcopy it myabe will compete well.
  75.  
  76. unroll this:
  77.  
  78.    move.b (a0,d0.w),(a1)+
  79.    addx.l d1,d0
  80.  
  81. should do about 1.2 mb/sec on A1201 vs. 2.1 mb/sec for plain
  82. bytewise copy.
  83.  
  84. could you maybe add this "fakemapper", too ? :)
  85. or the real-linear mapper:
  86.  
  87.   move.w d1,d6
  88.   move.b d0,d6
  89.   move.l d6,a0
  90.   move.b (a0)+,(a1)+
  91.   addx.l d2,d0
  92.   addx.l d3,d1
  93.  
  94. well, the problem about the mappers is they're dependend on how they
  95. read from mem. just put $00000000 in d2 and $02000100 in d3 (dx=2/256,
  96. dy=1)
  97.  
  98. and uhm.. $16 into d1 of the fakemapper example.
  99.  
  100. : -- _
  101. : _ // Frank      EMail: frank@phoenix.owl.de
  102. : \X/             IRC:   Phx @ #amiga(ger)
  103.  
  104.