home *** CD-ROM | disk | FTP | other *** search
/ The CIA World Factbook 1992 / k3bimage.iso / sel / 04 / 0060 / wstate.thd < prev   
Encoding:
Text File  |  1991-12-02  |  13.9 KB  |  233 lines

  1.  
  2. @* Which setup results in a faster system: running at 8 MHz with no wait
  3. states, or at 10 MHz with one wait state?  Some benchmark results show that the
  4. latter has a slight edge, despite theoretical arguments that would support the
  5. opposite; and comparisons of 6 MHz/0 wait state machines with 8 MHz/1 wait
  6. state systems bears out this effect.
  7. This discussion took place on the IBMHW Forum of IBMNET on Compuserve; messages
  8. edited by Joan Friedman 76556,3643.
  9. @* Message no. range: 34204-35936
  10. @* Date range: December 13-26, 1986
  11. @* THE THEORY
  12. Fm: Pete Holsberg 70240,334 13-Dec-86
  13. To: DaveH 76054,171
  14. Someone told me that there was an explanation of why an AT running at 10MHz
  15. with 1-wait state is faster/slower than one that runs at 8MHz, no wait states.
  16. Other than throughput, is there some other reason to prefer one over the other?
  17. Fm: Dave Hoagland 76054,171 14-Dec-86
  18. To: Pete Holsberg 70240,334
  19. One major consideration in a "fast" machine is the ability of peripheral cards
  20. to support the speed of the I/O bus.  In both cases (8mhz, zero wait state and
  21. 10mhz, one wait state) I would expect very few peripherals to have a problem.
  22. If the two CPUs are running at those speeds (one wait state for the 10mhz
  23. unit), I would expect the 8mhz, zero wait state machine to be faster (note that
  24. its I/O bus will be running faster, too).  I've noticed that in most cpu
  25. intensive operations, my XT286 (6mhz, zero wait state) is faster than my AT
  26. (8mhz, one wait state), as one might expect.  As long as the combined clock
  27. rate plus wait state or the "high speed" system results in slower operation
  28. than the slower clock speed zero wait state setup, I'd pick the latter...but in
  29. either case, the I/O compatibility should be considered.
  30. I really think AST is approaching the situation quite intelligently in their
  31. Premium 286.  The CPU is running at 10mhz, zero wait state, while a wait state
  32. is introduced in their I/O bus.  This permits the use of standard peripherals.
  33. However, there are two "Hot slots" (I think they refer to them as "fast slots")
  34. that have a third connector.  These slots are available for cards specifically
  35. designed to run at 10mhz, zero wait state (such as their FastRAM cards).  The
  36. third connector provides a "direct pipeline" to the 80286.  I believe a
  37. standard card can be plugged in the same slot, however, and since it doesn't
  38. access the third connector, it will run normally with the standard I/O bus wait
  39. state.
  40. Fm: Doug Hogarth [PowerSoft] 76703,374 14-Dec-86
  41. To: Pete Holsberg 70240,334 (X)
  42. Although there are other considerations, my information is that each wait state
  43. adds 25% slowdown.  I think that means the 10Mhz-1 wait would be more like a
  44. 7.5Mhz-0 wait, which is slower than an 8Mhz-0 wait.  Please don't depend on
  45. that information, I could be wrong.
  46. Fm: Pete Holsberg 70240,334 14-Dec-86
  47. To: Dave Hoagland 76054,171 (X)
  48. Hmmm.  Here's what I was thinking.  Please point out where the flaws are, OK?
  49. Perhaps it's in my assumption that the '286, like the '86, has a 4 T-state bus
  50. cycle.  If it does, then a bus cycle at 8MHz takes 4 * ( 1/8) = 500 ns, and 400
  51. ns at 10 MHz. A wait state is 1 T-state in length, so at 10 MHz, a wait state
  52. lasts 100 ns.  Thus at 10 MHz with 1 wait state, a bus cycle takes 400 + 100 ns
  53. = 500 ns, exactly the same as 8MHz, no wait states. ???
  54. Fm: Doug Hogarth [PowerSoft] 76703,374 14-Dec-86
  55. To: Pete Holsberg 70240,334
  56. I think it is more like the minimum bus cycle at 8Mhz-0 wait is 250ns, and at
  57. 10Mhz-1 wait is 300ns.  Those figures are overly pessimistic because the
  58. pipelining within the 286 sometimes causes idel bus cycles while executing
  59. prefetched instructions (that is from Intel literature).  The benchmark
  60. difference works out to around 1/2 of the calculated difference.
  61. Fm: Pete Holsberg 70240,334 14-Dec-86
  62. To: Doug Hogarth [PowerSoft] 76703,374
  63. If a bus cycle is four T-states and a T-state is a clock period, then an 8MHz
  64. clock => 125ns periods, so four of them would be 500ns.  Is a '286 bus cycle
  65. different from 4 T-states??  Gee, I wish I had Intel literature to read!!
  66. Fm: Doug Hogarth [PowerSoft] 76703,374 14-Dec-86
  67. To: Pete Holsberg 70240,334
  68. Sorry, I don't have that info.  Perhaps it means something to you if I say that
  69. the 286 has a double-frequency system clock.  The info I gave you about minimum
  70. bus cycle time was from 4-3 of Intel's 286 Hardware Reference Manual.
  71. Fm: Stephen Satchell 72736,70 15-Dec-86
  72. To: Pete Holsberg 70240,334
  73. The Intel 80286 uses two T states instead of four.  IBM places one wait T-state
  74. into each cycle, unless the expansion board requests (a) no wait states or (b)
  75. additional wait states.
  76. Fm: Pete Holsberg 70240,334 16-Dec-86
  77. To: Stephen Satchell 72736,70
  78. When you say "IBM places one wait state..." you're talking about the 8MHz AT?
  79. Is that for "main" memory or just expansion boards?
  80. Lemme think...if we have 2 T-states per bus cycle, then a cycle at 8MHz is
  81. 250ns with 0 WSs, and a cycle at 10MHz is 200ns with no WSs and 300ns with 1
  82. WS. So the 10MHz- 1WS is considerably slower than the 8MHz- 0WS.
  83. Now if I go back and reread all those PC benchmarks, I ought to see some sense
  84. there!
  85. Fm: Stephen Satchell 72736,70 17-Dec-86
  86. To: Pete Holsberg 70240,334
  87. The information I put out is for the 6 MHz machine, but according to some
  88. things I've read here and there, the AT 339 is 8 MHz 1 wait state.  BTW with
  89. all the systems I've evaluated for Infoworld, I can verify with benchmark
  90. numbers your statement that 10 MHz 1 ws is indeed slower than 8 MHz 0 ws.  You
  91. would need a 12 MHz 1 ws machine to equal the RAM performance of a 8 MHz 0 ws
  92. machine.  Some clever engineering could probably produce a 10 MHz 0.5 ws
  93. machine, which would be a tad faster. [The 0.5 ws would be statistical, not a
  94. reality!]
  95. Fm: Pete Holsberg 70240,334 17-Dec-86
  96. To: Stephen Satchell 72736,70 (X)
  97. According to my lightning-swift calculation, a 12MHz - 1ws machine would
  98. perform a bus cycle in 250ns, same as an 8MHz 0ws jobber!!  So, it looks like
  99. an 8+0 is a better buy.  (?)
  100. Fm: Steve Wallace 76010,2162 17-Dec-86
  101. To: Stephen Satchell 72736,70
  102. How about your views regarding speed, wait states, and memory chip speeds to
  103. retain compatibility?
  104. Fm: Stephen Satchell 72736,70 17-Dec-86
  105. To: Steve Wallace 76010,2162 (X)
  106. The principal problem with retaining compatibility on faster machines is to
  107. insure that the I/O slots don't see any excessive super-speed that exceeds the
  108. design guidelines.  So for an 8 MHz zero wait state machine I would be tempted
  109. to insert two wait states at the I/O slot unless otherwise instructed by the
  110. card.  For 10 MHz and faster machines, I would be tempted to divorce the chip
  111. bus from the I/O bus, and use the standard Intel bus arbiter chips to resolve
  112. any conflicts.  The I/O bus would run 6 and/or 8 MHz 1 wait state.  Access to
  113. memory would be such that DMA, for example, would be buffered, and a cycle
  114. stolen as required without slowing down high speed RAM.
  115. This is not uncommon with non-desktop computer systems built on Multibus, by
  116. the way.  Each board runs as fast as it can when using its own resources, but
  117. slows down when it goes "off-board".  It's also a little more expensive, and
  118. works best with operating systems (including BIOS) that permit easy concurrent
  119. I/O and compute...which the IBM PC family does not do.
  120. Fm: Charles Hart 72755,500 17-Dec-86
  121. To: Stephen Satchell 72736,70 (X)
  122. Curious things are happening in the AT Clone marketplace.  I just tested two
  123. motherboards and found the following:
  124.                                         8 Mh 0 WS              10 Mh 0 WS
  125.                                         ---------              ---------
  126. Norton SI                                9.1                     10.3
  127. SSE-V2                                   27(5.1)                 27(5.1)
  128. Crystals were ~16 Mh and ~20 Mh respectively.  Wonder why Norton says 13%
  129. faster when SSE-V2 thinks it's the same board?
  130. P.S. - The 8 Mh was from the Far East while the 10 Mh was from the US. Must
  131. admit the US board "looked" more sturdy and better put together.
  132. Fm: Stephen Satchell 72736,70 17-Dec-86
  133. To: Charles Hart 72755,500
  134. You may have run into a software problem.  I ran into something similar with my
  135. benchmarks when I was doing the Compaq 386 box.  The machine was just too fast
  136. for the benchmarks!  I had to completely re-write the timing part.  I did such
  137. a good job that I can take the programs and run them on anything from a 8 khz
  138. ("sounds") 8088 system to a Cray-2 (so long as there is a suitable C compiler
  139. for both).
  140. I suspect that a new version of SI will appear "real soon now"...
  141. @* THE TESTS CONFOUND THEORY
  142. Fm: Gene Saunders 72265,23 21-Dec-86
  143. To: Stephen Satchell 72736,70
  144.           PC Labs Benchmark Series - Release 4.01 - October 1986
  145. BENCH20 - Memory Access Speed Benchmark Test
  146. Version 1.12
  147. Times are in seconds            8088     80286       80286     80286
  148.                                 4.77      6/0         8/0      10/1
  149.                              ---------  ---------  ---------  ---------
  150. Conventional read                   -       1.32       0.93       0.99
  151. Conventional write                  -       1.26       0.93       1.05
  152. Extended read                       -          -      16.59          -
  153. Extended write                      -          -      16.59          -
  154. Couldn't run test on 8088 due to RAM limit on demo machine.
  155. Couldn't run extended read/write due to RAM limit on demo machines.
  156. =======================================================================
  157. BENCH21 - Processor Speed Benchmark Test
  158. Version 1.31
  159. Times are in seconds           8088       80286      80286      80286
  160.                                4.77        6/0        8/0       10/1
  161.                              ---------  ---------  ---------  ---------
  162. 128K NOP                        10.21       5.55       4.18       3.35
  163. Do nothing                       9.94       4.22       2.97       2.86
  164. Integer add                      9.89       2.47       1.81       1.71
  165. Integer multiply                10.00       1.53       1.10       0.93
  166. String sort and move            10.82       3.30       2.36       2.26
  167. Prime Number Sieve              15.49       4.67       3.35       3.30
  168. =======================================================================
  169. BENCH29 - Floating Point Math Coprocessor Test
  170. Version 1.01
  171. Times are in seconds           8088       80286     80286      80286
  172.                                4.77        6/0       8/0        10/1
  173.                              ---------  ---------  ---------  ---------
  174. Floating point (no 80287)     160.88       44.00      28.07      28.02
  175. Floating point (with 80287)         -          -       3.19          -
  176. Interesting, eh? Re: the BENCH21 test -- it ain't necessaerily so that
  177. an 8 MHz/0 wait will be faster than a 10 MHz/1 wait box. Assamatter of fact,
  178. the 10/1 *slightly*, *only slightly* outperformed the 8/0 machine. For my
  179. test, all CPUs are from the same manufacturer, and all are production models.
  180. The 8/0 and 10/1 boxes have 120 ns DRAM; the 8088 and 80286 are using 150 ns
  181. chips.  All RAM is on the motherboard of each machine.
  182. Fm: Doug Hogarth [PowerSoft] 76703,374 21-Dec-86
  183. To: Gene Saunders 72265,23
  184. That is interesting - we had expected the opposite results - that the 8/0 would
  185. slightly outperform the 10/1.
  186. Fm: Pete Holsberg 70240,334 21-Dec-86
  187. To: Gene Saunders 72265,23
  188. Very interesting.  Do you know how the wait states are implemented?  That is,
  189. one each bus cycle?  One each memory access bus cycle?  Etc.  Can you tell us
  190. what computers you used?
  191. Fm: Gene Saunders 72265,23 23-Dec-86
  192. To: Pete Holsberg 70240,334 (X)
  193. I don't know what the timing is on each bus, although that should be of
  194. importance only when something *other* than pure CPU is concerned, correct?
  195. (i.e. if the test were hard disk related, they would be tied to the controller
  196. and the drive).  Computers used are all of one manufacturer: ITT. The 8088 is
  197. the ITT XTRA.  The 80286/6 MHz-0 wait is the ITT XP. The 80286/8 MHz-0 wait is
  198. the ITT XL. The 80286/10 MHz-1 wait is the ITT 286/ATW.
  199. Fm: Pete Holsberg 70240,334 24-Dec-86
  200. To: Gene Saunders 72265,23
  201. Not exactly.  The CPU is never used alone; it's gotta have the instructions
  202. from memory, right?  So the memory wait states are the most significant.  Now,
  203. a good design would put waits states ONLY where needed, but a cheap design
  204. would add a wait state to every bus cycle.
  205. Fm: Dave Hoagland 76054,171 22-Dec-86
  206. To: Pete Holsberg 70240,334
  207. His experience confirms some tests we conducted Friday.  The single wait state
  208. 8mhz IBM AT outperforms the zero wait state 6mhz IBM XT286.  By a reasonable
  209. margin.  Interesting...
  210. Fm: Pete Holsberg 70240,334 22-Dec-86
  211. To: Dave Hoagland 76054,171 (X)
  212. Wow!  That means that wait states are included only on memory accesses.  That's
  213. more expensive than either 1 wait on everything or even 0 waits on every cycle.
  214. And the higher-speed-1-wait-state-on-memory-only will give a significant
  215. improvement on all internal operations, too.
  216. Fm: Dave Hoagland 76054,171 24-Dec-86
  217. To: Gene Saunders 72265,23
  218. I ran the PC Mag BENCHMARK on a new IBM AT (8mhz, 1 wait state) and on an XT286
  219. (6mhz, 0 wait state), and the 8mhz AT came out on top...by a fair margin.  I
  220. don't think your results were in error.  I'm just not sure that we fully
  221. understand the way the wait states are being implemented.  One of my college
  222. professors would have had a fit though...he was a believer that "if the data
  223. doesn't agree with the theory, they must be disposed of". <grin>
  224. Incidentally, my impressions of the relative speeds of the machines after a
  225. month or so of use correlated with the BENCHMARK results...that is, the 8mhz AT
  226. seems to be a faster machine than the XT286...
  227. Fm: John Edward Miller 76011,2122 26-Dec-86
  228. To: STAN DVOSKIN 72477,160
  229. Your comment about 'add-on cards' struck a nerve...if you plan on using the
  230. machine in a networking environment, you may find that 0 wait states on the bus
  231. outruns the network adapter card.  No substitute for a money-back guarantee (or
  232. jumperable wait states, or just a faster network card).
  233. DL 0 !