home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / arch / 11755 < prev    next >
Encoding:
Text File  |  1992-12-20  |  10.4 KB  |  199 lines

  1. Newsgroups: comp.arch
  2. Path: sparky!uunet!spool.mu.edu!uwm.edu!linac!unixhub!kfp-slac-mac.slac.stanford.edu!user
  3. From: dbg@slac.stanford.edu (David Gustavson)
  4. Subject: Re: COMPAQ PROPOSED SCALABLE I/O ARCHITECTURE
  5. Message-ID: <dbg-171292183013@kfp-slac-mac.slac.stanford.edu>
  6. Followup-To: comp.arch
  7. Sender: news@unixhub.SLAC.Stanford.EDU
  8. Organization: SLAC
  9. References: <1992Dec15.171554.2781@twisto.eng.hou.compaq.com> <1992Dec15.194637.10009@eng.umd.edu> <1992Dec15.205639.25591@super.org> <1992Dec16.160054.2486@twisto.eng.hou.compaq.com>
  10. Date: Fri, 18 Dec 1992 04:09:54 GMT
  11. Lines: 186
  12.  
  13. In article <1992Dec16.160054.2486@twisto.eng.hou.compaq.com>,
  14. simonich@croatia.eng.hou.compaq.com (Chris Simonich) wrote:
  15. > In article <1992Dec15.205639.25591@super.org> rminnich@super.org (Ronald G Minnich) writes:
  16. > >
  17. > >Actually, seems to me they could look at SCI. Except they want low cost.
  18. > >But if the CMOS chips for SCI pan out, maybe they will meet the cost 
  19. > >range.
  20. > We have received this response from several people.  We 
  21. > disagree.  For one SCI had a physical topology (a ring) that 
  22. > is not suitable for expansion I/O.  Yes, we know you can run 
  23. > the ring to and from the same board and create a topology 
  24. > that looks like the Anet (Compaq Proposal) topology but then 
  25. > you begin to loose much of the cost advantages.  We took a 
  26. > long look at SCI before we created our proposal.  We ran 
  27. > into lots of problems trying to allow different speed rings 
  28. > to work together and the biggest problem was that we didn't 
  29. > like having to have bi-polar transceivers.  When we started 
  30. > to recast the thing for CMOS implementation we ran into 
  31. > protocol inefficiencies and, well, it just didn't seem to 
  32. > work out the way we need it to.  The major thing turned out 
  33. > to be that SCI and the Compaq proposal (we call it Anet 
  34. > around here) were trying to solve different problems with 
  35. > cost, not bandwidth, being the major one.  The fact that the 
  36. > 'C' in SCI stands for coherent I think brings out one of the 
  37. > differences in approach.  We needed an I/O interface and 
  38. > coherency in the I/O subsystem was something that we were 
  39. > trying to eliminate.  The address bandwidth required to 
  40. > maintain coherency in the I/O subsystem is prohibitive.
  41.  
  42. 1) Coherency in SCI costs you about 2 bits in the packet header, to allow
  43. for more command codes. Otherwise, it costs you nothing if you don't use
  44. it. 
  45.  
  46. The SCI spec spends a lot of space on coherence, and the designers spent a
  47. lot of time in verification and simulation to make sure it works, but you
  48. don't have to use it just because it's available. In fact, the LSI Logic
  49. Coreware implementation of SCI will (according to rumors, it isn't
  50. announced yet) explicitly let you omit all coherence stuff if you wish--and
  51. yet, if you change your mind later, you can still use the chip to do
  52. coherence!!
  53.  
  54. Coherence in SCI just involves sending ordinary packets, except they have
  55. different command codes. So a chip that sends/receives packets can do
  56. coherence, as long as something (e.g., the cache controller) tells it what
  57. packets to send. The Dolphin/Vitesse GaAs SCI chip does more than this
  58. minimum, however, in order to improve efficiency in high-end coherent
  59. systems. Namely, that chip can do by itself those state-change sequences
  60. that don't require further interaction with its local cache controller,
  61. like following a linked list of caches that need invalidation, and
  62. invalidating them. That task could as easily be handled by the cache
  63. controller instead, but this would increase the traffic on the back end of
  64. the interface chip. In many cases that wouldn't be a problem.
  65.  
  66. The goal of SCI was to scale all the way from low-end high-volume
  67. low-priced systems to the very high-end low-volume high-priced systems.
  68. It's not reasonable to reject it just because it does more than you want,
  69. if the existence of that capability doesn't cost you much. (It's worth it
  70. to you to pay for the two bits in the command code, because the increased
  71. versatility increases the chip volumes and drops the prices.)
  72.  
  73. 2) SCI isn't a ring unless you want it to be. It's two unidirectional
  74. links. We added some stuff to the SCI spec to make it possible to connect
  75. these links into a ring if you want (address decoding, bypass FIFO), but
  76. all SCI needs is to be able to send packets and receive packets. Again, the
  77. spec talks a lot about how SCI acts in the ring connection, because it was
  78. tricky to find a mechanism that was simple yet high performance, but you
  79. don't have to use it. On the other hand, of course, rings are awfully
  80. inexpensive and it may well be a good idea to think of ways to take
  81. advantage of them. There are ways. For inspiration, I know a company that
  82. plans to build a non-stop computer with triply redundant processors on each
  83. board, using a pair of rings on the backplane....
  84.  
  85. 3) You don't have to use bipolar transceivers. The initial SCI spec does
  86. use differential ECL signals, but that was for expedience in getting the
  87. first high-end chips out. There is a follow-on standard called LVDS (Low
  88. Voltage Differential Signals, P1596.3) that is nearly finished with
  89. defining signals that are more appropriate for CMOS. It is also defining
  90. 4-bit (6 signal) and 8-bit (10 signal) links for low-end applications.
  91. Eventually these signals will be able to go faster than the ECL ones,
  92. because they only have to slew 0.25 volt instead of 1 volt, but the chips
  93. you see in the next 6 months will probably be slower than the ECL ones.
  94. They will be plenty fast enough for your application, though...
  95.  
  96. > Don't get me wrong, we think that from a technical point of 
  97. > view SCI is neat.  
  98.  
  99. Thanks!
  100.  
  101. > It just seems to be intended for a 
  102. > different part of the system architecture.  
  103.  
  104. Yes, but for that part AS WELL AS the part you want right now--they aren't
  105. mutually exclusive. 
  106.  
  107. Furthermore, you will quickly find reasons to expand the functionality of
  108. your Anet to support multiprocessing (e.g. lando@aic.lockheed.com's (James
  109. G. Landowski's) request in this thread), and multiprocessing works a LOT
  110. better if you design it in from the start rather than paste it on
  111. afterward. SCI was designed from the ground up to do multiprocessing, and
  112. there are subtle issues there that took a lot of effort to get right. 
  113.  
  114. There was also a suggestion in this thread (from rsrodger@wam.umd.edu
  115. (Yamanari)) to use QuickRing. I think there are a lot of nice ideas in
  116. QuickRing, especially the packaging and interconnect physical stuff. But it
  117. is more suited to be a bulk data mover than a general purpose
  118. (multiprocessor or I/O) communication system.
  119.  
  120. I should also point out that SCI's signaling is distance-independent, so
  121. you can put long cables in if you like, with signal regenerators as needed,
  122. without breaking any buffer-size assumptions (like reverse flow-control
  123. wire schemes do), and it works over fiber optics too. The SCI serial
  124. interface chips (HP's G-Link) have been working at speeds up to 1.5 Gbit/s
  125. for a year, commercially available since summer, and now are in several
  126. products on the market. They are easy to use, which is unusual for high
  127. speed serial chips...
  128.  
  129. > We would welcome 
  130. > any comments you have to the contrary.  When/if you respond, 
  131. > tell us how we can make an SCI, I/O subsystem as cheap as an 
  132. > Anet, I/O subsystem.
  133. > --
  134. > ======================================================
  135. > Christopher Simonich        simonich@twisto.compaq.com
  136. > Compaq Computer Corp.       [713] 374-1898
  137. > ======================================================
  138.  
  139. The answer depends on your time scale, budget, etc. 
  140.  
  141. Since you are in an extremely high volume business, you can ignore the
  142. 1-time personpower costs of developing your own protocols, interface chips,
  143. verification suites, test equipment, documentation, service tech training
  144. etc.
  145.  
  146. And because you are so dominant in your market, you can make something an
  147. industry standard by just printing it and declaring it a standard. But if
  148. you wanted it to be a recognized authentic open standard, you'd have to
  149. allow a few years to establish consensus, go through the formal balloting
  150. process, and get the result certified by ANSI, then start on the
  151. international scene.
  152.  
  153. But most other companies will save both money and time by using standards
  154. everywhere they can, and only custom-designing those features that are
  155. essential to the value-added of their product. 
  156.  
  157. I claim that the extreme versatility of SCI (it turned out much better than
  158. we initially dared hope), combined with its support by multiple competing
  159. vendors (we added LSI Logic this month, and there will be more
  160. announcements coming soon) will result in cost-effective high-volume parts
  161. that span the applications spectrum from PCs to supercomputers.
  162.  
  163. And all you need to do to ride this curve is to stop reading the parts of
  164. the SCI spec that you don't need! In reality, of course, very few people
  165. will need to understand the spec. Since SCI is a 1-chip interface, you just
  166. buy it from some IC vendor whose engineers understood the spec, and you
  167. read their datasheet to learn how to get data into and out of that chip. In
  168. most cases, the user side of the chip will look like a simple bus, very
  169. familiar territory. You generally won't need to know that there are really
  170. little packets running around the links, much less care whether you could
  171. have saved two bits in the command field in your particular application....
  172.  
  173. There's no reason the SCI chips should be expensive (once the novelty wears
  174. off). They are somewhere between 70K and 100K gates, most of which are used
  175. to implement fast 2-port memory cells! For lower-speed CMOS versions, the
  176. memory cells will be more efficient and the effective gate count should
  177. drop. Sun figures $0.90/kgate now, and Apple figures its SerialBus
  178. interface at around 50K gates will cost well under $15 (along with
  179. connector and cable!) So these ought to be suitable jelly-beans in the
  180. 90's.
  181.  
  182. The strategy is to get the volume up by making a versatile chip, so that
  183. users are still ahead to use it even if they don't use every feature,
  184. because the costs are low. It has worked before--hardly anyone designs
  185. their own UART anymore!
  186.  
  187. Of course, all this advice assumes you have some time. If you need working
  188. CMOS parts before March 93, you'll probably have to make your own. 
  189.  
  190. --------------------------------------------------------------
  191. -- David B. Gustavson, Computation Research Group, SLAC, POB 4349 MS 88,
  192.     Stanford, CA 94309   tel (415)961-3539  fax (415)961-3530
  193. -- What the world needs next is a Scalable Coherent Interface!
  194. -- Any opinions expressed are mine and not necessarily those
  195.    of the Stanford Linear Accelerator Center, the University, or the DOE.
  196.