home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / 95apr / msgway-minutes-95apr.txt < prev    next >
Text File  |  1995-05-27  |  12KB  |  285 lines

  1.  
  2. MessageWay BOF (MSGWAY)
  3.  
  4. Reported by Danny Cohen/Myricom
  5.  
  6. The MSGWAY BOF, chaired by Danny Cohen, was held on Tuesday, 4 April, at
  7. the 32nd IETF meeting in Danvers, MA. Sixteen people attended.
  8.  
  9. Danny presented the problem and a proposed approach (see slides).  A
  10. discussion of MsgWay and of the working group followed.
  11.  
  12.  
  13. The Problem
  14.  
  15. While the speed of computing circuits increases with time, the speed of
  16. light is unchanged.  As a result, distances shrink.  For example, the
  17. diameter of Ethernets has shrunk from 2Km to 0.2Km as their speed grew
  18. from 10 to 100Mbps.  Similarly, buses that used to dominate the
  19. inter-board communication (e.g., VME) are useful nowadays mainly for
  20. intra-board communication (e.g., PCI).
  21.  
  22. Modern computing systems in general, and MPPs (Massively Parallel
  23. Processing systems) in particular, use ``I/O fabric'' (MPP-networks) in
  24. stead of the traditional I/O buses.
  25.  
  26. Most MPP-networks are built to handle variable length packets, are made
  27. of very short point-to-point FDX links of high performance (high data
  28. rates, low latency, and very low BER), have error detection and flow
  29. control, and use cut-thru (aka ``wormhole'') switches with source
  30. routing.  In spite of these common similarities, each MPP network is
  31. typically an island unto itself, incapable of interoperating with other
  32. MPP-networks.
  33.  
  34. There is a need to use several homogeneous MPPs, and clusters (or
  35. networks) of workstations, as a single MPP, without losing the high
  36. performance communication native to them.
  37.  
  38.  
  39. A Proposed Approach
  40.  
  41. The interoperability between heterogeneous computing systems should be
  42. handled at Level 3, like IP, not just at the lower levels.
  43.  
  44. IP, that has successfully served the Internet for over 20 years as the
  45. basic tool for interoperability among heterogeneous computers, is not
  46. appropriate for MsgWay because many tradeoffs were made sacrificing high
  47. performance for generality and scalability.  In addition, IP does not
  48. address individual processors in MPPs.  (However, IPv6 could have been
  49. modified to fix this problem.)
  50.  
  51. The MsgWay approach is to define a Level 3 protocol that is similar in
  52. its philosophy to IP, but has implementation details geared toward
  53. high-performance, possibly at some cost of generality and wide area
  54. scalability.
  55.  
  56. MsgWay will be a Level 3 protocol, like IP, which could support IP (by
  57. encapsulation).  The MsgWay protocol will have both an EEP (end-to-end
  58. protocol, like IP) and an RRP (router-to-router protocol, like GGP).
  59.  
  60. Among the tradeoffs that made IP general, but proved to be deficiencies
  61. for high performance are:
  62.  
  63.  
  64.    o Long addresses (32 going on 128 bits)
  65.    o Addressing ``hosts'' only (not individual processors)
  66.    o No support of source routing
  67.    o Need for routers with global knowledge
  68.    o Hierarchical de-muxing
  69.    o No flow control
  70.    o No error detection
  71.    o No fault recovery
  72.    o No support of DMA
  73.    o No support of byte alignment
  74.    o Fields not sorted by need
  75.  
  76.  
  77. MsgWay will alleviate these deficiencies by having addresses of 16-bits,
  78. that could be dynamically assigned for sessions.  MsgWay will support
  79. both source routing (for Level 2 forwarding) and Level 3 addressing (for
  80. Level 3 forwarding).  The use of the source routing would allow the
  81. MsgWay switches to operate without any routing knowledge that has to be
  82. loaded to them.  MsgWay will have format to support zero-copy operation
  83. (i.e., direct copy from the network interface into the destination user
  84. area).  MsgWay would have flow control based on the flow control of the
  85. participating networks.  Similarly, MsgWay would have error indication
  86. in trailers, to allow the use of various CRC hardware.  Even though each
  87. participating network may use a different technique for error detection,
  88. MsgWay would have a uniform way to indicate errors.  MsgWay will address
  89. the alignment issue, to allow computers with different chunks (such as
  90. the Paragon's 8B-chunks, RACEway's 4B-chunks, and Myrinet's 2B-chucks)
  91. to efficiently communicate.  In addition, in order to minimize the
  92. wormhole latency, the fields in the MsgWay protocol header will be
  93. sorted by their need (e.g., starting with the destination address that
  94. is always needed).
  95.  
  96. MsgWay would support dynamic mapping and discovery required for
  97. automatic fault recovery.
  98.  
  99. Like IP, MsgWay does not define performance figures, connectors,
  100. communication media, address assignment, routing and discovery, APIs,
  101. and so on.  Following the IP philosophy, all these issues will be
  102. defined separately.
  103.  
  104. MsgWay defines a Level 3 protocol for interoperability of heterogeneous
  105. multi-processors at high performance.
  106.  
  107.  
  108.  
  109. Discussion
  110.  
  111.  
  112. A discussion about the proposed MsgWay activity followed the above
  113. presentation.  Several questions were raised by the participants in the
  114. BOF.
  115.  
  116.  
  117.    o Why should MsgWay be an IETF activity?
  118.  
  119.          It is proposed to conduct the MsgWay activity as an IETF
  120.          working group because of the firm belief that interoperability
  121.          should be handled at Level 3 (not just at Levels 1 and 2), and
  122.          because of the recognition that MPP-networks are computer
  123.          communication networks with much in common with the networks
  124.          that the IETF community is dealing with.  MsgWay is a small
  125.          computer network, not an extended computer bus.
  126.  
  127.  
  128.    o Why not use IP ``as is'' with slight modifications, as needed for
  129.      high performance?
  130.  
  131.          It is believed that this is the proposed approach.
  132.  
  133.  
  134.    o What about transport level issues, like reliability (a la TCP)?
  135.  
  136.          It is left for higher level protocols, as/if needed (note that
  137.          this is exactly IP's approach).
  138.  
  139.  
  140.    o Must MsgWay hosts use source-route?
  141.  
  142.          No.  MsgWay will support both Level 2 forwarding (by source
  143.          routes) and Level 3 forwarding (by addresses).
  144.  
  145.  
  146.    o Must processors in the same host (say a Paragon) use MsgWay among
  147.      each other?
  148.  
  149.          No.  They may use their native communication system.  For
  150.          generality the API may look the same but there is no need to
  151.          use MsgWay for internal communication within a system.  This is
  152.          similar to the use of IP between hosts on the same LAN. (Hosts
  153.          on the same ethernet could communicate by raw ethernet packets,
  154.          without IP - but using IP has some advantages.)
  155.  
  156.  
  157.    o How is the Source Route handled?
  158.  
  159.          It is consumed along the way (not an incremented pointer).
  160.          This allows each network along the path to be presented with
  161.          exactly the optimal bit pattern for its use.  Note that this
  162.          requires recomputing the checksum.
  163.  
  164.  
  165.    o MTU?
  166.  
  167.          The maximum packet size will be configured for the entire
  168.          MsgWay (probably not exceeding a few KBytes).  It is assumed
  169.          that each participating network can handle large packets.
  170.          There is no need to legislate that all MsgWay's always have the
  171.          same MTU. It is expected that the mapping process will
  172.          automatically discover the MTU and disseminate it.
  173.  
  174.  
  175.    o Interconnection of separate MsgWay-islands?
  176.  
  177.          MsgWay-islands could be interconnected via IP. They could be
  178.          either (1) interconnected by using IP as a tunnel encapsulating
  179.          MsgWay, or (2) connected by using IP and having the
  180.          MsgWay-islands independent of each other (treating MsgWay as a
  181.          LAN). Once IP is used over WANs the high-performance of MsgWay
  182.          is most likely to be lost.
  183.  
  184.  
  185.    o Up to how many stages of source-route make sense (rather than
  186.      addresses)?
  187.  
  188.          This is a runtime binding.  No need to decide at committee
  189.          time.  Msgway should be able to handle both.
  190.  
  191.  
  192.  
  193. The MSGWAY Working Group
  194.  
  195. Mailing list information for the MSGWAY group:
  196.  
  197.  
  198.       General Discussion:    MsgWay@myri.com
  199.       To Subscribe:          MsgWay-request@myri.com
  200.       Archive:               ftp://ftp.isi.edu/msgway/msgway.mail
  201.  
  202.  
  203. Danny will work with Frank Kastenholz, one of the Internet Area
  204. co-Directors, on a draft charter for the proposed working group and will
  205. post it on the mailing list.
  206.  
  207. The MSGWAY Working Group is expected to conduct its work over e-mail, to
  208. meet at IETF meetings, and to possibly have additional meetings between
  209. IETF meetings.
  210.  
  211. Danny reported that in addition to those who participated in the 32nd
  212. IETF BOF meeting, there are about 20 other people from academia,
  213. government, and industry (see list below) who expressed interest in
  214. participating in defining MsgWay.  Most of them had already participated
  215. in two meetings discussing MsgWay (January 1995 in Utah, and March 1995
  216. in Florida).  Most of these people expressed interest in participating
  217. in the IETF MSGWAY Working Group.  Given that both Jon Postel and Danny
  218. Cohen were already scheduled to be in this IETF BOF meeting, the others
  219. were advised that their presence at this meeting was not necessary.
  220.  
  221. Among those who participated in the earlier MsgWay meetings are people
  222. from Intel, Mercury and Myricom that are committed to implement and to
  223. demonstrate interoperability among Intel's Paragon, Mercury's RACEway,
  224. and Myricom's Myrinet, using the format that will be adopted for MsgWay
  225. by the MSGWAY Working Group.
  226.  
  227.  
  228.  
  229.                                 Academia
  230.  
  231.  Jon Postel       Postel@isi.edu              USC/ISI
  232.  Tony Skjellum    tony@aurora.cs.msstate.edu  Mississippi State University
  233.  Al Davis         ald@cs.utah.edu             Univ of Utah/CSD
  234.  Barney Maccabe   maccabe@cs.unm.edu          UNM/CS + Sandia
  235.  Stu Tewksbury    skt@msrc.wvu.edu            West Virginia University
  236.  Andy White       abw@lanl.gov                Los Alamos National Lab
  237.  
  238.                                 Government
  239.  
  240.  Mike.  Masters   mmaster@ariel.nswc.navy.mil Naval Surface Warfare Center
  241.  Jose L. Munoz    munoz@arpa.mil              ARPA/CSTO
  242.  Bob Parker       rparker@arpa.mil            ARPA/CSTO
  243.  
  244.                                  Industry
  245.  
  246.  Danny Cohen      Cohen@myri.com              Myricom
  247.  Chuck Seitz      Chuck@myri.com              Myricom
  248.  Craig Lund       clund@mc.com                Mercury Computer Systems
  249.  Alan L. Pool     alp@mc.com                  Mercury Computer Systems
  250.  Bob Graybill     graybill@mmlgrf.mml.mmc.com Martin Marietta Laboratories
  251.  Greg Chesson     greg@sgi.com                Silicon Graphics
  252.  Glenn.  Ladd.    gladd@msmail4.hac.com       Hughes
  253.  Lloyd Lewins     llewins@msmail4.hac.com     Hughes
  254.  Phil Sementilli  sement@igate1.hac.com       Hughes Missiles
  255.  Dave Dunning     ddunning@ssd.intel.com      Intel SSD
  256.  Paul Pierce      prp@ssd.intel.com           Intel SSD
  257.  Stephen Wheat    srwheat@ssd.intel.com       Intel SSD
  258.  Joe Brewer       JoeEBrewer@aol.com          Westinghouse
  259.  Bob Means        rwm@hnc.com                 HNC, Inc.
  260.  Marc Campbell    campbellm@aol.com           Northrop-Grumman
  261.  
  262.  
  263. Schedule
  264.  
  265. It is expected to have a rough draft of the minimal MsgWay protocol by
  266. the 33rd IETF meeting in mid-July.
  267.  
  268. It is expected that the first interoperability demonstration will take
  269. place no later than October 1995.  Myrinet, RACEway, and Intel's Paragon
  270. are expected to participate in that interoperability demonstration.
  271.  
  272.  
  273. Legalities
  274.  
  275. Frank Kastenholz of FTP Software brought up legal issues.  It was
  276. suggested that Danny should check with Carl Malamud about related
  277. patents that may be in the way of MsgWay.  (Already done.)
  278.  
  279. It was reported that Myricom has trademarked both MessageWay and Msgway,
  280. for free use by this activity.
  281.  
  282. By including the slides and this text in the proceedings of the IETF we
  283. are establishing MsgWay prior-art at least for April 95.
  284.  
  285.