home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / sys / isis / 384 < prev    next >
Encoding:
Text File  |  1993-01-22  |  2.3 KB  |  48 lines

  1. Newsgroups: comp.sys.isis
  2. Path: sparky!uunet!srvr1.engin.umich.edu!batcomputer!cornell!ken
  3. From: ken@cs.cornell.edu (Ken Birman)
  4. Subject: Re: Challenges?
  5. Message-ID: <1993Jan22.154402.24721@cs.cornell.edu>
  6. Organization: Cornell Univ. CS Dept, Ithaca NY 14853
  7. References: <1993Jan19.140117.1199@cs.cornell.edu> <8140004@otter.hpl.hp.com>
  8. Date: Fri, 22 Jan 1993 15:44:02 GMT
  9. Lines: 37
  10.  
  11. In article <8140004@otter.hpl.hp.com> pdh@otter.hpl.hp.com (Paul Harry) writes:
  12. >(discussion of n-n communication issues)
  13.  
  14. Paul, this is an interesting issue.
  15.  
  16. First, having looked a bit at the problem, I am convinced that we could
  17. support a fairly efficient n-n communication tool, using abcast to
  18. send messages into each group, introducing a coallator for the 
  19. duplicate messages coming in and the duplicate replies back to the
  20. origin group, and using a multicast to send the reply to the origin
  21. group instead of the current scheme, which sends to only the origin
  22. process.  None of this would be hard.
  23.  
  24. However, two observations.  First, the cost of such a scheme will be
  25. high.  Second, there may be a cheaper alternative with the same reliability
  26. -- for example, the scheme that Robert Cooper, Barry Gleeson and I
  27. wrote up in the TR on "process group semantics" (unpublished).  So, I
  28. can see merit in supporting n-version programming and hence n-n
  29. communications, but I am not 100% convinced that the need extends to
  30. other fault-tolerance situations.
  31.  
  32. Question: can people point to applications in which response time is
  33. so critical that detecting the failure and then restarting the
  34. computation is too slow, and hence you need to use an n-n scheme
  35. instead of a primary-backup scheme?  I know of a few such things,
  36. but my theory is that you can localize them to servers, so you get
  37. (single) client programs talking to replicated computations in the
  38. server.  This is a 1-n pattern which you can easily solve in Isis,
  39. so the n-n issue isn't really seen...
  40.  
  41. Comments?  I think we should probably add n-n programming tools anyhow,
  42. but I am just curious to understand how commonly they would be needed!
  43.  
  44. -- 
  45. Kenneth P. Birman                              E-mail:  ken@cs.cornell.edu
  46. 4105 Upson Hall, Dept. of Computer Science     TEL:     607 255-9199 (office)
  47. Cornell University Ithaca, NY 14853 (USA)      FAX:     607 255-4428
  48.