home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / database / 6245 < prev    next >
Encoding:
Internet Message Format  |  1992-08-21  |  2.7 KB

  1. Path: sparky!uunet!cis.ohio-state.edu!zaphod.mps.ohio-state.edu!uakari.primate.wisc.edu!ames!agate!triplerock.CS.Berkeley.EDU!mao
  2. From: mao@triplerock.CS.Berkeley.EDU (Mike Olson)
  3. Newsgroups: comp.databases
  4. Subject: Re: distributed transactions
  5. Message-ID: <173oogINNmrp@agate.berkeley.edu>
  6. Date: 21 Aug 92 21:55:28 GMT
  7. References: <1736k9INNjhh@agate.berkeley.edu> <BtCrA6.Iuy@cup.hp.com>
  8. Organization: University of California at Berkeley
  9. Lines: 48
  10. NNTP-Posting-Host: triplerock.cs.berkeley.edu
  11.  
  12. In <BtCrA6.Iuy@cup.hp.com>, dhepner@cup.hp.com (Dan Hepner) asks for
  13. details on how non-blocking commit protocols handle network partitions:
  14.  
  15. > Maybe you can explain how this apparent dilemma is addressed:
  16. > Time 1:  node n acknowledges prepare
  17. > Time 2:  node n notes an inability to communicate with anyone else, in 
  18. >      particular any site capable of being the transaction coordinator
  19. > Time 3:  still no communications, patience exhausted at node n
  20.  
  21. here's what the distributed systems theorists say:  a partition splits
  22. a network into two pieces.  whichever piece contains a majority of
  23. the nodes in the original network may continue processing.  nodes in
  24. the minority clique cannot make further updates until the partition is
  25. repaired.
  26.  
  27. there are some obvious problems with this -- for example, if no clique
  28. contains a majority of the nodes in the original network, no one can
  29. make progress.
  30.  
  31. > On the other hand, the rarity of actual blockage makes extreme concern
  32. > not warranted for most real world systems.  The coordinator must go
  33. > away at precisely the right time, _and then never return_.  Surely some 
  34. > way needs to be offered to resolve the tie-up, but this issue does
  35. > not justify a fundamental complaint against distributed transactions.
  36.  
  37. partitions aren't that rare.  ethernet bridges go down all the time.
  38.  
  39. you're correct in your assertion that strong consistency in the face
  40. of catastrophic failures is very difficult to guarantee.  skeen's work
  41. makes it possible for some nodes, under some conditions, to continue
  42. to make progress when machines crash or communications fail, but it
  43. doesn't solve the whole problem.  other approaches are to relax your
  44. consistency requirements, or to have humans outside the loop grant
  45. permission to acquire locks and update tables during communications
  46. failures.
  47.  
  48. the added complexity of three-phase commit, coupled with the fact that
  49. a clever adversary can force blockage anyway, have meant that it hasn't
  50. gotten a lot of attention by commercial vendors.  in real life, what
  51. people do is spend a lot of money on redundant, highly reliable
  52. communications systems.  when something crashes, some expensive employees 
  53. get it working again fast.
  54.  
  55.                     mike olson
  56.                     project sequoia 2000
  57.                     uc berkeley
  58.                     mao@cs.berkeley.edu
  59.