home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / database / 6184 < prev    next >
Encoding:
Text File  |  1992-08-18  |  2.6 KB  |  62 lines

  1. Newsgroups: comp.databases
  2. Path: sparky!uunet!munnari.oz.au!metro!bnd2.bnd.oz.au!johnw
  3. From: johnw@bnd2.bnd.oz.au (John Warburton)
  4. Subject: Re: Hot Standby DBMS's
  5. Message-ID: <1992Aug19.001017.10999@bnd2.bnd.oz.au>
  6. Organization: B&D Doors, Sydney, NSW, Australia
  7. References: <9208172103.AA04378@hplwk.hpl.hp.com>
  8. Date: Wed, 19 Aug 1992 00:10:17 GMT
  9. Lines: 51
  10.  
  11. From article <9208172103.AA04378@hplwk.hpl.hp.com>, by albert@HPLWK.HPL.HP.COM (Joseph Albert):
  12. > Jonathan Edwards writes:
  13. >>In the transaction-processing world, there is the concept of a 'hot standby'
  14. >>system, which is a geographically separated system containing a copy of the
  15. >>database, and capable of coming online very quickly. The replicated data must
  16. >>be close to current, and guaranteeing complete synchronization is required
  17. >>by some applications. A further feature is the ability to 'catchup'
  18. >>incrementally to missed changes after an outage, without a complete database
  19. >>copy. Our database (homebrew non-relational) does this.
  20. >>Are there any other databases that can do this?
  21. > A more reliable fault-tolerance would be obtained from redundancy at a
  22. > level which is lowered than the level of abstraction of the database.
  23. > Disks can be made redundant by having 2 or 3 physical disks, with
  24. > drivers that make them look like a single device. if one disk fails,
  25.     .
  26.     .
  27.     .
  28.     .
  29.   lots more on physical fault tolerance deleted...
  30.  
  31. That all sounds good for cpu, disk crashes etc, but what about when you plug
  32. humans into the loop?
  33.  
  34. 4 out of our last 5 crashes have been human error & not hardware problems.
  35. Mainly filling up the database disks & no more writes possible, or someone
  36. accidentally writing direct onto the databse volume file .. sigh
  37.  
  38. I think that these sort of problems and the resultant reload of database
  39. checkpoint & replay of transactions could have been avoided with a machine that
  40. has the checkpoint written to it, at the same time as to tape, and transaction
  41. logs sent to the machine every 15 mins, so as to save time in reload of the
  42. checkpoint, - all we would do would replay the transactions -saving us about 2
  43. 1/2 expensive hours.
  44.  
  45. The reason this looks good, is that you do not have to replace your existing
  46. hardware for expensive fault tolerant machines. All you need is a (secondhand?)
  47. machine like your production one, with cheaper disks - just as long as it limps
  48. along until you fix the problem on the production machine, that's fine.
  49.  
  50. comments?
  51.  
  52. > Joseph Albert
  53. > albert@hplabs.hp.com
  54. -- 
  55. John Warburton                Internet:    johnw@bnd2.bnd.oz.au
  56. Systems Administrator            Phone:       +61 2 771 5566
  57. B & D Australia                Fax:         +61 2 771 6385
  58.           Living on ice-cream and chocolate kisses...
  59.