home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / database / sybase / 514 < prev    next >
Encoding:
Text File  |  1992-12-21  |  3.8 KB  |  77 lines

  1. Newsgroups: comp.databases.sybase
  2. Path: sparky!uunet!caen!spencer
  3. From: spencer@med.umich.edu (Spencer W. Thomas)
  4. Subject: Dump integrity??
  5. Message-ID: <SPENCER.92Dec18122733@guraldi.med.umich.edu>
  6. Date: Fri, 18 Dec 92 12:27:33 EST
  7. Organization: University of Michigan
  8. Distribution: comp
  9. Nntp-Posting-Host: guraldi.itn.med.umich.edu
  10. Lines: 65
  11.  
  12. We ran into a situation this week that really scares me.  We were
  13. upgrading our server from 4.2 to 4.8, and made dumps of all our
  14. databases.  During the upgrade process, it became necessary (see my
  15. other message about this) to restore one of the databases from the
  16. backup.  We got an error message about an invalid logical page pointer
  17. (with a very large number, definitely invalid), and the load aborted.
  18. At this point, it was not possible to do ANYTHING with the database,
  19. including trying to drop it, except to LOAD it.  If the backup we were
  20. loading had been the only one we had, we would have been in very sad
  21. shape, with no option but to totally rebuild the database partition
  22. from scratch.
  23.  
  24. Once we got things rebuilt, I decided to lay down another dump, so I
  25. used 'mt fsf' to skip past the dumps that were already on the tape.
  26. It failed(!) with "I/O error".  Hmm....
  27.  
  28. I then tried using 'dd' to read the dump file.  It also failed with an
  29. I/O error.  Very suspicious...  So, we trekked over to the machine
  30. room to replace the tape.  The console log showed these errors:
  31.  
  32. Dec 16 12:15:14 mendel vmunix: st1:  forwardspace filemark failed
  33. Dec 16 12:15:14 mendel vmunix: st1 error:  sense key(0x4): hardware error
  34. Dec 16 12:16:43 mendel vmunix: st1:  forwardspace filemark failed
  35. Dec 16 12:16:43 mendel vmunix: st1 error:  sense key(0x4): hardware error
  36. Dec 16 12:16:43 mendel vmunix: st1:  file positioning error
  37. Dec 16 12:24:57 mendel vmunix: st1:  read failed
  38. Dec 16 12:24:57 mendel vmunix: st1 error:  sense key(0x4): hardware error
  39.  
  40. I see some problems here:
  41.  
  42. 1. There appeaars to have been no indication of the tape failure
  43.    during the dump.  This is a hardware problem, and cannot be blaimed
  44.    on Sybase.
  45. 2. There appears to be no way to verify (via the server) that a dump
  46.    was successful, short of trying to reload it.  (No "verify after
  47.    write" mode for the dump, for example.)
  48. 3. The read error was NOT REPORTED by the load database command,
  49.    instead we got a bogus message about a bad logical page pointer.
  50.    ****** This is totally inexcusable ******* We thought we had an
  51.    integrity problem with state of the database prior to the dump, and
  52.    wasted a fair amount of time trying to discover why.  If the error
  53.    had been "I/O error during load" or some such, we could have
  54.    responded in a more appropriate way.
  55. 4. The database was left in a state that was essentially impossible to
  56.    recover from.  It appears that once a load fails, the only thing
  57.    you can do to that database is to load it successfully (you can't
  58.    even drop it, unless you can convince the server that it is
  59.    suspect, so that you can dbcc dbrepair (dropdb) it.)
  60. 5. For the most part, the manuals were totally useless in helping us
  61.    recover.  (We never got lost enough to try calling tech support, so
  62.    I don't know whether they would have been any help, either).
  63.  
  64. I am now trying to figure out how to do database dumps in such a way
  65. that I am confident that I will always be able to restore the data, or
  66. at least so I will know when a dump is not restorable so I can take
  67. action to make a good one!  My current idea is this: After the dump
  68. runs each night, use Unix commands to back up the tape and read the
  69. dump file(s).  This will at least let me discover media errors.  
  70.  
  71. Just sign me,
  72. Unhappy but wiser (and mad as h***!)
  73. --
  74. =Spencer W. Thomas         |  Info Tech and Networking, B1911 CFOB, 0704
  75.    "Genome Informatician"    |  Univ of Michigan, Ann Arbor, MI 48109
  76. Spencer.W.Thomas@med.umich.edu    |  313-747-2778, FAX 313-764-4133
  77.