home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #27 / NN_1992_27.iso / spool / comp / database / ingres / 1933 < prev    next >
Encoding:
Internet Message Format  |  1992-11-18  |  3.3 KB

  1. Path: sparky!uunet!ogicse!flop.ENGR.ORST.EDU!gaia.ucs.orst.edu!umn.edu!mmm.serc.3m.com!us275168
  2. From: us275168@mmm.serc.3m.com (Kenneth A. Kiefer)
  3. Newsgroups: comp.databases.ingres
  4. Subject: Re: DEC ULTRIX INGRES checkpoint problem
  5. Message-ID: <1992Nov19.031726.12353@mmm.serc.3m.com>
  6. Date: 19 Nov 92 03:17:26 GMT
  7. Article-I.D.: mmm.1992Nov19.031726.12353
  8. References: <1992Nov13.175814.27160@aplcen.apl.jhu.edu>
  9. Organization: 3M Company
  10. Lines: 63
  11.  
  12.  
  13. mae@aplpy.jhuapl.edu (Mary Anne Espenshade) writes:
  14.  
  15. > ....  I've probably made 30 checkpoints with no
  16. > problem (and have even recovered from the checkpoint a few times).  Last
  17. > week I ran a update and made the checkpoint as usual, neither process
  18. > reported any errors.  When I next attempted to access the database, the
  19. > sql command aborted with the following error message:
  20. >       E_US0010    Database does not exist.
  21. > Going to the error log explained more of
  22. > the problem.  For each attempt to access the database, the following
  23. > series of errors was logged:
  24. >       E_DM923C_CONFIG_FORMAT_ERROR    Error in configuration file format.
  25. >       E_DM923A_CONFIG_OPEN_ERROR    Error occurred opening configuration 
  26. >                    file, (aaaaaaaa.cnf).
  27. >       E_DM9265_ADD_DB    Error occurred while trying to add a database.
  28. > I didn't want to try to recover from the checkpoint.  I didn't know
  29. > whether it would be able to find the database or if the checkpoint
  30. > itself was corrupted.  I finally decided to try replacing the
  31. > aaaaaaaa.cnf file with a copy from the previous day's system backup.
  32. > Since this is a binary file, I had no way to determine what had changed
  33. > between the two.  This seems to have worked, since I could then access
  34. > the database and successfully ran the scripts that read the data.
  35. > Hoping that the error was a one-time fluke, I ran the next tape update
  36. > and made another checkpoint, again with no errors reported.  The exact
  37. > same thing happened.  Once again I recovered from a copy of the
  38. > configuration file I had made just before I took the checkpoint (being
  39. > paranoid about such things), but I am left with no way to checkpoint
  40. > this database.
  41. > Two alternatives have been suggested by the system maintainers - copy
  42. > out all the data, recreate and reload the database and start over
  43. > (assuming that the error had something to do with the number of times
  44. > checkpoint had been run), or stop doing checkpoints and just tar the
  45. > database data files to tape (since the checkpoint is only really
  46. > important if journals are tied to it).
  47. > Has anyone else run into this problem?  Is it safe to practically
  48. > ignore it this way or should I be doing something else.
  49. > --
  50. > Mary Anne Espenshade
  51. > ARPA: mae@aplpy.jhuapl.edu
  52. > UUCP: ...!allegra!mimsy!aplcen!aplpy!mae
  53.  
  54. Here's a hunch.  If you're checkpointing to tape, try including  
  55. the "-d" flag on your ckpdb command to erase the checkpoint 
  56. timestamp history kept in the .cnf file.  Beware, if you're
  57. checkpointing to disk, the -d will also delete your old checkpoints from
  58. disk, so use it judiciously.
  59.  
  60. The .cnf file stores various pointers and other such stuff about the
  61. database, including the dates/times of the most recent 16 checkpoints.  
  62. As I remember, Ingres 6.2 has a bug where if more than 16 consecutive 
  63. checkpoints are done without the "-d" flag, the checkpoint history 
  64. overflows, clobbering other data in the .cnf file.
  65.  
  66. Good luck,
  67. Ken Kiefer
  68. kakiefer@mmm.com
  69.