home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / os / vms / 22050 < prev    next >
Encoding:
Internet Message Format  |  1993-01-27  |  5.2 KB

  1. Path: sparky!uunet!europa.eng.gtefsd.com!emory!swrinde!sdd.hp.com!hplabs!ucbvax!U.WASHINGTON.EDU!DEREK
  2. From: DEREK@U.WASHINGTON.EDU
  3. Newsgroups: comp.os.vms
  4. Subject: Re: Warning: bug check messages
  5. Message-ID: <8CDED0373BBF23A12E@MAX.U.WASHINGTON.EDU>
  6. Date: 27 Jan 93 00:41:00 GMT
  7. Sender: usenet@ucbvax.BERKELEY.EDU
  8. Organization: The Internet
  9. Lines: 106
  10.  
  11. >        We are running VMS 5.5-2 on a VAX 6610.  When a privileged user,
  12. >inside mail, says
  13. >Mail>show forwarding/user=*
  14. >we get the correct response listing the approximately 30 users who have
  15. >set forwarding.  But the execution of the instruction causes bug check
  16. >mail messages from VAXsimPLUS; apparently it has something to do with
  17. >generating stuff coming across the network.
  18. >        We reported this as a hardware problem; after dialing in they
  19. >asked us to call it in as a software problem.  Software has never seen
  20. >this.  The only way they could solve it would be to change a sysgen
  21. >parameter which allows a crash to occur from non-fatal errors; we find
  22. >this to be unacceptable on our busy machine.
  23. >        Has anyone had any experience with this?
  24. >Brendan Welch, UMass/Lowell, W1LPG,  welchb@woods.ulowell.edu
  25.  
  26. YES!  I have!
  27.  
  28. QUICKLY!  Although you *could* set the SYSGEN parameter BUGCHECKFATAL to 1,
  29. that will, as Carl points out, force all "continuable" bug checks to
  30. produce a system crash.  In this case, that may NOT be desired.
  31.  
  32. As for the statement: "Software has never seen this."  RUBBISH!    :)
  33. I TOLD them about it, nearly two years ago!
  34.  
  35. The source of your problem is, I believe, is one (or more) corrupt record(s)
  36. in the file VMSMAIL_PROFILE.DATA.  To fix it, I would first determine how
  37. many records are corrupt.  (A description of the kind of corruption I
  38. mean will be later in this posting.)
  39.  
  40. Let's see, you could start by producing a list of the users who have mail
  41. profile records.  (I know, this can be large.)  Then, execute the SHOW
  42. command once for each user in your list.  The ones which produce bugchecks
  43. need to be repaired.
  44.  
  45. The simplest "repair" is to REMOVE their record.  Not nice, but...
  46.  
  47. Now for some (humerous) history.  (At least, I can laugh about it *now*.)
  48.  
  49. As I recall, some version of VMS (was it 5.2?) shipped with BUGCHECKFATAL
  50. set to 1.  (We had it for field testing, but I think it stayed that way
  51. after we got the "real" release.)  Anyway, this made the problem VERY
  52. obvious to us.  See, some of our users were on BITNET mailing lists.  It
  53. happened that the MAIL profile records for some one of them got corrupted.
  54. When mail was sent to some of these users, the system would crash.  Now,
  55. we use this wonderful e-mail software package, called PMDF (produced by
  56. Innosoft International, Inc.) which is started "authomatically" by the
  57. system startup procedure.  Guess what happened when PMDF got a file for
  58. one of these "corrupt users"?
  59.  
  60. Well, OBVIOUSLY the system kept crashed every time PMDF started.  The
  61. thing you were *supposed* to guess was that I got woken up in the dead
  62. of night because the operators couldn't get the system to boot!   :)
  63.  
  64. (NOTE: It is NOT my intent to disparage PMDF and/or Innosoft in ANY way
  65. whatsoever.  PMDF is a superior product, and Ned, Kevin, etc. are
  66. very nice folks!)
  67.  
  68. To get the system up, of course, I did a conversational boot and set
  69. BUGCHECKFATAL to 0.  This worked -- for a while.  Someone else ran
  70. AUTOGEN, and it decided to reset BUGCHECKFATAL back to 1!  Yes, I got
  71. another call in the wee hours of the morning.
  72.  
  73. Now, back to the obligatory hack, er technical content.  :)
  74. The corruption.  How to describe this.  The corrupted records we saw
  75. were corrupted in that they were missing a single byte.  The profile
  76. records are variable length, maximum 2048 bytes.  The notion, apparently,
  77. is to make the records as short as possible.  Thus, if you don't have
  78. a "personal name", no space is wasted in the file to store that fact.
  79.  
  80. Now, this is off the top of my head, and someone else doubtless knows
  81. the format better than I, but basically the first 31 bytes are the username.
  82. After this, there are "item blocks" of information.  These blocks look
  83. something like:
  84.  
  85.     [item-code][item-length][item...]
  86.      2 bytes     2 bytes      n bytes
  87.  
  88. Now, what happened to us is that some of the records were missing bytes
  89. in an item length field.  (I think that was the one.)  Anyway, this caused
  90. MAIL to mis-parse the information.  If the data you were trying to change
  91. was in the record AFTER the corruption, the system would crash.  If it
  92. was BEFORE the corruption, you wouldn't notice any problems.
  93.  
  94. Now, for the sake fo clarity and completeness, the system would only crash
  95. if BUGCHECKFATAL was set to 1.  If BUGCHECKFATAL is set to 0, it is a
  96. continuable bugcheck.
  97.  
  98. There are OTHER ways to notice the problem.  Users may complain that MAIL
  99. won't remember their SETtings.  You may recall a thread on this topic from
  100. last year.  For example, the user may be able to set a personal name, but
  101. it is "lost" when they exit MAIL.  And, yes, this CAN produce the onerous
  102. incorrect new mail count problem.  :(
  103.  
  104. Did I leave anything out?  Contact me if you need more information/help.
  105.  
  106. -Derek S. Haining
  107.  University Computing Services
  108.  University of Washington
  109.  Seattle, Washington  98195 
  110.  (206) 543-5579
  111.  
  112.  DEREK@MAX.BITNET
  113.  DEREK@MAX.U.WASHINGTON.EDU
  114.  
  115.