home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / os / vms / 17648 < prev    next >
Encoding:
Internet Message Format  |  1992-11-08  |  3.9 KB

  1. Path: sparky!uunet!psinntp!colornet!dfilip
  2. From: dfilip@colornet.UUCP
  3. Newsgroups: comp.os.vms
  4. Subject: Re: NO MORE HAIR TO LOOSE - HELP!
  5. Keywords: disk error
  6. Message-ID: <39@colornet.UUCP>
  7. Date: 7 Nov 92 19:39:43 GMT
  8. References: <Bx3EtK.4LD@gdls.CSCTMD.COM>
  9. Distribution: world
  10. Organization: ColorNet Information Systems
  11. Lines: 64
  12.  
  13. Crista Allen writes :
  14. >What about the Read/Write board?  Last week, I had major problems.  These
  15. >disks are RA81's. We kept loosing connection to the quorum disk.  Bell Atlantic 
  16. >came in and said it was the HDA going out. (This has just been replaced 8 months
  17. >ago)  When I tried to do an HSC backup, it kept dying.  It was coming back
  18. >with error reading the disk and other errors.  They changed the read/write
  19. >board which then allowed me to do the backup.  Couldn't this have been the
  20. >problem with loosing connection to the quorum disk error???  They went ahead
  21. >and put in another HDA, but that seems kind of silly if it was the R/W board.
  22.  
  23. Yes, a bad R/W board would have caused your the quorum disk to loose connection
  24. and since I think you are stating that the backup errors went away when the R/W
  25. board was replaced then that was definitely your problem.
  26.  
  27. If I were you, I would have demanded to keep the HDA, run non-destructive
  28. diags, and if the disk looked OK, chased the FE out of the computer room !
  29.  
  30. We have all DEC maintenance, but we have a running joke about how no matter what
  31. the problem is, DEC will first replace the HDA, and if the problem persists,
  32. then try to figure out what it might be. And you can go through a lot of HDA's
  33. when you have a bad memory board ! :-) :-) :-)
  34.  
  35. (one of our offices in the south-west had their HDA replaced (3400) almost
  36. every month for disk errors until we finally convinced DEC to swap the ISE
  37. (kept using the same old ISE with new HDA's); one of the jokes there is that
  38. DEC considered swapping the HDA as part of preventive maintenance ! Geez,
  39. what ever happened to the good'ol days of simply replacing the filters ! :-)
  40.  
  41. Although I have never worked for DEC and have never been trained by DEC,
  42. I can make some sense out of ANAL/ERR and VAXSIM reports, and have been
  43. doing it long enough that I have a fairly good idea what is most likely the
  44. problem when disk errors are reported; a bunch of revectored blocks in the
  45. same range, or all on the same head within a short period of time usually
  46. means that your HDA is starting to lunch, and you should write-protect it
  47. and back it up ASAP until DEC can get in. On the other hand, things like
  48. SDI command timeouts usually point to the controller/cabling/drive
  49. electronics (ISE) and there is a good chance it is NOT the HDA. Unfortunatly,
  50. DEC always wants to try replacing the HDA first, and we sometimes have to
  51. convince them to try replacing something else FIRST.
  52.  
  53. One time I actually did come very close to throwing a DEC FE out when he
  54. wanted to replace the HDA. When I told him that to me the errors did NOT
  55. point to an HDA, and that I had spoken with Colorado and they also felt
  56. that it was probably not the HDA, he replied that "Well Colorado said that
  57. it might not be the HDA, but then again it might, so I decided to bring
  58. along an HDA to be sure. I'll put the HDA in, and if that dosn't take care
  59. of the problem, I'll try replacing the R/W board." (paraphrased) I was
  60. very insistant that he CHANGE THE ORDER of his swaps, and STRONGLY
  61. INSISTED that if he DISAGREE that he call Colorado himself.
  62.  
  63. It turned out to be the R/W board.
  64.  
  65. (thank you .... I am now getting off my soap box ... I feel better now :-)
  66.  
  67. Regards,
  68.  
  69. Dave.
  70. --
  71. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
  72. =   David E. Filip                UUCP   : dfilip@colornet.com              =
  73. =   ColorNet Information Systems  CIS    : 76430,3111                       =
  74. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
  75. =     Standards are wonderful 'cause there are so many to choose from !     =
  76. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
  77.