home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / sys / sun / admin / 10757 < prev    next >
Encoding:
Internet Message Format  |  1993-01-26  |  5.8 KB

  1. Xref: sparky comp.sys.sun.admin:10757 comp.periphs.scsi:6708
  2. Newsgroups: comp.sys.sun.admin,comp.periphs.scsi
  3. Path: sparky!uunet!munnari.oz.au!uniwa!bilby.cs.uwa.oz.au!dunnart!janet
  4. From: janet@cs.uwa.oz.au (Janet Jackson)
  5. Subject: Help! Worrying behaviour of Exabyte 8500C
  6. Message-ID: <janet.728032198@dunnart>
  7. Summary: retries on dumps; strange behaviour of LEDs; write errors
  8. Sender: usenet@bilby.cs.uwa.edu.au
  9. Nntp-Posting-Host: dunnart
  10. Organization: Dept. Computer Science, University of Western Australia.
  11. Date: Tue, 26 Jan 1993 07:09:58 GMT
  12. Lines: 134
  13.  
  14. (Please excuse the crosspost.  I'm not sure whether it's a SunOS software
  15. or Exabyte hardware problem.)
  16.  
  17. Environment:  Third-party Exabyte 8500C (5Gb 8mm drive with hardware
  18. compression interface) connected to Sun 4/470 server running SunOS 4.1.1.
  19. I mostly use it for dumps.
  20.  
  21. The Exabyte has been acting up lately.  There are three main symptoms,
  22. which may or may not be related.  They all seemed to start happening
  23. at about the same time, though.
  24.  
  25. The first symptom is strange.  The second symptom is REALLY strange.
  26.  
  27. FIRST SYMPTOM:
  28.  
  29. The first symptom I noticed is error messages like:
  30.  
  31. Jan 26 14:17:44 wambenger vmunix: st2:  warning, the tape may be wearing out or
  32. Jan 26 14:17:44 wambenger vmunix:       the head may need cleaning.
  33. Jan 26 14:17:44 wambenger vmunix: st2:  write retries= 685 (4.1%), file= 3, block
  34.  
  35. on just about every dump.  The dumps are written OK.  I get read retries on
  36. restores, too.
  37.  
  38. Each night my automatic backups cat a short ascii label to the front of the
  39. tape, then dump 29 filesystems.  The cat doesn't give any error messages,
  40. but each dump after that gives two:  one each for the first and last block of
  41. the file.  The number of retries increases from near-zero to 32000-odd, at
  42. about the 25th file; after that it's large negative numbers and ridiculous
  43. percentages, like 700% -- presumably this is overflow.  This seems to imply
  44. that the errors are not real, but that some error counter is being incremented
  45. incorrectly.
  46.  
  47. Dumps I've done manually only seem to give one error message -- perhaps the
  48. double messages are an artifact of the automatic backup software.
  49.  
  50. Once the error has started happening to dumps on a given tape, it continues
  51. to do so until the tape is ejected.  After that, if you use the same tape
  52. again, it may work OK for a while, but once the error occurs once it
  53. will happen again on subsequent dumps, again, until you eject the tape.
  54. It's as if there's some sort of status in the drive that gets reset when you
  55. eject.
  56.  
  57. Cleaning the heads does not help.
  58. Replacing the tape does not help either, although in one of my tests,
  59. a new tape did not exhibit the problem the first time I dumped on it.
  60. This has not generally been the case, though.
  61.  
  62. Before you say "FAQ":  I installed patch 100134-03, which is supposed to
  63. stop spurious messages of this sort, but it hasn't helped.
  64.  
  65. As far as I can tell it is only dump that produces these messages.
  66. cat, dd, cpio and tar all work normally, on both new and "second-hand" tapes.
  67. (Maybe because of different blocksizes?)
  68.  
  69. These messages are the least annoying of the symptoms, since the dumps
  70. do work.  However:
  71.  
  72.  
  73. SECOND SYMPTOM:
  74.  
  75. This is the most worrying of all.
  76.  
  77. Normally when the Exabyte is writing to the tape, the amber LED flashes a
  78. lot, indicating SCSI activity (according to the manual), and the green
  79. LED occasionally flashes slowly, indicating normal tape motion.
  80.  
  81. However, I have lately noticed that during the occasional dump (no more than
  82. one in 30) the green LED flashes slowly most of the time, and the amber
  83. LED only occasionally.  When this is happening the dump runs about 30 times
  84. as slow as usual.  It's as if it's looking for a good place to write on
  85. the tape!  However, just because one dump on a given tape does it, doesn't mean
  86. that another one will.
  87.  
  88. I have no idea under what conditions this occurs.  I certainly can't _make_
  89. it happen!  It's happened on various tapes (new and old; different brands);
  90. it's happened just after I cleaned the heads as well as when I hadn't cleaned
  91. them for ages;  other activity on the SCSI bus doesn't seem to make any
  92. difference.
  93.  
  94. I've only ever seen this happen during dump, but then I hardly ever use
  95. tar, cpio, etc on this tape drive.
  96.  
  97.  
  98. THIRD SYMPTOM:
  99.  
  100. We have had an unusual amount of write errors (hard errors, causing dumps
  101. to fail) lately.  By "unusual", I don't mean it fails constantly -- I mean
  102. three in the last month.  One of them seems to show that it is not the tape
  103. that's at fault:  on 23/01 a write error occurred 17 feet into the first dump
  104. on a tape.  I tried the SAME TAPE again for last night's dumps, and no error
  105. occurred.
  106.  
  107.  
  108. WHAT'S CHANGED?
  109.  
  110. I first noticed these problems in late December.  What have I changed
  111. shortly before that time?
  112.  
  113. - I've installed patch 100570-03, an ethernet controller patch (surely
  114.   irrelevant!)
  115.  
  116. - I used some new tapes of a different brand: Verbatim DL112M, rather
  117.   than our usual Sony QG-112M.
  118.  
  119.  
  120. NOTES
  121.  
  122. The Sun 4/470 doesn't have an 8500 driver.  It thinks the drive is an 8200,
  123. but that's never seemed to make any difference to its operation.
  124. Should I install a proper driver?  If so, where can I get one?
  125.  
  126. I've only ever used data-quality tapes in it, never video tapes.
  127. I clean the heads regularly with an Exatape cleaning cartridge from Exabyte.
  128.  
  129.  
  130. SO WHAT'S WRONG?
  131.  
  132. Has anyone come across this before (especially the second symptom, the LEDs)?
  133.  
  134. Do you think the heads are damaged?  The compression interface, perhaps?
  135. Some other internal component?  Could changes in humidity or in the power
  136. supply affect it?  Could having a heavy Sun Desktop Storage Module on top
  137. of it be getting to it, even though it has worked perfectly in this
  138. condition for almost a year?
  139.  
  140. If you have any thoughts about this, please email them to me.
  141. I will summarise if there's interest.
  142.  
  143. Janet Jackson
  144. <janet@cs.uwa.edu.au>
  145. Systems Administrator
  146. Department of Computer Science
  147. The University of Western Australia
  148.