home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #27 / NN_1992_27.iso / spool / comp / sys / sgi / 16669 < prev    next >
Encoding:
Text File  |  1992-11-19  |  2.0 KB  |  46 lines

  1. Newsgroups: comp.sys.sgi
  2. Path: sparky!uunet!zaphod.mps.ohio-state.edu!darwin.sura.net!sgiblab!sgigate!sgi!fido!zola!zuni!anchor!olson
  3. From: olson@anchor.esd.sgi.com (Dave Olson)
  4. Subject: Re: bru killed due to bad page read (errno:0)
  5. Message-ID: <sitnuek@zuni.esd.sgi.com>
  6. Sender: news@zuni.esd.sgi.com (Net News)
  7. Organization:  Silicon Graphics, Inc.  Mountain View, CA
  8. References: <1992Nov19.130533.29469@sun1.ruf.uni-freiburg.de>
  9. Date: Thu, 19 Nov 92 23:47:08 GMT
  10. Lines: 34
  11.  
  12. In <1992Nov19.130533.29469@sun1.ruf.uni-freiburg.de> kleinren@sun1.ruf.uni-freiburg.de (Rainer Kleinrensing) writes:
  13.  
  14. | Hello there,
  15. | yesterday night I had cron execute the following command:
  16. | bru -cmvBf /dev/tape -s 4000M / /usr /usr/people 
  17. | where /dev/tape is our DAT drive (HP, non-SGI).
  18. | This morning I found the following lines in SYSLOG:
  19. | Nov 19 04:08:35 elan1 unix: sc0,5,0: cmd=0x28 timeout after 30 sec.  Resetting S
  20. | CSI bus
  21. | Nov 19 04:08:39 elan1 unix: dks0d1s0 (/): retrying request
  22. | Nov 19 04:08:39 elan1 unix: 
  23. | Nov 19 04:08:39 elan1 unix: WARNING: Process [bru] pid 9953 killed due to bad pa
  24. | ge read (errno:0)
  25. | Nov 19 04:08:39 elan1 unix: dks0d5s7 (/usr): retrying request
  26.  
  27. The problem is almost certainly a SCSI bus problem.  Whatever is at ID 5
  28. (probably a disk, judging by the cmd byte (an extended read) timed out.
  29. This could be a firmware problem on the drive, some device grabbing the
  30. SCSI bus and holding it for more than 30 seconds (after the drive took
  31. the command, and disconnected, but wasn't able to reconnect because
  32. the bus was busy), or cabling/termination problems.  The cabling
  33. is almost always the cause.
  34.  
  35. Anyway, the resulting SCSI bus reset apparently caused a read from
  36. the system disk to fail, even after a retry, and therefore bru
  37. was blown away, since there really isn't any way to recover from
  38. that at the VM level.
  39. --
  40. Let no one tell me that silence gives consent,  |   Dave Olson
  41. because whoever is silent dissents.             |   Silicon Graphics, Inc.
  42.     Maria Isabel Barreno                        |   olson@sgi.com
  43.