home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / sys / sun / admin / 8209 < prev    next >
Encoding:
Text File  |  1992-11-12  |  6.7 KB  |  134 lines

  1. Newsgroups: comp.sys.sun.admin
  2. Path: sparky!uunet!destroyer!cs.ubc.ca!van-bc!tfic.bc.ca!tbr
  3. From: tbr@tfic.bc.ca (Tom Rushworth (V))
  4. Subject: Re: DAT's on 4.1.2
  5. Message-ID: <1992Nov12.234219.21889@tfic.bc.ca>
  6. Summary: 4.1.1 worked, 4.1.2 doesn't
  7. Organization: Timberline Forest Inventory Consultants
  8. References: <2592@bigfoot.first.gmd.de> <BxJpsC.68J@immd4.informatik.uni-erlangen.de>
  9. Date: Thu, 12 Nov 1992 23:42:19 GMT
  10. Lines: 122
  11.  
  12. We've just upgraded our machines from SunOS 4.1.1 to 4.1.2, and have found
  13. a problem with our Archive Python dat drive.  We've tried changing machines,
  14. cables and drives, but the problem persists.  It looks like the problem is
  15. in the 4.1.2 SCSI tape drivers - has anyone else seen this?  Does anyone
  16. have a suggestion?
  17.  
  18. The problem is that at some point (many MB into the backup) we get what
  19. appears to be a SCSI renegotiation for synchronous (possibly from a SCSI
  20. bus reset?) that is taken as an error by the 4.1.2 SCSI driver. All we
  21. see (in the write case) is the console message that the target is now
  22. synchronous.  I don't know how to find out what caused it to renegotiate.
  23. Gory details are below....
  24.  
  25. We have the st_conf.c entry for the DAT drive as follows:
  26. ---------------------------------------------------------
  27. /* Local addition for ArchiveST DAT drive systems */
  28. /* Added 1992 Nov 09 - tbr */
  29. /* Modifications Copyright 1992 Archive Corporation */
  30. {
  31.         "ArchiveST 4mm DAT/DAT-DC", 14, "ARCHIVE Python",
  32.         0x30, 512,
  33.         (ST_KNOWS_EOD | ST_BSF | ST_BSR | ST_VARIABLE),
  34.         5000, 5000,
  35.         { 0, 0, 0, 0 }, { 0, 0, 0, 0 }
  36. },
  37. ---------------------------------------------------------
  38.  
  39. The following was extracted from /var/adm/messages, with the dates,
  40.  "virgil vmunix" and some spacing compressed.....
  41.  
  42.     17:26 - machine booted with new kernel, DAT configured for SCSI-2
  43.  
  44.      17:26:49 vv: SunOS Release 4.1.2 (VIRGIL) #1: Mon Nov 9 14:43:42 PST 1992
  45.        ...
  46.      17:26:49 vv: esp0 at SBus slot 0 0x800000 pri 3
  47.      17:26:49 vv: esp0: Target 0 now Synchronous at 4.0 mb/s max transmit rate
  48.      17:26:49 vv: sd3 at esp0 target 0 lun 0
  49.      17:26:49 vv: sd3: <Wren V 94181-702 cyl 1530 alt 2 hd 15 sec 52>
  50.      17:26:49 vv: esp0: Target 4 now Synchronous at 4.0 mb/s max transmit rate
  51.      17:26:49 vv: st0 at esp0 target 4 lun 0
  52.      17:26:49 vv: st0: <ArchiveST 4mm DAT/DAT-DC>
  53.        ...
  54.  
  55.     17:27 - insert tape, try "mt -f /dev/rst[01] status" to check message
  56.  
  57.      17:27:47 vv: esp0: Target 4 now Synchronous at 4.0 mb/s max transmit rate
  58.   
  59.     17:31 - start (the world's biggest, ugliest) backup shell script
  60.  
  61.      17:31:35 vv: esp0: Target 4 now Synchronous at 4.0 mb/s max transmit rate
  62.  
  63.     20:28 - office deserted - backup dies with write error somewhere in
  64.                               last file to be backed up (approx 650M written
  65.                               successfully, in earlier files)
  66.  
  67.      20:28:18 vv: esp0: Target 4 now Synchronous at 4.0 mb/s max transmit rate
  68.      20:28:18 vv: st0: Error for command 'write', Error Level: 'Fatal'
  69.      20:28:18 vv: Block: 2404 File Number: 6
  70.      20:28:18 vv: Sense Key: Media Error
  71.      20:28:18 vv: Vendor (ArchiveST 4mm DAT/DAT-DC) Unique Error Code: 0x3b
  72.      20:28:18 vv: esp0: Target 4 now Synchronous at 4.0 mb/s max transmit rate
  73.      20:28:18 vv: st0: Error for command 'write file mark', Error Level: 'Fatal'
  74.      20:28:18 vv: Block: 2404
  75.      20:28:18 vv: Sense Key: Media Error
  76.      20:28:18 vv: Vendor (ArchiveST 4mm DAT/DAT-DC) Unique Error Code: 0x3b
  77.   
  78.     06:30 - next morning - try reading last (supposedly) successfully
  79.                            written file with the following results:
  80.  
  81.      06:28:25 vv: esp0: Target 4 now Synchronous at 4.0 mb/s max transmit rate
  82.           - much reading happens ..., then BOOM!
  83.      07:13:46 vv: esp0: Disconnected command timeout for Target 4 Lun 0
  84.      07:13:46 vv: st0:     transport completed with timeout
  85.      07:13:46 vv: st0:     attempting a device reset
  86.      07:13:46 vv: st0:     SCSI transport failed: reason 'timeout': giving up
  87.      07:13:53 vv: esp0: Target 4 didn't disconnect after sending COMMAND COMPLETE
  88.      07:13:53 vv: st0:     transport completed with tran_err
  89.      07:13:53 vv: st0:     attempting a device reset
  90.      07:13:53 vv: st0:     attempting a bus reset
  91.      07:13:53 vv: esp0: spurious interrupt
  92.      07:13:56 vv: esp0:    ILLEGAL bit set
  93.      07:13:56 vv:  State=SELECT_SNDMSG Last State=FREE
  94.      07:13:56 vv:  Latched stat=0x16<XZERO,MSG,CD> intr=0x40<ILL> fifo 0x20
  95.      07:13:56 vv:  last msg out: <unknown msg 0xff>; last msg in: <unknown msg 0xff>
  96.      07:13:56 vv:  DMA csr=0x96400210<EN,INTEN>
  97.      07:13:56 vv:  addr=fff00000 last=fff00000 last_count=1
  98.      07:13:56 vv:  Cmd dump for Target 0 Lun 0:
  99.      07:13:56 vv:  cdb=[ 0xa 0x0 0x0 0x50 0x10 0x0 0x0 0x0 0x0 0x0 ]
  100.      07:13:56 vv:  pkt_state 0x0 pkt_flags 0x0 pkt_statistics 0x0
  101.      07:13:56 vv:  cmd_flags=0x23 cmd_timeout 35
  102.      07:13:56 vv:  Mapped Dma Space:
  103.      07:13:56 vv:          Base = 0x6000 Count = 0x2000
  104.      07:13:56 vv:  Transfer History:
  105.      07:13:56 vv:          Base = 0x6000 Count = 0x0
  106.      07:13:56 vv:  current phase 0x60=SELECT_SNDMSG  stat=0x16  0x0  0x0
  107.      07:13:56 vv:  current phase 0x23=SYNCHOUT     stat=0x16 0x2d    0xf
  108.      07:13:56 vv:  current phase 0x21=PREEMPTED    stat=0x0 0x4     0x0
  109.      07:13:56 vv:  current phase 0x60=SELECT_SNDMSG  stat=0x0   0x4  0x0
  110.      07:13:56 vv:  current phase 0x23=SYNCHOUT     stat=0x0 0x2d    0xf
  111.      07:13:56 vv:  current phase 0x1c=RESET        stat=0x0 0x10
  112.      07:13:56 vv:  current phase 0x1c=RESET        stat=0x0 0x7
  113.      07:13:56 vv:  current phase 0x1c=RESET        stat=0x0 0x10
  114.      07:13:56 vv:  current phase 0x1c=RESET        stat=0x13 0x7
  115.      07:13:56 vv:  current phase 0x5=MSG_IN        stat=0x13 0x0
  116.      07:13:56 vv:  current phase 0x27=STATUS       stat=0x13 0x2
  117.      07:13:56 vv:  current phase 0xb=CMD_CMPLT     stat=0x13
  118.      07:13:56 vv:  current phase 0x60=SELECT_SNDMSG  stat=0x10  0x4  0x0
  119.      07:13:56 vv:  current phase 0x23=SYNCHOUT     stat=0x10 0x2d    0xf
  120.      07:13:56 vv:  current phase 0xb=CMD_CMPLT     stat=0x17 0x2000
  121.      07:13:56 vv:  current phase 0x27=STATUS       stat=0x17 0x0
  122.      07:13:56 vv: sd3:  SCSI transport failed: reason 'reset': retrying command
  123.      07:13:56 vv: st0:     transport completed with reset
  124.      07:13:56 vv: esp0: Target 0 now Synchronous at 4.0 mb/s max transmit rate
  125.  
  126. I'm more concerned about being able to write the tape than read it at the
  127. moment (who needs to read a backup anyway? :)), since I suspect that if I can
  128. find and fix the write problem the read problem may well go away too.
  129.  
  130. Any ideas or suggestions appreciated!  Thanks.
  131. ----
  132. Tom Rushworth (604) 733-0731 [FAX: 733-0634] | uunet!ubc-cs!van-bc!tacitus!tbr
  133.    Timberline Forest Inventory Consultants   | or: tbr@tfic.bc.ca
  134.