home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #20 / NN_1992_20.iso / spool / comp / unix / ultrix / 6705 < prev    next >
Encoding:
Internet Message Format  |  1992-09-07  |  7.0 KB

  1. Path: sparky!uunet!stanford.edu!agate!agate!robm
  2. From: robm@ataraxia.Berkeley.EDU (Rob McNicholas)
  3. Newsgroups: comp.unix.ultrix
  4. Subject: SCSI/CAM problems
  5. Date: 4 Sep 92 15:01:16
  6. Organization: Technical and Computing Services, U.C. Berkeley, Berkeley, CA
  7. Lines: 164
  8. Distribution: world
  9. Message-ID: <ROBM.92Sep4150116@ataraxia.Berkeley.EDU>
  10. NNTP-Posting-Host: ataraxia.berkeley.edu
  11.  
  12. Hi everyone,
  13.  
  14. I've recently installed the Open SCSI/CAM software on my DECstation,
  15. and I'm suddenly having some inexplicable (by me) problems with my
  16. tape drives.  Here's the scenario:
  17.  
  18. System: DEC5000/125, Ultrix 4.2C
  19.     scsi bus#0: one RZ57
  20.                     one RRD42
  21.             two EXB-8200 8mm drives Mountain Filesafe 2100D (Rev 252X)
  22.  
  23.     scsi bus#1: two RZ57s
  24.             one TZK50
  25.                     one EXB-8200 (same as above)
  26.  
  27.  
  28. As you may have guessed, this machine is used as a "dump server".  We
  29. have not changed our usage pattern since the upgrade, (i.e. we're not
  30. doing anything we didn't do before).  We write out dumps with a block
  31. size of 126b (64512 bytes).
  32.  
  33. We now seem to get an inordinate number of CAM errors occurring
  34. randomly during dumps, as well as reproducible errors from certain
  35. utilities.  Attached at then end of this message is sample output from
  36. uerf and cam_report.
  37.  
  38. This particular error given in the example was caused by using the
  39. public domain "copytape" program, by David S. Hayes.  The program
  40. aborts in a read() with an ENOSPC error (the actual error output is:
  41. "copytape: can't read input: I/O error").  This is consistenly
  42. reproducible from any tape drive.  Now we can't make duplicates of our
  43. backups anymore :-( I saw a note in the CAM release notes that
  44. mentioned a problem with model 100 machines returning the wrong number
  45. of bytes on odd-byte tranfers.  Could this be related?  The code looks
  46. like it's doing the right thing (checking the return value of the
  47. read() call for the actual number of bytes tranferred).
  48.  
  49. I should point out that we can still read this tape "dd ibs=126b
  50. if=/dev/nrmtNh | zcat | restore if -".
  51.  
  52. Anyone having similar experiences?  Anyone have any suggestions?
  53.  
  54. If I decide to back out on this "upgrade", will I have to reinstall
  55. the 4.2A kernel config files?  (I'd hate to have to do that since I've
  56. since installed a bunch of patches.)
  57.  
  58. Thanks for any help, and apologies for the length of this message.
  59.  
  60. -Rob
  61. --
  62. Rob McNicholas             Technical & Computing Services, EECS, U.C. Berkeley
  63. robm@ataraxia.berkeley.edu  Voice: 510/642-8633  FAX: 510/643-7846
  64.  
  65.  
  66. uerf reports these errors as:
  67.  
  68.     ----- EVENT INFORMATION -----
  69.  
  70.     EVENT CLASS                             ERROR EVENT
  71.     OS EVENT TYPE                  199.     CAM SCSI
  72.     SEQUENCE NUMBER                  8.
  73.     OPERATING SYSTEM                        ULTRIX 32
  74.     OCCURRED/LOGGED ON                      Fri Sep  4 14:01:30 1992 PDT
  75.     OCCURRED ON SYSTEM                      ataraxia.Ber
  76.     SYSTEM ID                 x82030230     HW REV: x30
  77.                         FW REV: x2
  78.                         CPU TYPE: R2000A/R3000
  79.     PROCESSOR TYPE                          KN02-BA
  80.  
  81.     ----- UNIT INFORMATION -----
  82.  
  83.     CLASS                                   TAPE
  84.     SUBSYSTEM
  85.     BUS #                         x0001
  86.                         LUN x0
  87.                         TARGET x1
  88.  
  89. cam_report gives this more verbose, but just as incomprehensible (to
  90. me) output:
  91.  
  92.     Sequence number of error: 8
  93.     Time of error entry: Fri Sep  4 14:01:30 1992
  94.  
  95.     Host name: ataraxia.Ber
  96.     SCSI CAM ERROR PACKET
  97.     Controller type: UNKNOWN
  98.     SCSI device class: TAPE
  99.     Bus Number: 1
  100.     Target number: 1 Lun Number: 0
  101.     Routine Name: ctape_iodone
  102.     Routine Error Message: Hard Error Detected
  103.     Device Name: EXABYTE EXB-8200
  104.     Routine Message: Active CCB at time of error
  105.     Routine Message: CCB request completed with an error
  106.  
  107.     Dumping SCSI I/O CCB at 0x1000e158:
  108.  
  109.     CCB Header:
  110.     Address of this CCB .................... *my_addr: 0xc1a12df0
  111.     Length of the entire CCB ............ cam_ccb_len: 0x8c
  112.     The XPT function code ............. cam_func_code: 0x1 (XPT_SCSI_IO)
  113.     CAM subsystem status ................. cam_status: 0xc4 (CCB request completed w
  114.     ith an error)
  115.     Path ID for the request ............. cam_path_id: 0x1
  116.     Target device ID .................. cam_target_id: 0x1
  117.     Target LUN number ................ cam_target_lun: 0x0
  118.     Operation flags for subsystem ......... cam_flags: 0x40
  119.         CAM Flags Set:
  120.         CAM_DIR_IN = Data direction is 'DATA IN'.
  121.  
  122.     Peripheral driver pointer ......... *cam_pdrv_ptr: 0xc1a12c18
  123.     Next CCB pointer .................. *cam_next_ccb: 0x0
  124.     Request mapping info pointer ....... *cam_req_map: 0xc1a98000
  125.     Callback completion function ........ *cam_cbfcnp: 0x80145a04
  126.     Data buffer/SG list pointer ....... *cam_data_ptr: 0x100019c0
  127.     Data transfer length .............. cam_dxfer_len: 262144 (0x40000)
  128.     Sense data buffer pointer ........ *cam_sense_ptr: 0xc1a12c30
  129.     Sense data buffer length .......... cam_sense_len: 64
  130.     Number of bytes in this CDB ......... cam_cdb_len: 6
  131.     Scatter gather list entries ...... cam_sglist_cnt: 0
  132.     SCSI device status code ......... cam_scsi_status: 0x2 (SCSI_STAT_CHECK_CONDITION)
  133.     Autosense residual length ....... cam_sense_resid: 38
  134.     Transfer residual length .............. cam_resid: 262144
  135.     Command descriptor block in CCB at..cam_cdb_bytes: 0x1000e194
  136.     Command descriptor block bytes ....... cam_cdb_io: 8 0 4 0 0 0
  137.     Command timeout value ............... cam_timeout: 326 seconds
  138.     Message buffer pointer ............. *cam_msg_ptr: 0x0
  139.     Message buffer length .............. cam_msgb_len: 0
  140.     Vendor unique flags ................ cam_vu_flags: 0x0
  141.     Tag queuing action ............... cam_tag_action: 0x0
  142.  
  143.  
  144.             ############### Entry End ###############
  145.  
  146.     Routine Message: Error, exception, or abnormal condition
  147.     Routine Message: Illegal request or CDB parameter
  148.  
  149.     Dumping Request Sense Data at 0x1000e278:
  150.     Error code ...................... : 0x0
  151.     Error class ..................... : 0x7
  152.     Information fields valid ........ : 0
  153.     Segment number .................. : 0x0
  154.     Sense Key ....................... : 0x5 (Illegal request or CDB parameter)
  155.     Illegal length indicator ........ : 0
  156.     End of medium ................... : 1
  157.     Tape file mark detected ......... : 0
  158.     Information byte 3 .............. : 0x0
  159.     Information byte 2 .............. : 0x0
  160.     Information byte 1 .............. : 0x0
  161.     Information byte 0 .............. : 0x0
  162.     Additional sense length ......... : 0x12
  163.     Command information byte 3 ...... : 0x0
  164.     Command information byte 2 ...... : 0x0
  165.     Command information byte 1 ...... : 0x0
  166.     Command information byte 0 ...... : 0x0
  167.     Additional sense code ........... : 0x0
  168.     Additional sense qualifier ...... : 0x0
  169.     Sense Code/Qualifier Message .... : No additional sense information
  170.     Field replaceable unit code ..... : 0x0
  171.     Additional sense bytes .......... : 0x0 0x0 0x0 0x0 0x0 0x1 0x20 0x0 0x0 0x22 0xfc
  172.  
  173. --
  174. Rob McNicholas             Technical & Computing Services, EECS, U.C. Berkeley
  175. robm@ataraxia.berkeley.edu  Voice: 510/642-8633  FAX: 510/643-7846
  176.