home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / sys / next / sysadmin / 4679 < prev    next >
Encoding:
Text File  |  1992-08-15  |  8.0 KB  |  178 lines

  1. Newsgroups: comp.sys.next.sysadmin
  2. Path: sparky!uunet!cs.utexas.edu!asuvax!ncar!csn!nugget.rmNUG.ORG!tssnext.rmNUG.ORG!bruce
  3. From: bruce@tssnext.rmNUG.ORG
  4. Subject: Re: Internal SCSI error
  5. Message-ID: <1992Aug16.081957.3652@tssnext.rmNUG.ORG>
  6. Reply-To:  <bruce@TotSysSoft.com> (Bruce Gingery)
  7. Organization:  Total System Software
  8. References: <Aug.10.09.04.03.1992.20063@dartagnan.rutgers.edu>
  9. Date: Sun, 16 Aug 1992 08:19:57 GMT
  10. Lines: 166
  11.  
  12. Sorry to take so long answering...  We just had the EXACT same symptoms,
  13. and while I cannot guarantee that what it was for us will be the exact
  14. same thing as you're suffering, it seems quite likely...
  15.  
  16. ssietz@dartagnan.rutgers.edu (Steven Sietz) writes:
  17. : Help!  My SCSI disk [internal] won't boot and I can't get up!
  18. : I came in this morning and saw my NeXT Cube attempting to boot up but was 
  19. : stuck in the startup sequence "Testing System" and "Loading from Disk" 
  20. : followed by a "SCSI Error".
  21. : I put it in the ROM monitor and tried a "bsd" and got the following:
  22. : NeXT>bsd
  23. : boot sd(0,0,0)
  24.  
  25. -- Booting SCSI with defaults
  26.  
  27. : booting SCSI target 1,  lun 0
  28. : sdmach: not a directory
  29. : sdmach: not found
  30. : load failed
  31.  
  32. : blk0 boot:
  33.  
  34. -- Your BOOT RECORD on the Hard drive is clobbered.  While it MAY be possible
  35. to boot from one of the alternates (for us it wasn't), it's time to look at
  36. re - low-level (SCSI level) formatting the drive.
  37.  
  38. Despite much talk over in the MS-DOS World, with the Integrated-Drive-Elect-
  39. ronics drives (IDE) ``not requiring LLF'', unless the controller re-maps on
  40. the fly, which is normally an ESDI feature, not found on SCSI drives, the mag-
  41. netic capacity of the ``tracks'' changes over time, even if no surface defects
  42. arise to clobber the drive.
  43.  
  44. : I was out last week but I am told that someone tried to scan in a large
  45. : image and then the system hung.  They then hit the power key to try and
  46. : reboot and then it sat for an hour trying to come back up.  It obviously
  47. : didn't.
  48.  
  49. Likely a coincidence, though it is possible that configuration errors caused
  50. a wrap from the last cylinder on your disk to overwrite cylinder zero.
  51.  
  52. : The worst part about this is that we didn't back up the system (we have no 
  53. : OD media).  Any help would be *greatly* appreciated.  
  54.  
  55. I DO hope you have your distribution OD!, as this is apt to be your best way
  56. of getting back up.  I'll describe what WE did.  WE LOST NOTHING but time :),
  57. and ended up ahead of where we had been, cleaning up some strange NetInfo
  58. structures.
  59.  
  60. :         Thanks!
  61. :             -Steve-
  62. : PS.  No NeXTmail please, just regular email (until this thing gets
  63. : fixed).
  64. : -- 
  65. : Steven Sietz            |  Internet:  ssietz@cs.rutgers.edu
  66. : 77A West Bluebell Lane  |  uucp:      {backbone}!rutgers!cs.rutgers.edu!ssietz
  67. : Mount Laurel, NJ 08054  |
  68.  
  69. FIRST
  70.    Allocate a day or so for the following :) depending on your H/D size and
  71.    your communication paths, and just how much recent additions you want to
  72.    be able to rescue since your last full or incremental backup.
  73.  
  74.    Boot from an alternate.  This may be the distribution OD (for us it was).
  75.  
  76. SECOND
  77.    Using the mount(8) command in a shell, ``manually'' mount the SD onto the
  78.    filesystem which is now based on the alternate boot device.  If you're
  79.    limited to NetBoot, you may find someone with more Net experience than I
  80.    have yet developed to help.
  81.  
  82. THIRD
  83.    Now, SAVE whatever you wish/need/must save... This is an emergency condition,
  84.    so you may want to write places you normally wouldn't want to -- i.e. the
  85.    OD, a borrowed disk, whatever.  At worst, you can set up a temporary LAN
  86.    or high-speed serial connection to save-off your salvagable materials.  Our
  87.    option, at the time, was a 38400bps null-modem connection to a non-compat
  88.    ible machine, using one of the LHARC utilities to preserve links, paths,
  89.    filenames with embedded spaces, sticky & suid/sgid directory attributes.
  90.    Many things we arced off, we did so by deliberate choice, to save the post-
  91.    restore debugging, rather than out of absolute need.  Though we wouldn't
  92.    have needed to, we generally used 8+3 (MS-DOS compatible) filenames as a
  93.    precaution, on the output archives.  You could use tar+compress if that
  94.    is all you have, or with plenty of off-machine storage, and a LAN-speed
  95.    link, you may be able to just drag directory trees across, intact.  See 
  96.    TIPS below!
  97.  
  98. FOURTH
  99.    use disk(8) with the -f switch to re-low-level format the drive.  CAUTION
  100.    this switch is NOT documented in part-8 of the Unix manual, but is docu-
  101.    mented internally in the program, displayable with ``/usr/etc/disk'' with
  102.    no parameters.  THIS WILL DESTROY ALL DATA ON THE DRIVE, but hopefully will
  103.    restore the SCSI device to a working drive.  This should re-map bad spots
  104.    on the disk so that they are not written to.
  105.  
  106. FIFTH
  107.    Re-Install your NeXT operating system, cleanly, from a distribution disk.
  108.    This is the equivalent of a High-level-format, writing the swapfile, SDMACH
  109.    etc to the drive, and updating boot records to point to it.
  110.  
  111. FINALLY
  112.    Re-install the things that make it YOUR system... The things you backed up.
  113.  
  114.  
  115. TIPS
  116.    Many of the things you will wish to save are the very things you don't often
  117.    change, unless you have a development system.  If you know you already have
  118.    a backup copy of these available, from your own system, don't worry about
  119.    these.  If there's a chance that you've changed things... you may want 
  120.    to grab them during this backup, just to be sure.
  121.  
  122.    First, if you (like most of us) are running a NetInfo system, you probably
  123.    have lost additional users, devices, services, and the like.  If you have
  124.    been dumping your NetInfo to the non-NetInfo files [nidump(1)]...
  125.  
  126.     aliases, bootptab, bootparams, fstab, group, hosts
  127.     networks, passwd, printcap, protocols, rpc, services
  128.  
  129.    There are quite a few possible NetInfo items that are NOT covered by these.
  130.    In addition to this, your crontab.local, /etc/sendmail/*, etc/uucp/* 
  131.    /usr/lib/news/*, /usr/lib/newsbin/*, perhaps your /usr/spool/news/*, any 
  132.    outgoing or untossed incoming /usr/spool/uucp/* datafiles.  If you utilize 
  133.    accounting statistics, you may want to save things in /usr/adm/*.   If there
  134.    are any non-zero-length mailbox files in /usr/spool/mail, or any undelivered
  135.    messages in /usr/spool/mqueue, you may want to grab these.  Many things are 
  136.    hard to advise, as there are so many options which CAN change your needs.
  137.  
  138.    You will likely want to save ~/.NeXT/* except for .NextTrash, though this
  139.    is usually not essential, and ~/Apps/*, ~/Library/*.   Definitely any
  140.    /usr/local/* and /LocalLibrary/* + /LocalApps/* - if you have made any such
  141.    additions to your system.  If you have multiple users, you may want ~/*
  142.    for each, though it may be that all you have is a / - root account and a
  143.    /me/* account on your system.   REMEMBER -- MANY UTILITIES DEFAULT TO NOT
  144.    HANDLING HIDDEN FILES (those starting with a `.') and even many which will
  145.    forget to traverse directories with a leading `.' when operating in a re-
  146.    cursive tree-walking mode.
  147.  
  148.    Now is the time to be VERY methodical!  If you're tar'ing up a directory
  149.    tree, go ahead and use the verbose switch, and compress in a separate step.
  150.    Compare the listing with a ``Unix expert'' directory listing.  What's gone
  151.    after you re-LLF the drive is gone forever.
  152.  
  153.    Finally, in your backup, watch for symbolic links.  You may end up with
  154.    a compressed backup that is larger than the original, and more importantly
  155.    one which will not even fit when you attempt to copy it back...
  156.  
  157.    Handy aliases for your shell while backing off...
  158.  
  159.         alias arc (your selected archiver with switches and \!* )
  160.         alias dir "ls -gulFa \!*"
  161.         alias tree "find . -type d -print"
  162.  
  163.    Using that `dir' in place of `ls' you may find things you never knew
  164.    you had :).
  165.  
  166.    Also, look at the follow-on post about dumping NetInfo...
  167.  
  168. Bruce
  169. -- 
  170. Bruce Gingery          bruce@TotSysSoft.com        (Total System Software)
  171. InterNet:  Bruce.Gingery@p1.f5.n310.z1.fidonet.org (  Cheyenne, Wyoming )
  172.        or  bruce@brucext.TotSysSoft.com
  173. NeXT-Mail: bruce@tssnext.rmNUG.org  < -or- > bruce@TotSysSoft.com
  174.