home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #20 / NN_1992_20.iso / spool / comp / unix / bsd / 5235 < prev    next >
Encoding:
Text File  |  1992-09-08  |  2.8 KB  |  72 lines

  1. Newsgroups: comp.unix.bsd
  2. Path: sparky!uunet!mcsun!sunic!psinntp!psinntp!dg-rtp!ponds!rivers
  3. From: rivers@ponds.uucp (Thomas David Rivers)
  4. Subject: Some more on NMI problems (some meager advancement)
  5. Message-ID: <1992Sep7.014351.946@ponds.uucp>
  6. Date: Mon, 7 Sep 1992 01:43:51 GMT
  7. Lines: 63
  8.  
  9.  
  10. Well, I thought I would relay my current status with the NMI
  11. investigation.
  12.  
  13.   Right now, I'm thinking it has something to do with an IDE
  14.  controller/disk drive, so I have been examining the wd.c driver
  15.  trying to divine what it might be; without too much luck. (I 
  16.  know very little about the IDE/WD disk controllers.)
  17.  
  18.   The common thread seems to be:
  19.     1) It happens during some prolonged disk I/O
  20.          (i.e. rebuilding the kernel over-and-over, or building X)
  21.     2) It happens with IDE drives, other people have run my test
  22.         (rebuilding the kernel) with a SCSI drive, 486-33 and 16meg
  23.         without finding any NMIs.
  24.  
  25.  I have tried several switches on my controller; 
  26.  
  27.    1) Having the disk drive/controller assert IOCHRDY (by default it
  28.       doesn't.)
  29.    2) Changing the "precompensation" (which I don't believe is
  30.       related to disk precompensation) from 125ns to 187ns.
  31.    3) Changing the speed of the processor from 20mhz to 8mhz.
  32.  
  33.   None of these changes seems to affect the problem.
  34.  
  35.   Several people have suggested it could be a cache problem; but I'm
  36.  running on a very old 20mhz 386, it doesn't have any caches.
  37.  
  38.   I'm still reluctant to believe it's actually a memory problem, since
  39.  
  40.    1) It doesn't occur with version 0.0
  41.    2) It only occurs *once*, once I get one NMI, it never happens
  42.         again.  You wouldn't think the memory could repair itself...
  43.    3) It happens within 2 hours of running the kernel compiles, often
  44.        within two minutes.  38+hours of memory tests (reading and
  45.        writting double/single words randomly) found nothing.
  46.  
  47.  
  48.  One last item; I did discover where the empty /var/log/messages line
  49.  was produced, and why you only got the empty line on the console,
  50.  without the NMI messages.
  51.  
  52.  In isa.c, the function to handle the Non-Maskable Interrupt (isa_nmi)
  53.  calls log(), but the string contains an initial new-line.  Removing
  54.  that new-line fixes those problem, at least.
  55.  
  56.  Again, suggestions are always welcome - I would especially appreciate
  57.  it if someone with an IDE setup tries to compile the kernel over-and-over
  58.  (i.e. in a shell "for"-loop) to see if the problem can be reproduced
  59.  by more people.
  60.  
  61.  My next approach is to replace the wd.c driver with Tom Ivar Helbekkmo's
  62.  new driver - to see if he has altered things enough to either cause
  63.  the problem to go away, or make it's occurrence more reliable.  Unfortunately,
  64.  I don't seem to be able to get to barsoom.nhh.no right now...
  65.  (trans-atlantic links are difficult at best.)
  66.  
  67.    - Still trying!! -
  68.  
  69.   - Dave Rivers -
  70.    (rivers@ponds.uucp)
  71.  
  72.