home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / comp / sys / sun / admin / 5136 < prev    next >
Encoding:
Text File  |  1992-07-31  |  2.4 KB  |  47 lines

  1. Newsgroups: comp.sys.sun.admin
  2. Path: sparky!uunet!cs.utexas.edu!zaphod.mps.ohio-state.edu!pacific.mps.ohio-state.edu!linac!newsaintmail
  3. From: billq@fnal.gov (William R. Quayle)
  4. Subject: Re: Amd is not perfect
  5. Message-ID: <Y0S7O09EP@linac.fnal.gov>
  6. Sender: daemon@linac.fnal.gov (The Background Man)
  7. Nntp-Posting-Host: boise.fnal.gov
  8. Reply-To: billq@pogo.fnal.gov
  9. Organization: Independant Consultant
  10. References:  <Bs88Cu.7zp@fiu.edu>
  11. Date: Fri, 31 Jul 1992 13:42:34 GMT
  12. Lines: 33
  13.  
  14. Is anyone at Sun listening?  This bug has been reported at least 4 times
  15. that I know about.  I've run into it here at Fermi twice, twice when I
  16. was at AT&T Bell Labs, and I've seen it posted roughly two months ago
  17. (I wish I had saved it).  Symptoms are exactly as Carlos describes;
  18. all nfsd's go into DW, load rises dramatically, and the server deadlocks.
  19. Root is the only one that can log in and function.  Then, if you are
  20. patient enough not to reboot, the system falls back into a normal state.
  21. I've seen the machine (a 4/490) deadlocked for 20-30 minutes before
  22. regaining its sanity.  OS 4.1.2, Sun automounter, ~20 automounted filesystems.
  23.  
  24. What gives?
  25.  
  26. In article <Bs88Cu.7zp@fiu.edu>, ibarrac@kzin.fiu.edu (Carlos A. Ibarra) writes:
  27. [deleted]
  28. |> Around once a month, all the processes referencing files through amd on
  29. |> one of our servers get stuck. A ps shows them all in DW state. Meanwhile,
  30. |> amd is happily running fine. The load increases monotonically. Each new
  31. |> process which attempts to access a filesystem through the automounter,
  32. |> gets stuck in kernel wait. Sometimes, if we are lucky, this stops by itself.
  33. |> The load goes back down and everything works fine. Other times we have
  34. |> to resort to a reboot. It looks to me like some kind of deadlock, but
  35. |> I have not been able to find out where the cyclical wait occurs. It may
  36. |> also be an amd bug.
  37. |> 
  38. |> This used to happen a lot before with Sun's automounter. Amd reduced, but
  39. |> did not eliminate, the frequency of this problem.
  40.  
  41. ----------------------------------------------------------------------------
  42. William R. Quayle                     |          UNIX Systems Administration
  43. Fermi National Accelerator Laboratory |     Distributed Computing Department
  44. P.O. Box 500, MS-368                  |        Internet: billq@fnal.fnal.gov 
  45. Batavia, IL 60510                     |                       (708) 840-8254
  46. ----------------------------------------------------------------------------
  47.