home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / unix / aix / 8915 < prev    next >
Encoding:
Text File  |  1992-08-19  |  2.5 KB  |  54 lines

  1. Newsgroups: comp.unix.aix
  2. Path: sparky!uunet!ukma!darwin.sura.net!uvaarpa!murdoch!sasha.acc.Virginia.EDU!scl
  3. From: scl@sasha.acc.Virginia.EDU (Steve Losen)
  4. Subject: Re: runaway processes (was Re: Vi is still broken)
  5. Message-ID: <1992Aug19.145808.2342@murdoch.acc.Virginia.EDU>
  6. Sender: usenet@murdoch.acc.Virginia.EDU
  7. Reply-To: scl@sasha.acc.Virginia.EDU (Steve Losen)
  8. Organization: University of Virginia
  9. References: <1992Aug17.163739.29534@APS.Atex.Kodak.COM> <133789@lll-winken.LLNL.GOV> <1992Aug19.132117.5939@msc.cornell.edu>
  10. Date: Wed, 19 Aug 1992 14:58:08 GMT
  11. Lines: 41
  12.  
  13. [ complaints about runaway processes eating up cpu time ]
  14.  
  15. In article <1992Aug19.132117.5939@msc.cornell.edu>,
  16. |> 
  17. |> Yup.  We see this kind of thing frequently.  Since we are about to start
  18. |> chargeback accounting, this will be a severe pain.
  19. |> 
  20. |> Our most recent method of producing the problem is to close a window in
  21. |> which a process which is on the receiving end of a pipe is running.
  22. |> 
  23. |> This has been going on for years but has lately become intolerable.  I
  24. |> must now try to come up with a reproducible example and phone up IBM
  25. |> to see if it's a 'supported defect' :-}
  26.  
  27. We've had this problem since day one way back at AIX 3.1.  No AIX upgrade
  28. has fixed it yet.  In our case, the runaways are all interactive jobs such
  29. as editors, mail readers, news readers, etc., and they all seem to happen
  30. when a telnet session ends abnormally.
  31.  
  32. Very early on I wrote a perl script that runs "ps caux" every few minutes
  33. and looks for runaways.  I have a "hit list" of interactive commands that
  34. are known to runaway, including vi, jove, more, less, telnetd, rlogind,
  35. mail, mush, etc.  The script kills off any of these commands if ps
  36. indicates that it is using over 9% of the cpu and has accumulated 2
  37. minutes of cpu time.  I just pulled these heuristics out of thin air, but
  38. they have worked well on several loaded 540s and 550s.
  39.  
  40. Sure beats getting called up several times a day to kill these things off.
  41.  
  42. I would post the perl script, but it has grown very large because it does
  43. a whole lot of other stuff such as renicing long running cpu burners,
  44. detecting when a user is running >1 cpu burner at a time, etc.  Also, I
  45. will have to fix the script to run under 3.2.  IBM has changed the output
  46. format of ps.  Thankfully the new format is easier to parse.  Under 3.1.5,
  47. some of the fields can run together.  I think under 3.2, you are always
  48. guaranteed at least one space of separation.
  49.  
  50. --
  51. Steve Losen                     scl@virginia.edu
  52.  
  53. University of Virginia Academic Computing Center
  54.