home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / sys / concurre / 18 < prev    next >
Encoding:
Internet Message Format  |  1992-08-19  |  2.4 KB

  1. Path: sparky!uunet!dtix!darwin.sura.net!mips!mips!bdcsys!news
  2. From: hank@bcstec.ca.boeing.com (Lisa Henry)
  3. Newsgroups: comp.sys.concurrent
  4. Subject: Need help with networking problem on unix Concurrent machine.
  5. Message-ID: <3309@bcstec.ca.boeing.com>
  6. Date: 13 Aug 92 23:06:21 GMT
  7. Sender: news@bdcsys.suvl.ca.us
  8. Organization: ncurrent-request
  9. Lines: 56
  10. Approved: concurrent-request@bdcsys.suvl.ca.us
  11.  
  12.  
  13. I'm having trouble with a networking problem involving several
  14. test stations running with a Concurrent computer (UNIX/6.1) 
  15. (the man pages footer says AT&T SYSV.2 and 4.2BSD),
  16. networked between two subnets (ethernet), with several X-terminals
  17. connecting to them over the network.  
  18.  
  19. The problem is that periodically (on some nodes once to twice
  20. a day) the ARPA network services on these nodes gets 'hung', for
  21. lack of a better word.  These are the symptoms:
  22.  
  23. 1.  I am not able to remote connect to a node that is 'hung' from
  24.     one that is running okay by means of telnet, ftp, rsh, or
  25.     rlogin.  
  26.  
  27.     With ftp and telnet, the initial connection is made:
  28.  
  29.     % telnet hung_node
  30.       Trying...
  31.       Connected to hung_node.
  32.       Escape character is '^]'.
  33.  
  34.     but nothing happens after that.  Similarly with ftp:
  35.  
  36.     % ftp hung_node
  37.       Connected to hung_node.
  38.  
  39.     and again no response after that.  
  40.  
  41.     Also, when the system is hung up, X-terminals are not
  42.     able to download server code from it.  They are using
  43.     tftp to transfer the server files.
  44.  
  45. 2.  I *can* execute these utilities from the hung_node to other
  46.     systems that are running okay.  Works just fine.
  47.  
  48. 3.  The above symptoms led me to think that the netd process 
  49.     was somehow locked up, so I tried to kill it.  It won't
  50.     die.  No option to kill has worked so far. 
  51.  
  52. 4.  The only solution so far has been to reboot the machine,
  53.     which stops and restarts the netd process, and then 
  54.     everything runs just fine.  
  55.  
  56.     The problem is that I can't just reboot the machine every
  57.     time this happens.  There are users running from X-terminals
  58.     and dumb-terminals all over, and I can't just keep 
  59.     interrupting their work.  
  60.  
  61. So I need a less drastic solution than rebooting.  Anyone have
  62. any ideas?  Any help would be appreciated.  
  63. -- 
  64. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  65. ~  Lisa Yvette Henry           * System Administrator 
  66. ~  root@hp750_s1.ds.boeing.com * Status:  Babe in the woods...
  67. ~  hank@bcstec.ca.boeing.com   * "Wow, look at all these toys!"
  68.