home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / sys / isis / 337 < prev    next >
Encoding:
Internet Message Format  |  1992-12-21  |  2.0 KB

  1. Path: sparky!uunet!dtix!darwin.sura.net!zaphod.mps.ohio-state.edu!caen!destroyer!cs.ubc.ca!uw-beaver!cornell!ken
  2. From: ken@cs.cornell.edu (Ken Birman)
  3. Newsgroups: comp.sys.isis
  4. Subject: Timer overflow causes problems after 4 weeks
  5. Message-ID: <1992Dec21.004456.16089@cs.cornell.edu>
  6. Date: 21 Dec 92 00:44:56 GMT
  7. Organization: Cornell Univ. CS Dept, Ithaca NY 14853
  8. Lines: 43
  9.  
  10. We have been shown a problem with Isis under which a timer, stored in
  11. a 32-bit signed integer with millisecond accuracy, overflows when Isis
  12. V3.0.6 or Isis V3.0.7 has been running for about 4 weeks.
  13.  
  14. The symptom is that remote client programs will be dropped by protos
  15. (much as if Isis had crashed) after about 20 seconds of connect time.
  16. Basically, protos sheds all its connections and won't make new ones
  17. using the remote connection code that runs over TCP.
  18.  
  19. Work-arounds: there are three.
  20.  
  21. One is to edit the code for the routine isis_disconnect() in cl_isis.c,
  22. commenting out its disconnect action.  In my copy of the obscured cl_isis.c,
  23. this procedure starts at line 1044:
  24.  
  25.     F7fb29058
  26.     P69bef462()
  27.     {
  28.     B28d3c828 B399ad7b8 *msg;
  29.     address H2ec0cf42;
  30.         if (Z1ac5e3fe() != my_true_pid) {
  31.     /**/
  32.     msg = Ld4f438();
  33.     H2ec0cf42 = X2cbaf53a(CL_CLOSE);
  34.     T78a74ca4(msg, &H2ec0cf42);
  35.     B553dfda4(&H2ec0cf42, msg);
  36.     }
  37.         Ld0b19d0(-1);      <-------- COMMENT THIS LINE OUT!
  38.     }
  39.  
  40. If you are running V2.2 or for some reason can't relink your applications,
  41. another approach (one that kills performance) is to force Isis to use UDP.
  42. Do this by setting ISISPORT to a nonsense value so that TCP connections
  43. will fail.  Yet a third option is to reboot your protos servers at least
  44. once a month.
  45.  
  46. We'll have a real fix for this in V3.0.8.  I apologize to anyone who runs
  47. into this -- these sorts of timer dependencies are supposed to be handled
  48. automatically, but obviously we missed one.
  49. -- 
  50. Kenneth P. Birman                              E-mail:  ken@cs.cornell.edu
  51. 4105 Upson Hall, Dept. of Computer Science     TEL:     607 255-9199 (office)
  52. Cornell University Ithaca, NY 14853 (USA)      FAX:     607 255-4428
  53.