home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / sys / sgi / 16211 < prev    next >
Encoding:
Internet Message Format  |  1992-11-10  |  3.6 KB

  1. Path: sparky!uunet!ornl!utkcs2!darwin.sura.net!jvnc.net!rutgers!cmcl2!adm!news
  2. From: nmw@ionospheric-physics.leicester.ac.uk (N.M. Wade)
  3. Newsgroups: comp.sys.sgi
  4. Subject: IP12 client nfs slow
  5. Message-ID: <34007@adm.brl.mil>
  6. Date: 10 Nov 92 00:47:49 GMT
  7. Sender: news@adm.brl.mil
  8. Lines: 68
  9.  
  10.  
  11.  
  12. Hi,
  13.  
  14. If I get any of this wrong I hope someone from SGI will correct the mistakes.
  15.  
  16. In January this year we took delivery of a new SGI system comprising a 4D/220
  17. server and 8 indigo clients.  Whilst undergoing acceptance tests I noticed 
  18. that the NFS performance was considerably worse than that for a SUN sparcstation
  19. acting as a client to the same server. 
  20.  
  21. After various checks and tests it became obvious that the problem only occured
  22. when the client was an Indigo (ie. the Indigos/SUNS/4D220 performed perfectly
  23. as servers, and the SUNs and 4D220 were ok as clients.)
  24.  
  25. I initially reported this to our Hotline service in the UK at the end of
  26. January.  As far as I know this was the first report SGI received on the 
  27. problem, certainly the UK support centre found no other references.
  28. We had several visits from SGI engineers to check our network and system 
  29. configuration, and to monitor the problem.  During these tests we had access to
  30. NetVisualizer software, and it soon became apparent that the problem
  31. would not manifest itself when NetVis was running.  Our only explanation of this 
  32. effect was that NetVis puts the ethernet port into promiscuous mode, and this 
  33. "cured" the problem.   We could see the client sending the initally request and 
  34. the server responding.  The problem was that the client missed the response, 
  35. thus causing timeout and retransmission.  In some cases several of these would 
  36. occur in succession causing a gap in data transfer of many seconds.  Increasing 
  37. the timeout period in the NFS mount only made the delay worse, since the client 
  38. waited even longer before retransmitting the request.
  39.  
  40. After many days of tests, phone calls and faxes the call was eventually 
  41. escalated to the US at the end of February.  During March other sites began
  42. to report similar problems and SGI in the US started to actually take some 
  43. notice.
  44.  
  45. At the end of March I received an unoffical patch from Georges Lauri at Berkley
  46. who had been helping SGI in the States with their tests.  The patch was a 
  47. simple program, which could be run in the background, and put the ethernet
  48. port into promiscuous mode, as does NetVis.  I later received an official patch
  49. from SGI which was a mod. to the if_ec kernel module, but was effectively
  50. the same as the unofficial patch in operation.
  51.  
  52. As I understand it the "fix" which is incorporated in 4.0.5 is a slightly more
  53. sophisticated version of the original patch.  Now, instead of running continually
  54. in promiscuous mode, the port runs as normal unless the kernel notices excessive
  55. collisions, in which case it puts the port into promiscous mode for a 
  56. predetermined period.
  57.  
  58. During this period we had installed a bridge between our small network and the
  59. main campus ethernet.  This completely cured the problem for us.  We still
  60. don't know why, but it worked and we have kept it that way.
  61.  
  62. It should be noted that the problem is in the hardware of the Indigo network
  63. interface board, and the fix is simply a patch to hide the problem.  It does 
  64. not cure the machines which run this fix.  Also, running in promiscuous mode 
  65. may cause CPU overhead, we have not done these tests yet.  Obviously, we are
  66. reluctant to reconfigure our network to recreate a problem so that we can
  67. check the fix!!
  68.  
  69.  
  70.  
  71. Nigel Wade,    
  72.  
  73. Sys. Admin., Ionospheric Physics Group, Leicester University, UK.
  74.  
  75. e-mail to Janet (UK) : nmw@uk.ac.le.ion
  76. phone :  +44 533 523568   
  77. fax   :  +44 533 523555
  78.