home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / unix / cray / 341 < prev    next >
Encoding:
Text File  |  1993-01-07  |  2.4 KB  |  57 lines

  1. Newsgroups: comp.unix.cray
  2. Path: sparky!uunet!haven.umd.edu!darwin.sura.net!tulane!pops.navo.navy.mil!anderson
  3. From: anderson@prowler.navo.navy.mil (Douglas T Anderson)
  4. Subject: System Stability [Was Re: Cray EL]
  5. Nntp-Posting-Host-[nntpd-14647]: prowler.navo.navy.mil
  6. Message-ID: <1993Jan7.144524.8438@cs.tulane.edu>
  7. Sender: news@cs.tulane.edu
  8. Reply-To: anderson@pops.navo.navy.mil
  9. Organization: POPS Facility Managment
  10. References: <BzL9CC.9E@rex.uokhsc.edu> <1993Jan6.180326@siisun.epfl.ch> <1993Jan6.181111.14914@chpc.utexas.edu>
  11. Date: Thu, 7 Jan 1993 14:45:24 GMT
  12. Lines: 43
  13.  
  14. In article <1993Jan6.181111.14914@chpc.utexas.edu>, jones@chpc.utexas.edu (Willaim L. Jones) writes:
  15. |> 
  16. |> >From: brossard@siisun.epfl.ch (Alain Brossard EPFL-SIC/SII)
  17. |> .
  18. |> >Also the least stable, though to be fair Cray seems to have 
  19. |> >finally succeeded in providing us with a stable machine.  You 
  20. |> >wouldn't believe how often it used to crash in the first few 
  21. |> >months.
  22. |> 
  23. |> Just as stable as their large machines.  
  24. |> 
  25. |> I sure wish cray would really put in the effort that is needed to fix 
  26. |> their operating system.
  27. |> 
  28.  
  29. These messages got me to thinking, we have 3 Cray systems here on
  30. site (YMP8/8128, YMP2E/116, XMPEA-116) and over the past 3 years we
  31. have experienced what I consider to be pretty good stability.  We
  32. have significantly more failures caused by shooting ourselves in the
  33. foot other then Cray caused failures, I dont have the numbers here
  34. in front of me, but our MTBF (Mean Time Between Failure) is 
  35. on the order of 800 hours on the Y's and about 500 hours on the 
  36. X.  We run 24 hours a day/7 days a week and have experienced a 
  37. 99.86% up time over the past 3 months.
  38.  
  39. CUG statistics show, what to me as a Computer Center manager, would
  40. be good numbers for stability (though not as high as we are ;~) ).  
  41.  
  42. With our experience, and what appears to be the "average" from the
  43. CUG reports, I think the system/OS stability is pretty good, but
  44. more work needs to be done on System Operations/Administration tools
  45. to help us in the data center.  Users dont care if its a CPU
  46. failure, Disk head crash, memory failure, or the operator "pulling
  47. the plug", down is down.
  48.  
  49. -- 
  50. Douglas T Anderson
  51. Technical Services Manager/Chief Engineer
  52. POPS Program
  53.  
  54. All opinions expressed are mine and mine alone.  They do not
  55. reflect the opinions of Grumman Data Systems, the US Navy or any
  56. one else, unless they want them to.
  57.