home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / comp / parallel / 1792 < prev    next >
Encoding:
Text File  |  1992-07-24  |  4.3 KB  |  122 lines

  1. Newsgroups: comp.parallel
  2. Path: sparky!uunet!gatech!hubcap!fpst
  3. From: alan@ec.msc.edu (Alan Klietz)
  4. Subject: DJM - Distributed Job Manager for CM-2 and CM-5
  5. Message-ID: <1992Jul24.115403.8337@hubcap.clemson.edu>
  6. Sender: fpst@hubcap.clemson.edu (Steve Stevenson)
  7. Organization: Clemson University
  8. Date: Thu, 23 Jul 92 20:16:43 CDT
  9. Approved: parallel@hubcap.clemson.edu
  10. Lines: 110
  11.  
  12. Are you:
  13.     Frustrated with NQS?
  14.     Tired of batch jobs?
  15.     A frazzled manager of a CM-2 or CM-5 system?
  16.  
  17. If yes, you should try the Distributed Job Manager, and boldly move out of
  18. the 1960's and into the modern (well, 1970's) era of parallel computing!  :-)
  19.  
  20.  
  21. What is the Distributed Job Manager?
  22. ------------------------------------
  23.  
  24. The Distributed Job Manager (DJM) is a drop-in replacement for the
  25. Network Queuing System (NQS) for managing batch and interactive jobs on a
  26. Thinking Machines Corporation CM-2 or CM-5 system.
  27.  
  28. DJM is freely available software under the auspices of the GNU copyright.
  29.  
  30.  
  31. What does DJM do?
  32. -----------------
  33.  
  34. Briefly, DJM manages the resources of a Connection Machine system.  It
  35. allocates resources (memory, processors, time) to jobs based on a 
  36. set of site-defined scheduling criteria.  It provides efficiency
  37. and flexibility for system administrators, and provides ease-of-use 
  38. and productivity for end users.
  39.  
  40. The Distributed Job Manager has the following features:
  41.  
  42.     o Upward compatible with NQS
  43.  
  44.     o Full support for interactive use
  45.  
  46.     o Load Balancing
  47.  
  48.     o Flexible controls and fault tolerance
  49.  
  50. Compatibility: All the user-visible commands of NQS (qsub, qstat, etc.)
  51. are supported.   Support is also provided for many of the user-visible
  52. extensions to NQS as proposed in the Posix Batch Queuing draft standard
  53. (IEEE Std 1003.15).
  54.  
  55. Interactive use: Interactive access is integral to the system.  DJM
  56. makes no distinction between `batch' and `interactive' jobs.  A job
  57. is a login session.  Sessions can be detached from the terminal and 
  58. then later re-attached on a different terminal.
  59.  
  60. Load balancing: DJM balances job load across multiple front-ends.
  61. The criteria for selecting where to run jobs can be influenced by
  62. site policy to an arbitrary degree.  Users never have to log into
  63. a particular front-end.
  64.  
  65. Fault tolerance: A portion of the MPP machine or a front-end
  66. can go down without affecting other components of the system.
  67.  
  68.  
  69. What machines are supported?
  70. ----------------------------
  71.  
  72. DJM currently supports the Thinking Machines Corporation CM-2 and
  73. CM-5.  The package is modular to facilitate easy adaptation to other
  74. MPP architectures as well.  You are encouraged to donate your extensions
  75. for support of other architectures for incorporation into future
  76. DJM releases. 
  77.  
  78.  
  79. Ok, I'd like to try it out.  How do I get it?
  80. ---------------------------------------------
  81.  
  82. A beta-test release of DJM is available for anonymous ftp from the
  83. CM LIGHTNING User Group archives.  Use anonymous ftp to ec.msc.edu
  84. and retrieve the file /pub/LIGHTNING/djm_0.9.6.tar.Z.
  85.  
  86. You should test it extensively under `live' operating conditions for
  87. several weeks, running it side-by-side with NQS, before you decide 
  88. whether to switch.
  89.  
  90. All documentation is included.  See the file INSTALL for installation
  91. instructions.  You need an ANSI C compiler, preferrably gcc version
  92. 2.1 or later.
  93.  
  94. NOTE: Although this version is currently in production use at
  95. the Minnesota Supercomputer Center and at Los Alamos, it should
  96. still be considered a BETA-TEST version, not a final version.
  97.  
  98.  
  99. What kind of support can I expect?
  100. ----------------------------------
  101.  
  102. As much as you paid for: NONE!   You have the source code, so be prepared
  103. to make changes to fix bugs or apply local hacks.  I will accept bug reports.
  104. If you include source code patches, I will try to fold them in.   If not, I
  105. may try to fix bugs depending on how much time I have.  Basically, however,
  106. you are on your own.  
  107.  
  108.  
  109. DISCLAIMER: This project was funded in part by the U.S. Army Research
  110. Office under contract no. DAAL03-89-C-0038.  There are NO WARRANTIES,
  111. EXPRESS OR IMPLIED.  The package includes software developed by 
  112. the University of California, Berkeley and its contributors.
  113.  
  114. --
  115. Alan E. Klietz
  116. Minnesota Supercomputer Center, Inc (MSCI).
  117. Army High Performance Computing Research Center (AHPCRC)
  118. 1200 Washington Avenue South
  119. Minneapolis, MN  55415
  120. Ph: +1 612 626 1737           Internet: alan@msc.edu
  121.  
  122.