home *** CD-ROM | disk | FTP | other *** search
/ linuxmafia.com 2016 / linuxmafia.com.tar / linuxmafia.com / bale / baylisa-1998-09-17 < prev    next >
Text File  |  1998-11-12  |  16KB  |  306 lines

  1. BayLISA meeting notes
  2. 17 September 1998
  3. by Rick Moen
  4.  
  5. (BayLISA is the San Francisco Bay Area branch of the nation-wide
  6. group LISA -- Large Installation Systems Administration -- and 
  7. has its Web page at http://www.baylisa.org/.)
  8.  
  9.  
  10. The panel was in the form of 10-minute presentations by each
  11. of the panelists, in turn, followed by a collective Q&A session
  12. Some of them had a tendency to use overhead foils with tiny, 
  13. illegible print, the information in which was totally wasted,
  14. under the circumstances.  Suggestion to presenters:  If you use
  15. visual aids, stick to larger point sizes, and give the audience
  16. a URL where they can look up your presentation materials.
  17.  
  18. [Late note:  Bryan McDonald of the BayLISA Board informs me 
  19. that we're trying to get the overhead slides for Web presentation,
  20. and this will be announced when ready.]
  21.  
  22. [Even later note:  No sign of the slides, after several months.]
  23.  
  24. To recap, this was to be a panel on how to set up/configure 
  25. high-reliability, high-performance Internet servers on sundry 
  26. Intel Unix/Unix-like OSes.
  27.  
  28.  
  29. 1.  Paul Vixie (Internet Software Consortium founder & much more,
  30. re: BSDI's BSD OS):  Likes all of {Free|Net|Open}BSD,
  31. but prefers BSD OS because it _doesn't_ change often.  He always
  32. uses the last patch level of the prior major release, to maximise
  33. stability.  For example, BSDI has now come out with 4.0, so he
  34. runs the most recent (final) patches of 3.1.  He has several 
  35. machines running routed, gated, and screend in Palo Alto, and 
  36. some others running the T1 and doing kerberos authentication.  
  37.  
  38. He _doesn't_, however, run BSD OS for the root nameserver.  This
  39. requires 1GB of RAM, which he figures he could easily accomplish
  40. on NetBSD, but instead runs it on an Alpha running Digital Unix,
  41. because Digital was kind enough to donate these.
  42.  
  43. He made reference to his fabled page (http://www.vix.com/pc-hw/)
  44. of hardware recommendations for BSD OS, which has been much used
  45. by BSDI and others.
  46.  
  47.  
  48. 2.  Jason Thorpe (NetBSD kernel developer).  Says you really need
  49. 256 MB of RAM.  Likes the Mylex/Buslogic MultiMaster BT-958 SCSI
  50. host adapter.  Adaptec 2940U is OK.  Recommends avoiding Adaptec
  51. AIC-7890 chipsets, since the support isn't quite there, yet.  (An
  52. audience member piped in that the "unstable" tree's driver does
  53. this OK.)  Uses Seagate Hawk drives because they don't catch on fire
  54. (no doubt referencing Seagate's "hot offering", the 10,000 RPM 
  55. Barracuda series).  Likes Digital DEFPA FDDI adapters, Bay Networks
  56. Netgear 10/100 ethernet NICs ($30 at Fry's), which are based on
  57. the DEC Tulip chipset.  [RM adds:  Beware!  Very recently, NetGear
  58. has started shipping units with its own chipsets that almost but
  59. not quite emulate DEC's, without changing the model number or S/N 
  60. series.]  Intel EtherExpress 10/100 NICs are OK, too.
  61.  
  62. Always stripes drives, and uses multiple SCSI host adapters.  Likes
  63. serial consoles -- remote recovery.
  64.  
  65. NetBSD has a "packages" system similar to Jordan K. Hubbard's "ports" 
  66. system in FreeBSD.  (They couldn't call it "ports" because that term 
  67. already has a defined meaning.)
  68.  
  69. He listed a large number of daemons & network services for NetBSD
  70. on barely-legible overhead foils, there & gone too quickly to take
  71. notes, and then concluded by discussing NetBSD tuning, which I did
  72. not attempt to transcribe.
  73.  
  74.  
  75. 3.  Matt Dillon (one of the founders of Best Internet, sometime Linux
  76. guy, member of the FreeBSD core team):  Best has 45 FreeBSD rack-mount
  77. hosts in production service.  They tried, at first, to use a couple 
  78. of SGI hosts, which didn't work out.  Those cost $5 million, and were
  79. replaced by the 45 PCs costing $200,000.  These are twice as efficient
  80. and twice as fast.  Their first Intel production systems, back in the
  81. SGI days, were Pentium 90 motherboards, but they didn't find these
  82. to be robust.  The eventual Pentium Pro-based systems were a major
  83. improvement, with ECC support and other improvements.  Eventually
  84. replaced the SGIs with ASUS Pentium Pro 200, ECC RAM systems that
  85. could hold 256 MB RAM, maximum.  
  86.  
  87. This system has serial console mode with kernel debugger.  Found he
  88. didn't need multiple SCSI cards per host:  ISPs are seek-limited,
  89. and don't push the 135MB/sec bandwidth of PCI.  Tagged queueing
  90. and disconnect help user-concurrency issues.  (There's no way this
  91. can be done with IDE.)  
  92.  
  93. In FreeBSD 3.0 (beta), the CAM layer fixes a vexing 2940UW hardware-FIFO
  94. bug; uses DMA, avoids FIFO.  3.0 queues more SCBs (SCSI Control Blocks) 
  95. per host adapter: uses 16-20 per host adapter (real-world conditions), 
  96. instead of maximum of 4 in 2.2.x.  Elevator algorithm was helpful for 
  97. a long time (historically), but modern SCSI disks don't necessarily 
  98. store sectors in rotation order, so it's no longer useful.  SCBs 
  99. therefore are of help in that area.
  100.  
  101. Likes Adaptec, Symbios/NCR, Mylex/Buslogic SCSI hosts, and almost any
  102. 10/100 ethernet: DEC, Intel ethernet chipsets.  Uses PCI only (avoid
  103. VLB & ISA like the plague, EISA mostly obsolete), ECC SIMMs.  Uses
  104. _some_ new Pentium IIs, finds CPU performance unimpressive, because
  105. of slow L2 cache, but at least they have the advantage of holding more
  106. RAM and having a greater number of sockets, so that you can have more
  107. RAM on a system without having to use highest-density SIMMs/DIMMs.
  108.  
  109. Doesn't use NFS, no common file store, no RAID; one 100Base-T network.
  110. Failures are rare, and only the occasional disk failures are serious:
  111. In 1-2 cases, they required restoring from backup.  Ethernet goes to
  112. a Cisco Catalyst switch.  FreeBSD has somewhat higher CPU overhead 
  113. than NetBSD.  Having a 100Base-T backbone helps protect against 
  114. denial-of-service attacks such as smurfing, which occurs a couple 
  115. of times per week.
  116.  
  117. 100Base-T also helps with tape backup.  The tape machine is the
  118. only machine having two SCSI cards, in order that the tape chain be 
  119. separate from the disk one.  This is also one of only two RAID 0 
  120. machines.  He's using Diablo (his own feed-only news server --
  121. still in late beta) for netnews feed, on an SMP dual-processor
  122. machine.  Using three 18-GB disk drives in striped configuration,
  123. with soft updates enabled on the filesystem.  This is a test machine
  124. for (among other things) FreeBSD beta, so it's running all possible
  125. experimental FreeBSD code.  System configuration/tuning is similar
  126. to NetBSD, but has a totally different virtual memory system (which
  127. he detailed).
  128.  
  129.  
  130. 4. Jim Dennis (re: Linux -- "Linux Answer Guy" columnist in Linux 
  131. Gazette):  Has used Linux since late 1991.  [RM adds:  Linux Torvalds
  132. put out the first Linux kernels for public ftp in spring 1991.]  He
  133. used Coherent before that.  [RM adds:  Yet another small Unix-like
  134. OS, a low-cost proprietary offering from the Mark Williams Company,
  135. now defunct.]  Before that, worked at Quarterdeck supporting 
  136. DesqView on DOS.
  137.  
  138. Linux evolves rapidly, but it's not necessary to evolve with it.
  139. (Anecdotes about machines running older Linux builds, with very
  140. long uptimes.)  Typical uptime on his personal system is 3-4 months,
  141. until he wants to change something fundamental, usually compiling a
  142. new kernel.  Production systems, by contrast, have longer continuous
  143. uptimes (but his point is that it's reliable enough that uptime 
  144. measurements aren't significant).  Makes reference to the High 
  145. Availability HOWTO document at the Linux Documentation Project (LDP):
  146. http://sunsite.unc.edu/pub/Linux/ALPHA/linux-ha/High-Availability-HOWTO.html
  147.  
  148. Describes "Beowulf" clustering -- and stresses that its methods should
  149. run on any *ix kernel, although it's most often been implemented on
  150. Linux.  Moving to more down-to-earth concerns:  system monitoring,
  151. capacity planning, alerts:  Round-robin DNS and traditional redundancies
  152. via MX records, NIS master/slave setups, etc., will help in those areas.
  153. Some new protocols, such as the Coda distributed filesystem, will help
  154. in the future.  (Hopes that Coda will replace NFS.)
  155.  
  156. High-availability configurations are somewhat exotic, and Beowulf 
  157. clustering does not benefit most most common business applications 
  158. and services:  Calculation-intensive applications are rare -- 
  159. astronomy and particle-physics simulations, rather than Web servers.
  160.  
  161. Linux 2.1.x development kernels have been underway for a very long time:
  162. 1.5 years.  (Described kernel-build process.)
  163.  
  164. Hardware requirements:  Will run on anything:  386 w/16 MB RAM suffices,
  165. e.g., for router.  One fellow built a system with 2.1.x kernel on 4 MB RAM.
  166. Linux can also be run from a single floppy without hard drive:  References
  167. Tom Oehser's "Tom's Root/Boot" floppy, and the Linux Router Project.
  168.  
  169. Any old PC piece o'junk will run Linux; for driver support on new 
  170. (recently introduced) hardware, check the Red Hat or LDP hardware
  171. compatibility lists.  Can get Linux preinstalled from many firms in
  172. the Valley and elsewhere (PromoX, VA Research...).  Likes DEC Tulip
  173. ethernet chipset, especially on NetGear cards.  Likes ASUS SMP
  174. motherboards, Mylex/Buslogic BT-958 SCSI host adapters, watchdog
  175. timer hardware (see below).
  176.  
  177. Recommends using just one SCSI host adapter, except for tape drives.
  178. Likes new LM78 chipset, which monitors fan speed, voltages, and 
  179. temperatures inside the case.  The WDT500-P and WDT501-P watchdog
  180. timer interface hardware from Industrial Computer Source (San Diego)
  181. is supported in the kernel (which provides /dev/watchdog), and 
  182. can reboot or shut down the machine if it overheats, has voltage
  183. problems, or fails other health checks.
  184.  
  185. Linux gotchas:  There are about a dozen distributions, at any given
  186. time.  (Names a few.)  They differ in little persnickety details.  
  187. Recommends picking one, installing it once (for each machine-role 
  188. profile, e.g., Web, ftp, router, fileserver, and workstation), using 
  189. the completed installation as a template to crank out others.
  190.  
  191. PC BIOS and hardware constraints are frustrating.  Multi-OS boot
  192. setups are the source of a high percentage of the questions he's
  193. asked.  Packages aren't as well integrated as in FreeBSD.  Performance
  194. tuning:  "no atime" mount parameter on filesystems can double disk
  195. throughput (which may not quite double throughput, but offers a
  196. very noticeable speed-up).  Linux's native ext2 filesystem is very 
  197. fast, even without that.  Linux supports a number of other filesystems,
  198. and experimental ones are being developed for special purposes.
  199. Recommends running ntpdate at startup and xntpd during operation for 
  200. extremely accurate clock synchronisation.
  201.  
  202. Recommends checking "freshmeat.net" frequently, since a dozen or more
  203. new or updated packages are posted there every day -- regardless of
  204. which OS you use, since most code posted there is portable.  To be 
  205. added to Linux, soon:  journaling filesystem, ACLs (much else that 
  206. I couldn't copy down).
  207.  
  208.  
  209. 5.  Bob Palowoda (Solaris Performance Expert at Sun Microsystems, 
  210. re: Solaris x86):  As part of his job, tests Xeon, Merced (which 
  211. he can't talk about), Intel BX motherboards on Solaris vs. other 
  212. Unixes.  Says that x86 hardware now rivals the SPARC systems for 
  213. performance.  Classes "small" servers as dual Pentium Pros, "medium" 
  214. as dual PII/400, "high-end" as quad-Xeon systems, e.g., NCR, Siemens, 
  215. Fujitsu.  NCR has fastest spec Web server in the world, surpassing 
  216. even a large IBM box in tests.  Solaris has good, fine-grained 
  217. SMP, but there is a shortage of programmers able to take advantage 
  218. of it.  Compares Solaris against *BSD and Linux on performance 
  219. frequently as part of his job.
  220.  
  221. [Presents a series of illegible overhead foils with tiny type, 
  222. purporting to show that Solaris's internal memory transfer rates,
  223. local transfer rates, some other measures are faster than the
  224. competition's.]
  225.  
  226. Disk drive tuning:  Transfer rates on UFS using Seagate Cheetahs,
  227. 15 MB/sec.  Using IBMs, 12 MB/sec.  Compares against Linux on 
  228. pthread creation time, shows Linux to be much slower.  Linux and
  229. FreeBSD do not yet have a well-developed SMP system.  Solaris
  230. now costs $20 for personal use, which he personally resents, since
  231. he doesn't think it appropriate to do that with the developers'
  232. work.
  233.  
  234. Tuning parameters:  Solaris dynamically tunes a lot of them. 
  235. (Details many others.)  Recommends Mylex host adapters w/3-5
  236. channels and on-board cache RAM.  I20 bus is now supported on
  237. Solaris 2.7.  Veritas journaling filesystem has just been ported,
  238. and is very fast, but has been observed to flake out a few times.
  239. (Logging is now supported on UFS.)
  240.  
  241. Describes Solaris for ISP bundle, with sundry packages including
  242. HighWind news server, SSL, Java-based administration tools, LDAP,
  243. both Andrew2 and WU IMAP servers, GSSAPI authentication, which
  244. can deal both with real kerberos and Microsoft-gimmicked kerberos.
  245.  
  246.  
  247. Joint Q&A session:
  248.  
  249. What is Best's failure rate on the x86 FreeBSD boxes?  Only 
  250. occasional drive failures.  Ethernet cards, pre-ECC RAM occasionally.
  251. A few power supplies, one fan, little things.  Everything except
  252. disk drives can be recovered from essentially instantly.  (Modular
  253. rack-mount design.)  Cheap PC parts allow keeping spares of everything
  254. around -- not quite as reliable as SPARC.
  255.  
  256. Which filesystems have 64-bit support?  Solaris UFS has it, can be
  257. up to 8 terabytes.  Jason reports similar results on NetBSD.  Matt:
  258. fsck can take a long time on UFS, performance w/soft updates is
  259. competitive and fixes the fsck problem.  Jim:  Linux can handle
  260. very large filesystems on 64-bit CPU systems, eg., DEC Alpha.
  261. On 32-bit systems, maximum per volume is 2 GB.
  262.  
  263. When will there be serial console for Linux?  Jim:  Already available
  264. as patches for 2 years; built-in code in the 2.1.x development kernels.
  265. (Solaris has it.)  A company in Canada, Canada Connect, is developing
  266. add-on hardware to do _full_ serial-console, including BIOS Setup
  267. access, e.g., Adaptec Ctrl-A.  Product is called "PC Weasel 2000" (?).
  268.  
  269. On Solaris, any chance of retrofitting support for new hardware into
  270. version 2.5?  No, and 2.5 will soon be totally unsupported.
  271.  
  272. Each of the panelists represents a different approach to source-code
  273. licencing.  Could each of you describe the advantages of your 
  274. licence arrangements, and explain why you feel it's the right 
  275. path for the future?  [The moderator whapped this person with a 
  276. clue stick, and disallowed the question.]
  277.  
  278. Question about rack-mounting, which I didn't quite manage to 
  279. transcribe:  Matt stressed that rack-mounting allows reliable,
  280. short ultra-wide SCSI cabling, and good cooling for the disk
  281. drives, both of which he considers key for reliable operation.
  282.  
  283. Is there an option to do remote machine builds?  Matt:  At Best,
  284. we install from a template machine using an NFS-supporting boot 
  285. floppy.  Jim:  Linux boot floppies can do NFS-client/bootp without 
  286. modification.  (Can also do remote tape/other storage access via
  287. rsh and tar or cpio.)
  288.  
  289. How do the various OSes handle Y2K?  Sun has a certification 
  290. program.  NetBSD 1.2 (latest) has been somewhat tested, no
  291. reports of new problems since then.  No known problems in 1.3.2
  292. beta.  Linux:  As usual, it depends.  Pieces come from all manner
  293. of origins.  All the GNU utilities have been fixed.  The kernel
  294. doesn't have a problem.  Everything else is app-dependent.
  295. Matt:  (Describes the fact that machines run ultra-accurate NTP,
  296. for some reason.)  Seems to say that there are no known problems.
  297. BSDI is eyeballing problem spots, and is now certifying BSD OS
  298. for insurance purposes.  Real-time clocks in PC hardware are 
  299. often unfixably defective for Y2K purposes.  
  300.  
  301. (Discussion about UPSes and recovery from extended power failures.)
  302.  
  303.  
  304. This was a very long meeting, running to about 10:30 pm.  About
  305. sixteen of us then adjourned to the Peppermill restaurant.
  306.