home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / comp / arch / storage / 622 < prev    next >
Encoding:
Internet Message Format  |  1992-09-03  |  2.0 KB

  1. Xref: sparky comp.arch.storage:622 comp.databases:6529
  2. Path: sparky!uunet!stanford.edu!agate!triplerock.CS.Berkeley.EDU!mao
  3. From: mao@triplerock.CS.Berkeley.EDU (Mike Olson)
  4. Newsgroups: comp.arch.storage,comp.databases
  5. Subject: Re: Info on large, slow storage wanted (jukeboxes, etc.)
  6. Date: 3 Sep 1992 16:23:24 GMT
  7. Organization: University of California at Berkeley
  8. Lines: 35
  9. Message-ID: <185e5sINNjdd@agate.berkeley.edu>
  10. References: <1992Aug29.210553.8744@rhein-main.de>
  11. NNTP-Posting-Host: triplerock.cs.berkeley.edu
  12.  
  13. In <1992Aug29.210553.8744@rhein-main.de>, From: vhs@rhein-main.de
  14. (Volker Herminghaus-Shirai) writes:
  15.  
  16. > I need to design a retrieval system for ~15TB of data ...
  17. > Any kind of information is greatly appreciated (hints, pointers, ideas, etc.)
  18.  
  19. my master's work at berkeley was on how to incorporate tertiary storage
  20. into a database system cleanly.  i changed a bunch of internal interfaces,
  21. defined a new abstraction like the file system switch, and added support
  22. for a 327 gigabyte sony optical disk worm jukebox.
  23.  
  24. under this architecture, the database system manages the tertiary storage
  25. device directly, rather than using an external file system interface to
  26. it.  the advantage is that the dbms can make intelligent clustering,
  27. caching, and prefetching decisions, and can consider optical device
  28. performance characteristic (like very long pick times) when it optimizes
  29. a query.
  30.  
  31. the jukebox storage manager uses a magnetic disk cache and extent-based
  32. allocation to speed up accesses to data.
  33.  
  34. a description of the architecture is included in the postgres papers,
  35. available by anon ftp from postgres.Berkeley.EDU (128.32.149.1) in
  36. pub/postgres-papers.tar.Z.
  37.  
  38. this won't answer all your questions; in particular, you would have to
  39. figure out clustering and caching policies to guarantee the performance
  40. bounds you list.  it may help you out in identifying problems with these
  41. devices and things you need to think about if you're designing your own
  42. storage manager.
  43.                     mike olson
  44.                     project sequoia 2000
  45.                     uc berkeley
  46.                     mao@cs.berkeley.edu
  47.