home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / arch / storage / 858 < prev    next >
Encoding:
Text File  |  1992-12-15  |  9.2 KB  |  213 lines

  1. Newsgroups: comp.arch.storage
  2. Path: sparky!uunet!world!RAID7
  3. From: RAID7@world.std.com (John OBrien)
  4. Subject: RAID 7 vs. Earlier Raid 4
  5. Message-ID: <BzBHH0.3v1@world.std.com>
  6. Organization: The World Public Access UNIX, Brookline, MA
  7. Date: Tue, 15 Dec 1992 20:12:35 GMT
  8. Lines: 203
  9.  
  10. When I returned to the office from being out of town, there were
  11. copies of several INTERNET messages on my desk with a note from
  12. my boss, "several misconceptions out there".  Indeed.
  13.  
  14. My belief is that addressing those misconceptions from a
  15. technical perspective would be a service to those interested
  16. INTERNET parties.  Here goes...
  17.  
  18. Randy Rorden of Sanyo Icon writes:
  19.  
  20. >I then read an article by John O'Brien of Storage Computer that
  21. >was published in the Spring 1992 Computer Technology Review. 
  22. >In it, he mentions the above-listed three features that
  23. >supposedly make RAID 7 different from other RAID levels.  I do
  24. >not agree that these "architectural" features constitute a
  25. >different RAID level.
  26.  
  27. Mr. Rorden then cites [Patterson88][Katz89] and continues with
  28. his own commentary,
  29.  
  30. >That's because RAID levels define different ways of organizing
  31. >data on disk drives and ways of providing redundancy so that
  32. >lost data can be recovered when a drive fails, not how those
  33. >drives may be connected, controlled, cached, or buffered.
  34.  
  35. Tom Wicklund of Intellistor writes:
  36.  
  37. >Before asking the status of RAID 7, wait for the term to be
  38. >defined.  RAID 7 is not part of the original RAID taxonomy that
  39. >Berkeley defined.  Their RAID 7 is a modified Berkeley RAID 4,
  40. >with the RAID 7 definition a marketing ploy to say why their
  41. >implementation of RAID 4 architecture is superior.
  42.  
  43. What was misconstrued above, about the Berkeley RAID Levels and
  44. taxonomy, and about RAID 7, can best be explained by considering
  45. the following two questions: (1) What are the criteria for
  46. Berkeley RAID levels?, and (2) How far does this taxonomy extend?
  47.  
  48.  
  49. (1) WHAT ARE THE CRITERIA FOR BERKELEY RAID LEVELS?
  50.  
  51. Whenever there is disagreement about what was said, meant, or
  52. intended in a document, the most direct route to clarification
  53. is to simply go to that source document.  "A Case for Redundant
  54. Arrays of Inexpensive Disks" was first published as a Computer
  55. Science Division report at Berkeley in December 1987 by
  56. Patterson, Gibson, and Katz.  (This is the same report that Mr.
  57. Rorden cites as [Patterson 88] as it was republished by IEEE). 
  58. There are three passages in this original paper of interest; one
  59. from the abstract, a second from the body, and a third from the
  60. conclusion.
  61.  
  62.  
  63. ABSTRACT:
  64.  
  65.      "Increasing performance of CPUs and memories will be
  66. squandered if not matched by a similar performance increase in
  67. I/O.  While the capacity of Single Large Expensive Disk (SLED)
  68. has grown rapidly, the performance improvement of SLED has been
  69. modest. Redundant Arrays of Inexpensive Disks (RAID), based on
  70. the magnetic disk technology developed for personal computers,
  71. offers an attractive alternative to SLED, promising improvements
  72. of an order of magnitude in performance, reliability, power
  73. consumption, and scalability.
  74.  
  75.      This paper introduces five levels of RAIDs, giving their
  76. relative cost/performance, and compares RAIDs to an IBM 3380 and
  77. a Fujitsu Super Eagle."
  78.  
  79.  
  80. BODY
  81.  
  82.      "To simplify the explanation of our final proposal and to
  83. avoid confusion with previous work, we give the taxonomy of five
  84. different organizations of disk arrays, beginning with mirrored
  85. disks and progressing through a variety of alternatives with
  86. differing performance and reliability.  We refer to each
  87. organization as a RAID level."
  88.  
  89.  
  90. CONCLUSION
  91.  
  92.      "This paper makes two separable points: the advantages of
  93. building I/O systems from personal computer disks and the
  94. advantages of five different disk array organizations,
  95. independent of disks used in that array.  The later point starts
  96. with the traditional mirrored disks to achieve acceptable
  97. reliability with each succeeding level improving
  98.  
  99.         o  the effective performance per disk for supercomputer
  100.         applications (characterized by a small number        
  101.         of requests per second for a massive amounts 
  102.         of information each time),
  103.  
  104.         o  the transaction-processing performance
  105.         (characterized by a large number of read-modify-writes to
  106.         a small amount of information each time), or
  107.  
  108.         o  the usable storage capacity"
  109.  
  110.  
  111. Even from a cursory read of this material it is clear that the
  112. major criterion for establishing a RAID level is, PERFORMANCE. 
  113. In the abstract alone, the authors mention PERFORMANCE no less
  114. than 5 times.  PERFORMANCE is also central to the taxonomy
  115. definition shown above, which appears in the body of the report.
  116.  And finally, the authors tell us in the conclusion, PERFORMANCE
  117. -- together with her twin sister usable capacity -- are the very
  118. yardsticks by which "each succeeding level" is measured.
  119.  
  120. Performance isn't the only criterion; by its stature and
  121. frequency of reference, though, it appears to be the most
  122. important.  
  123.  
  124. Does this mean that implementing a RAID with chips which work 20
  125. nS faster implies a different RAID level.  I don't believe any
  126. reasonable technologist would adopt such a view.  In the RAID
  127. definition from the body of the report the authors qualify that
  128. "different organizations of disk arrays" also help define RAID
  129. levels.  
  130.  
  131. For example: when the idea of distributing parity from a single
  132. disk, RAID 4, to locations across multiple disks is added, the
  133. resulting "organization" is defined as a new level, specifically
  134. RAID 5.  Similarly, when the idea of constructing a RAID device
  135. where all disk heads could truly move asynchronously -- for
  136. writes as well as reads --; where disk transfers -- queued as
  137. well as non-queued -- would be managed asynchronously; where an
  138. embedded OS would simultaneously manage individual drive cache
  139. and central cache in a manner that behaves like a virtual solid
  140. state disk; the resulting tremendous increase in performance and
  141. different disk organization clearly merit a RAID level different
  142. from existing levels.  Enter: RAID 7. ( In March 1990 Storage
  143. Computer issued a paper which defined RAID levels 6 and 7.  This
  144. was an attempt to talk seriously about RAID technology and
  145. architecture.  In June of 1991, Mr. Randy Katz -- one of the
  146. original Berkeley authors -- published an article in Computer
  147. Technology Review describing an architecture which he denoted as
  148. RAID 6.)
  149.  
  150. RAID 7 is the first RAID level which outperforms the four
  151. performance metrics versus the single spindle (Large Reads,
  152. Large Writes, Small Reads, and Small Writes).
  153.  
  154. Expressed in other words: RAID 4 write parallelism is one per
  155. group since every write must also join the parity disk queue;
  156. RAID 5 write parallelism is G/2 (where G is the group size)
  157. since every write has an associated parity disk - that is a
  158. single write requires two disks; RAID 7 write parallelism is N-1
  159. (where N is the number of drives in the arrays and N is always
  160. >= G).  Thus RAID 7 enjoys a strong performance vis a vis RAIDs
  161. 4 and 5.
  162.  
  163. (Personally, I don't think there is anything magical about the
  164. name RAID 7 -- it is just an attempt to convey some relative
  165. understanding of performance and capacity as opposed to the
  166. other RAID numbers.  I recall being drawn into a rather animated
  167. discussion with one of our customers who had just tested the
  168. RAID 7 against a solid state disk and he noted that it performed
  169. at about 70% of the speed of the SSD.  He argued strenuously
  170. that we should bypass describing it as a RAID 7, in favor of the
  171. term, "virtual solid state disk" which he felt was a more
  172. descriptive of behavior".)
  173.  
  174.  
  175. (2) HOW FAR DOES THIS TAXONOMY EXTEND?
  176.  
  177. Readers of the Berkeley paper might be reasonably grouped into
  178. three categories: (1) those that criticize the paper, (2) those
  179. that criticize the universe (everything but the paper), and (3)
  180. finally, the group to which I would claim membership, those who
  181. perceive the paper as a good example of fine academic work, by
  182. some innovative and talented technologists.  The Berkeley
  183. authors did much to popularize disk arrays.  That they may have
  184. made some simplifying assumptions in the paper which might not
  185. have been first choice for product implementors (transfer unit
  186. size, large write size) is not a cause for concern; let's
  187. recognize the paper for what it is -- a very valuable
  188. contribution of research -- and not criticize it for what it
  189. isn't -- an implementor's bible for all time to come.
  190.  
  191. Conversely, those who criticize the universe believe that since
  192. Berkeley defined levels 1 thru 5 in this paper, no scope of work
  193. can stretch those limits.  I find it hard to appreciate the
  194. value of this kind of rigidity.  This is a little like defining
  195. five levels of minicomputers in the late sixties, and not
  196. allowing any other definitions.  What happens when new
  197. architectures (Ala. Tandem, Stratus) evolve? Are they not
  198. considered minis? Do we ignore them because they don't fit our
  199. original 1969 definition?  
  200.  
  201. Like all real contributions to the art, the Berkeley taxonomy
  202. needs augmenting from time to time -- if only to reflect
  203. industry/academic directions.  Those requiring more information
  204. on the RAID 7 extension to the Berkeley levels are welcome to a 
  205. copy of a Storage Computer publication, "RAID AID: A Taxonomic
  206. Extension to the Berkeley Disk Array Schema".  Just request by
  207. EMAIL RAID7@world.std.com  /Phone (603-880-3005) /FAX (603-889-7273).
  208.  
  209. John O'Brien
  210. Storage Computer Corporation
  211.  
  212.  
  213.