home *** CD-ROM | disk | FTP | other *** search
/ Complete Bookshop / CompleteWorkshop.iso / compute / cd-tech / cdrom.txt
Encoding:
Text File  |  1990-03-01  |  7.5 KB  |  160 lines

  1. CD-ROM Technical Summary
  2. From Plastic Pits to "Fantasia"
  3.  
  4.  
  5.                                                Andy Poggio
  6.                                                March, 1988
  7.  
  8.  
  9. Abstract
  10.  
  11. This summary describes how information is encoded on Compact Disc (CD) 
  12. beginning with the physical pits and going up through higher levels of 
  13. data encoding to the structured multimedia information that is possible 
  14. with programs like HyperCard.  This discussion is much broader than any 
  15. single standards document, e.g. the CD-Audio Red Book, while omitting much 
  16. of the detail needed only by drive manufacturers.
  17.  
  18. Salient Characteristics
  19.  
  20. 1.  High information density -- With the density achievable using optical 
  21. encoding, the CD can contain some 540 megabytes of data on a disc less 
  22. than five inches in diameter.
  23.  
  24. 2.  Low unit cost -- Because CDs are manufactured by a well-developed 
  25. process similar to that used to stamp out LP records, unit cost in large 
  26. quantities is less than two dollars.
  27.  
  28. 3.  Read only medium -- CD-ROM is read only; it cannot be written on or 
  29. erased.  It is an electronic publishing, distribution, and access medium; 
  30. it cannot replace magnetic disks.
  31.  
  32. 4.  Modest random access performance -- Due to optical read head mass and 
  33. data encoding methods, random access ("seek time") performance of CD is 
  34. better than floppies but not as good as magnetic hard disks.
  35.  
  36. 5.  Robust, removable medium -- The CD itself is comprised mostly of, and 
  37. completely coated by, durable plastic.  This fact and the data encoding 
  38. method allow the CD to be resistant to scratches and other handling 
  39. damage.  Media lifetime is expected to be long, well beyond that of 
  40. magnetic media such as tape.  In addition, the optical servo scanning 
  41. mechanism allows CDs to be removed from their drives.
  42.  
  43. 6.  Multimedia storage -- Because all CD data is stored digitally, it is
  44. inherently multimedia in that it can store text, images, graphics, sound,
  45. and any other information expressed in digital form.  Its only limit in
  46. this area is the rate at which data can be read from the disc, currently
  47. about 150 KBytes/second.  This is sufficient for all but uncompressed,
  48. full motion color video.
  49.  
  50.  
  51. CD  Data  Hierarchy
  52.  
  53. Storing data on a CD may be thought of as occurring through a data 
  54. encoding hierarchy with each level built upon the previous one.  At the 
  55. lowest level, data is physically stored as pits on the disc.  It is 
  56. actually encoded by several low-level mechanisms to provide high storage 
  57. density and reliable data recovery.  At the next level, it organized into 
  58. tracks which may be digital audio or CD-ROM.  The High Sierra
  59. specification then defines a file system built on CD-ROM tracks.  Finally, 
  60. applications like HyperCard specify a content format for files.
  61.  
  62. The Physical Medium
  63.  
  64. The Compact Disc itself is a thin plastic disk some 12 cm. in diameter.  
  65. Information is encoded in a plastic-encased spiral track contained on the 
  66. top of the disk.  The spiral track is read optically by a noncontact head 
  67. which scans approximately radially as the disk spins just above it.  The 
  68. spiral is scanned at a constant linear velocity thus assuring a constant 
  69. data rate.  This requires the disc to rotate at a decreasing rate as the 
  70. spiral is scanned from its beginning near the center of the disc to its 
  71. end near the disc circumference.
  72.  
  73. The spiral track contains shallow depressions, called pits, in a 
  74. reflective layer.  Binary information is encoded by the lengths of these 
  75. pits and the lengths of the areas between them, called land.  During 
  76. reading, a low power laser beam from the optical head is focused on the 
  77. spiral layer and is reflected back into the head.  Due to the optical 
  78. characteristics of the plastic disc and  the wavelength of light used, the 
  79. quantity of reflected light varies depending on whether the beam is on
  80. land or on a pit.  The modulated, reflected light is converted to a radio 
  81. frequency, raw data signal by a photodetector in the optical head.
  82.  
  83. Low-level Data Encoding
  84.  
  85. To ensure accurate recovery, the disc data must be encoded to optimize the 
  86. analog-to-digital conversion process that  the radio frequency signal must 
  87. undergo.  Goals of the low level data encoding include:
  88.  
  89. 1.  High information density.  This requires encoding that makes the best 
  90. possible use of the high, but limited, resolution of the laser beam and 
  91. read head optics.
  92.  
  93. 2.  Minimum intersymbol interference.  This requires making the minimum
  94. run length, i.e. the minimum number of consecutive zero bits or one bits, 
  95. as large as possible.
  96.  
  97. 3.  Self-clocking.  To avoid a separate timing track, the data should be 
  98. encoded so as to allow the clock signal to be regenerated from the data 
  99. signal.  This requires limiting the maximum run length of the data so that 
  100. data transitions will regenerate the clock.
  101.  
  102. 4.  Low digital sum value (the number of one bits minus the number of zero 
  103. bits).  This minimizes the low frequency and DC content of the data signal 
  104. which permits optimal servo system operation.
  105.  
  106. A straightforward encoding would be to simply to encode zero bits as land 
  107. and one bits as pits.  However, this does not meet goal (1) as well as the 
  108. encoding scheme actually used.  The current CD scheme encodes one bits as 
  109. transitions from pit to land or land to pit and zero bits as constant pit 
  110. or constant land.
  111.  
  112. To meet goals (2) to (4), it is not possible to encode arbitrary binary 
  113. data.  For example, the integer 0 expressed as thirty-two bits of zero 
  114. would have too long a run length to satisfy goal (3).  To accommodate
  115. these goals, each eight-bit byte of actual data is encoded as fourteen 
  116. bits of channel data.  There are many more combinations of fourteen bits 
  117. (16,384) than there are of eight bits (256).  To encode the eight-bit 
  118. combinations, 256 combinations of fourteen bits are chosen that meet the 
  119. goals.  This encoding is referred to as Eight-to-Fourteen Modulation (EFM) 
  120. coding.
  121.  
  122. If fourteen channel bits were concatenated with another set of fourteen 
  123. channel bits, once again the above goals may not be met.  To avoid this 
  124. possibility, three merging bits are included between each set of fourteen 
  125. channel bits.  These merging bits carry no information but are chosen to 
  126. limit run length, keep data signal DC content low, etc.  Thus, an eight 
  127. bit byte of actual data is encoded into a total of seventeen channel bits: 
  128.  fourteen EFM bits and three merging bits.
  129.  
  130. To achieve a reliable self-clocking system, periodic synchronization is 
  131. necessary.  Thus, data is broken up into individual frames each beginning 
  132. with a synchronization pattern.  Each frame also contains twenty-four data 
  133. bytes, eight error correction bytes, a control and display byte (carrying 
  134. the subcoding channels), and merging bits separating them all.  Each frame 
  135. is arranged as follows:
  136.  
  137. Sync Pattern24 + 3channel bits
  138. Control and Display byte14 + 3
  139. Data bytes12 * (14 + 3)
  140. Error Correction bytes 4 * (14 + 3)
  141. Data bytes12 * (14 + 3)
  142. Error Correction bytes 4 * (14 + 3)
  143.  
  144. TOTAL588channel bits
  145.  
  146. Thus, 192 actual data bits (24 bytes) are encoded as 588 channel bits.
  147.  
  148. Editorial:  A CD physically has a single spiral track about 3 miles long.
  149. CDs spin at about 500 RPM when reading near the center down to about 250
  150. RPM when reading near the circumference.
  151.  
  152. Disc with a 'c' or disk with a 'k'?  A usage has emerged for these terms:
  153. disk is used for eraseable disks (e.g. magnetic disks) while disc is used
  154. for read-only (e.g. CD-ROM discs).  One would presumably call a frisbee a
  155. disc.
  156.  
  157. --andy
  158.  
  159.  
  160.