home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / AudioFAQ / pro-audio-faq < prev   
Encoding:
Internet Message Format  |  1996-12-23  |  109.7 KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!panix!news.panix.com!not-for-mail
  2. From: gabe@pgm.com (Gabe M. Wiener)
  3. Newsgroups: rec.audio.pro,rec.answers,news.answers
  4. Subject: rec.audio.pro FAQ (v 0.9)
  5. Followup-To: rec.audio.pro
  6. Date: 22 Dec 1996 10:35:06 -0500
  7. Organization: PGM Recordings / Quintessential Sound, Inc.
  8. Lines: 2252
  9. Sender: gabe@panix.com
  10. Approved: news-answers-request@MIT.EDU
  11. Message-ID: <59jkfa$ata@panix.com>
  12. NNTP-Posting-Host: panix.com
  13. Xref: senator-bedfellow.mit.edu rec.audio.pro:112194 rec.answers:26556 news.answers:90218
  14.  
  15. Archive-name: AudioFAQ/pro-audio-faq
  16. Last-modified: 1996/06/25
  17. Version: 0.9
  18.  
  19.        Frequently Asked Questions (FAQ) file for rec.audio.pro
  20.                  Version 0.8
  21.  
  22.       Edited and compiled by Gabe Wiener (gabe@pgm.com)
  23.  
  24. Many thanks to all who have contributed to the FAQ.  Individual
  25. contributions are credited at the end of their respective sections.
  26. The core FAQ writers are listed below.  The rubric in brackets will be
  27. used to indicate who has written a particular section.
  28.  
  29.     Scott Dorsey        kludge@netcom.com    [Scott]
  30.     Christopher Hicks    cmh@eng.cam.ac.uk    [Chris]
  31.     David Josephson        david@josephson.com    [David]
  32.     Dick Pierce        dpierce@world.std.com    [Dick]
  33.     Gabe Wiener        gabe@pgm.com        [Gabe]
  34.  
  35.  *  Each author maintains and asserts full legal copyright on his 
  36.  *  contribution to the FAQ.  Compilation copyright (C) 1996 by 
  37.  *  Gabe M. Wiener.  All rights reserved.  Permission is granted for 
  38.  *  non-commercial electronic distribution of this document.  
  39.  *  Distribution in any other form, or distribution as part of any 
  40.  *  commercial product requires permission. Inquire to gabe@pgm.com.
  41.  
  42. ---------
  43. TABLE OF CONTENTS FOR THE FAQ:
  44.  
  45. Section I - Netiquette
  46.  
  47.  Q1.1 - What is this newsgroup for?  What topics are appropriate here, and what
  48.         topics are best saved for another newsgroup?
  49.  Q1.2 - Do I have to be a "professional" to post here?
  50.  Q1.3 - I need to ask the group for help with selecting a piece of equipment.
  51.         What information should I provide in my message?
  52.  
  53. Section II - The business of audio
  54.  
  55.  Q2.1 - How does one get started as a professional audio engineer?
  56.  Q2.2 - Are audio schools worth the money?  Which schools are best?
  57.  Q2.3 - What are typical rates for various professional audio services?
  58.  
  59. Section III - Audio Interconnections
  60.  
  61.  Q3.1 - How are professional transmission lines and levels different from 
  62.         consumer lines and levels?  What is -10 and +4?  What's a balanced
  63.     or differential line?
  64.  Q3.2 - What is meant by "impedance matching"?  How is it done?  Why is it
  65.         necessary?
  66.  Q3.3 - What is the difference between dBv, dBu, dBV, dBm, dB SPL, and plain
  67.         old dB?  Why not just use regular voltage and power measurements?
  68.  Q3.4 - Which is it for XLRs?  Pin 2 hot?  Or pin 3 hot?
  69.  Q3.5 - What is phantom power?  What is T-power?
  70.  Q3.6 - How do I interconnect balanced and unbalanced components?
  71.  Q3.7 - What are ground loops and how do I avoid them?
  72.  Q3.8 - What is the "Pin 1 problem" and how do I avoid it?
  73.  
  74. Section IV - Analog tape recording
  75.  
  76.  Q4.1 - What does it mean to "align" a tape machine? 
  77.  Q4.2 - What is bias?  What is overbias?
  78.  Q4.3 - What is the difference between Dolby A, B, C, S, and SR?  How do each
  79.         of these systems work?
  80.  Q4.4 - What is Dolby HX-Pro?
  81.  Q4.5 - How does DBX compare to Dolby?  
  82.  Q4.6 - How much better are external microphone preamplifiers than those 
  83.         found in my portable recorder?
  84.  Q4.7 - What is an MRL?  Where do I get one?
  85.  
  86. Section V - Digital recording and interconnection
  87.  
  88.  Q5.1 - What is sampling?  What is a sampling rate?
  89.  Q5.2 - What is oversampling?
  90.  Q5.3 - What is the difference between a "1 bit" and a "multibit" converter?
  91.     What is MASH?  What is Delta/Sigma?  Should I really care?
  92.  Q5.4 - On an analog recorder, I was always taught to make sure the signal
  93.         averages around 0 VU.  But on my new DAT machine, 0 is all the way at
  94.         the top of the scale.  What's going on here?
  95.  Q5.5 - Why doesn't MiniDisc or Digital Compact Cassette sound as good as DAT
  96.          or CD?  After all, they're both digital.
  97.  Q5.6 - What is S/P-DIF?  What is AES/EBU?
  98.  Q5.7 - What is clock jitter?
  99.  Q5.8 - How long can I run AES/EBU or S/P-DIF cables?  What kind of cable
  100.     should I use?
  101.  Q5.9 - What is SCMS?  How do I defeat it?
  102.  Q5.10 - What is PCM-F1 format?
  103.  Q5.11 - How do digital recorders handle selective synchronization?
  104.  Q5.12 - How can a 44.1 kHz sampling rate be enough?
  105.  Q5.13 - Doesn't the 44.1 kHz sampling rate make it impossible to 
  106.          reproduce square waves? 
  107.  Q5.14 - How can a 16-bit word-length be enough?
  108.  Q5.15 - What's all this about 20- and 24-bit digital audio?  Aren't
  109.          CDs limited to 16 bits?
  110.  
  111. Section VI - Digital editing and mastering
  112.  
  113.  Q6.1 - What is a digital audio workstation?
  114.  Q6.2 - How is digital editing different from analog editing?
  115.  Q6.3 - What is mastering? 
  116.  Q6.4 - What is normalizing?
  117.  Q4.5 - I have a fully edited DAT that sounds just like I want it to sound on
  118.         the CD.  Is it okay to send it to the factory?
  119.  Q6.6 - What is PCM-1630?  What is PMCD?
  120.  Q6.7 - When preparing a tape for CD, how hot should the levels be?
  121.  Q6.8 - Where can I get CDs manufactured?
  122.  Q6.9 - How are CD error rates measured, and what do they mean?
  123.  
  124. Section VII - Market survey.  What are my options if I want --
  125.  
  126.  Q7.1 - A portable DAT machine
  127.  Q7.2 - A rack size DAT machine
  128.  Q7.3 - An inexpensive stereo microphone
  129.  Q7.4 - An inexpensive pair of microphones for stereo
  130.  Q7.5 - A good microphone for recording vocals
  131.  Q7.6 - A good microphone for recording [insert instrument here]
  132.  Q7.7 - A a small mixer
  133.  Q7.8 - A portable cassette machine
  134.  Q7.9 - A computer sound card for my IBM PC or Mac
  135.  Q7.10 - An eight-track digital recorder?
  136.  
  137. Section VIII - Sound reinforcement
  138.  
  139.  Q8.1 - We have a fine church choir, but the congregation can't hear them.
  140.         How do we mic the choir?
  141.  Q8.2 - How do I 'ring out' a system?
  142.  Q8.3 - How much power to I need for [insert venue here]?
  143.  Q8.4 - How good is the Sabine feedback eliminator?
  144.  
  145. Section IX - Sound restoration
  146.  
  147.  Q9.1 - How can I play old 78s?  
  148.  Q9.2 - How can I play Edison cylinders?
  149.  Q9.3 - What are "Hill and Dale" recordings, and how do I play them back?
  150.  Q9.4 - What exactly are NoNOISE and CEDAR?  How are they used?
  151.  Q9.5 - How do noise suppression systems like NoNOISE and CEDAR work?
  152.  Q9.6 - What is forensic audio?  
  153.  
  154. Section X - Recording technique, Speakers, Acoustics, Sound
  155.  
  156.  Q10.1 - What are the various stereo microphone techniques?
  157.  Q10.2 - How do I know which technique to use in a given circumstance?
  158.  Q10.3 - How do I soundproof a room?
  159.  Q10.4 - What is a near-field monitor?
  160.  Q10.5 - What are the differences between "studio monitors" and home
  161.          loudspeakers?
  162.  
  163. Section XI - Industry information
  164.  
  165. Q11.1 - Is there a directory of industry resources?
  166. Q11.2 - What are the industry periodicals?
  167. Q11.3 - What are the industry trade organizations?
  168. Q11.4 - Are there any conventions or trade shows that deal specifically 
  169.         with professional audio?
  170.  
  171. Section XII - Miscellaneous
  172.  
  173.  Q12.1 - How do I modify Radio Shack PZMs?
  174.  Q12.2 - Can I produce good demos at home?
  175.  Q12.3 - How do I remove vocals from a song?
  176.  
  177. Section XIII - Bibliography
  178.  
  179.  Q13.1 - Fundamentals of Audio Technology
  180.  Q13.2 - Studio recording techniques
  181.  Q13.3 - Live recording techniques
  182.  Q13.4 - Digital audio theory and practice
  183.  Q13.5 - Acoustics 
  184.  Q13.6 - Practical recording guides
  185.  
  186. Section XIV
  187.  
  188.  Q14.1 - Who wrote the FAQ
  189.  Q14.2 - How do you spell and pronounce the FAQ maintainer's surname?
  190.  
  191. --------
  192. THE FAQ:
  193.  
  194. Section I - Netiquette
  195.  
  196. --
  197. Q1.1 - What is this newsgroup for?  What topics are appropriate here, and what
  198.        topics are best saved for another newsgroup?
  199.  
  200.   This newsgroup exists for the discussion of issues and topics related
  201.   to professional audio engineering.  We generally do not discuss issues
  202.   relating to home audio reproduction, though they do occasionally come
  203.   up.  The rec.audio.* hierarchy of newsgroups is as follows:
  204.  
  205.       rec.audio.pro        Issues pertaining to professional audio
  206.     rec.audio.marketplace    Buying and trading of consumer equipment
  207.     rec.audio.tech         Technical discussions about consumer audio
  208.     rec.audio.opinion    Everyone's $0.02 on consumer audio
  209.     rec.audio.high-end    High-end consumer audio discussions
  210.     rec.audio.misc        Everything else
  211.  
  212.   Please be sure to select the right newsgroup before posting.
  213.  
  214. --
  215. Q1.2 - Do I have to be a "professional" to post here?
  216.  
  217.   No.  Anyone is welcome to post on rec.audio.pro so long as the messages
  218.   you post are endemic to the group in some way.  If you are not an audio
  219.   professional, we would ask that you read this FAQ in full before posting.
  220.   You may find that some of your essential questions about our field are
  221.   answered right here.  But if not, feel free to ask us.
  222.  
  223. --
  224. Q1.3 - I need to ask the group for help with selecting a piece of equipment.
  225.        What information should I provide in my message?
  226.  
  227.   If you are going to post a request for advice on buying equipment,
  228.   please provide the following information.
  229.  
  230.     Your application for the equipment
  231.     What other equipment you will be using it with
  232.     Your budget for the equipment
  233.     Any specific requirements the equipment should have
  234.  
  235.   There is nothing worse than messages like "Can anyone recommend a DAT
  236.   machine for me to buy???"  Sure we can.  But what do you want to _do_ 
  237.   with it?  We can recommend DAT machines for $400 or for $14,000.
  238.  
  239. =====
  240. Section II - The business of audio
  241.  
  242. --
  243. Q2.1 - How does one get started as a professional audio engineer?
  244.  
  245.   There are as many getting-started stories as there are audio
  246.   engineers.  The routes into the industry are highly dependent on what
  247.   aspect of the industry one wishes to enter.  For instance, many
  248.   engineers who work in the classical-music field have at one time or
  249.   another been classical performers.  Others enter through their work in
  250.   other musical genres, or through engineering programs at universities
  251.   or technical schools.  Without exception, everyone in the industry has
  252.   learned at least a portion of their craft from watching those with
  253.   more hands-on experience.  Whether this comes from a formal internship
  254.   or just from sustained observation and long-term question-asking, it
  255.   is almost always universally true. [Gabe]
  256.  
  257. --
  258. Q2.2 - Are audio schools worth the money?  Which schools are best?
  259.  
  260.   An audio school will teach you the basics of the audio business, 
  261.   but just like any technical school, what they teach you may not be 
  262.   worth what you pay.
  263.  
  264.   There are several schools of thought:
  265.  
  266.   1. Audio schools are great, you get trained on the gear that is used
  267.      by top studios and costs millions of dollars, you get taught by pros
  268.      in the field and you have job placement assistance after you graduate.
  269.  
  270.   2. Going to an audio school is like wanting to learn aviation,
  271.      and when you start flight school they teach you a 747.  In the
  272.      real world, you are probably not going to have 96 channel automated
  273.      consoles on your first job.  You are not going to mix your first 
  274.      live gig on a 48-channel 100,000 watt stadium PA rig.  Better to 
  275.      start off on real world equipment and work your way up to the 
  276.      top-of-the-line stuff.  Most recording studios are 24-track analog 
  277.      or less and most PA systems are 16 channel, 3,000 watts or less.  
  278.      Don't buy education for something you will never get to use after 
  279.      you leave the school.
  280.  
  281.   3. Audio Schools are a waste of money.  Instead of spending $18,000 
  282.      for a course and having nothing to show for it but a technical 
  283.      certificate (which everyone knows is no help at all getting a job), 
  284.      you would be better off spending the 18 grand on books and gear and 
  285.      learning by trial and error, or saving the 18 grand altogether and 
  286.      learning first from reading, and later from apprenticing.
  287.     [jsaurman@cftnet.com (Jim Saurman)]
  288.  
  289.   Jim summarizes the opinions pretty well.  Recognize that an altogether
  290.   different option is to attend a full four-year college program.  Many
  291.   colleges and universities offer such programs.  Examples include 
  292.   Peabody Conservatory, Cleveland Institute of Music, McGill University,
  293.   New York University, University of Miami at Coral Gables, and the
  294.   University of Massachusetts at Lowell.  Without fail, graduates from
  295.   these sorts of programs earn far more respect than graduates of any
  296.   technical school.  [Gabe]
  297.  
  298. --
  299. Q2.3 - What are typical rates for various professional audio services?
  300.  
  301.   Depends on what you want to have done, and where.
  302.  
  303.   One can pay upwards of $300/hr for prime studio rental time in New York.
  304.   In a small community however, one might find a project studio for $25/hr.
  305.   Generally speaking, the rule is: the rarer the service, the more it will
  306.   cost.  In a community with dozens of small 8-track studios, you won't
  307.   have to pay much.  If you need emergency audio restoration, or mastering
  308.   by a top-flight pop-music engineer, you can expect to drop many hundreds
  309.   of dollars an hour.  Like so many other things in this industry, there
  310.   are no rules, and Smith's invisible hand guides the market. [Gabe]
  311.  
  312. =====
  313. Section III - Audio Interconnections
  314.  
  315. --
  316. Q3.1 - How are professional transmission lines and levels different from 
  317.        consumer lines and levels?  What is -10 and +4?  What's a balanced
  318.        or differential line?
  319.  
  320.   Professional transmission lines differ from consumer lines in two
  321.   ways.  First, consumer lines tend to run about 14 dB lower in level
  322.   than pro lines.  Second, professional lines run in differential, or
  323.   balanced, configuration.
  324.  
  325.   In a single-ended line, the signal travels down one conductor and
  326.   returns along a shield.  This is the simplest form of audio
  327.   transmission, since it is essentially the same AC circuit you learned
  328.   about in high-school physics.  The problem here is that any noise
  329.   or interference that creeps into the line will simply get added to
  330.   the signal and you'll be stuck with it.
  331.  
  332.   In a differential line, there are three conductors.  A shield, a
  333.   normal "hot" lead, and a third lead called the "cold" or "inverting"
  334.   lead, which carries a 180-degree inverted copy of the hot lead.  Any
  335.   interference that creeps into the cable thus affects both the hot and
  336.   cold leads equally.  At the receiving end, the hot and cold leads are
  337.   summed using a differential amplifier, and any interference that has
  338.   entered the circuit (called "common-mode information" since it is
  339.   common to both the hot and cold leads), gets canceled out.
  340.   Differential lines are thus better suited for long runs, or for
  341.   situations where noise or interference may be a factor.  [Gabe]
  342.  
  343. --
  344.  Q3.2 - What is meant by "impedance matching"?  How is it done?  Why is it
  345.         necessary?
  346.  
  347.   We can talk about the characteristic impedance of an input, which is to
  348.   say the ratio of voltage to current that it likes to see, or how much
  349.   it loads down a source.  (You can think of this as being an "AC resistance"
  350.   and you would be mostly right, although it's actually the absolute 
  351.   magnitude of the vector drawn by the resistive and reactive load
  352.   components.  Dealing with line level signals, reactive components
  353.   are going to be negligible, though).
  354.  
  355.   In general, in this modern world, most equipment has a low impedance
  356.   output, going into relatively high impedance input.  This wastes some
  357.   amount of power, but because electricity is cheap and it's possible to
  358.   build low-Z outputs easily today, this is not a big deal.
  359.  
  360.   With microphones, it _is_ a big deal, because the signal levels are
  361.   very low, and the drive ability poor.  As a result, we try and get the
  362.   best efficiency possible from microphones to get the lowest noise
  363.   floor.  This is often done by using transformers to step up the voltage
  364.   or step it down, to go into a higher or lower Z load.  Transformers
  365.   have some major disadvantages in that they can be significant sources
  366.   of nonlinearity, but back in the days of tubes they were the only
  367.   solution.  Tubes have a very high-Z input, and building balanced inputs
  368.   with tubes requires three devices instead of one.  As a result, all
  369.   mike preamps would have a 600 ohm balanced input, with a transformer,
  370.   driving a preamp tube.  Today, transistor circuits can be used for 
  371.   impedance matching, although they are often more costly and can be noisier
  372.   in cases.
  373.  
  374.   As a result of the expense, consumer equipment was built with high-Z 
  375.   microphone inputs, and high-Z microphones.  This resulted in more noise
  376.   pickup problems, but was cheaper to make.  Unfortunately this still
  377.   held on into the modern day of the transistor, and a lot of high-Z
  378.   consumer gear exists.  Guitar pickups are generally high-Z devices,
  379.   and require a direct box to reduce the impedance so that they can go into
  380.   a standard 600 ohm mike preamp directly.
  381.  
  382.   Many years ago, the  techniques that were used in audio came originally
  383.   from telephone company practice.  Phone systems operate with 150 or 600
  384.   ohm balanced lines, and adoption of this practice into the audio industry
  385.   caused those standards to be used.  In the modern age where lines are
  386.   relatively short and transformers considered problematic, the tendency
  387.   has been to have low-Z outputs for all line level devices,  driving
  388.   high-Z inputs.  While this is not the most efficient system, it is relatively
  389.   foolproof, and appears on most consumer equipment.  A substantial amount of
  390.   professional gear, however, still uses internal balancing transformers or
  391.   resistor networks to match to a perfect 600 ohm impedance.   [Scott]
  392.  
  393.   [Ed. note: Modern equipment works on principles of voltage transfer
  394.   rather than power transfer.  Thus a standard audio circuit today is
  395.   essentially a glorified voltage divider.  You have a very low output
  396.   impedance and a very high input impedance such that the most voltage
  397.   is dropped across the load.  This is not an impedance-matched circuit
  398.   in the classic sense of the word.  Rather, it is a "bridged" or
  399.   "constant voltage" impedance match, and is the paradigm on which
  400.   nearly all audio circuits operate nowadays. -Gabe]
  401.  
  402. --
  403. Q3.3 - What is the difference between dBv, dBu, dBV, dBm, dB SPL, and plain
  404.        old dB?  Why not just use regular voltage and power measurements?
  405.  
  406.   Our ears respond logarithmically to increases in sound pressure level.
  407.   In order to simplify the calculations of these levels, as well as the
  408.   electrical equivalents of them in audio systems, the industry uses a
  409.   logarithmic system to denote the values.  Specifically, the decibel is
  410.   used to denote logarithmic level above a given reference.  For
  411.   instance, when measuring sound pressure level, the basic reference
  412.   against which we take measurements is the threshold of hearing for
  413.   the average individual, 10^-12 W/m^2.  The formula for dB SPL then
  414.   becomes:
  415.  
  416.     10 Log X / 10^-12  where X is the intensity in W/m^2
  417.  
  418.   The first people who were concerned about transmitting audio over
  419.   wires were, of course, the telephone company.  Thanks to Ma Bell we
  420.   have a bunch of other decibel measurements.  We can use the decibel to
  421.   measure electrical power as well.  In this case, the formula is
  422.   referenced to 1 milliwatt in the denominator, and the unit is dBm.  1
  423.   milliwatt was chosen as the canonical reference by Ma Bell.  Since
  424.   P=V^2 / R, we can also express not only power gain in dB but also
  425.   voltage gain.  In this case the equation changes a bit, since we have
  426.   the ^2 exponent.  When we take the logarithm, the exponent comes
  427.   around into the coefficient, making our voltage formula 20 log.  
  428.   In the voltage scenario, the reference value becomes 0.775 V (the
  429.   voltage drop across 600 ohms that results in 1 mW of power).  The
  430.   voltage measurement unit is dBv.
  431.  
  432.   The Europeans, not having any need to abide by Ma Bell's choice for a
  433.   canonical value, chose 1V as their reference, and this is reflected
  434.   as dBV instead of dBv.  To avoid confusion, the Europeans write the
  435.   American dBv as dBu.  Confused yet?  [Gabe]
  436.  
  437. --
  438. Q3.4 - Which is it for XLRs?  Pin 2 hot?  Or pin 3 hot?
  439.  
  440.   Depends on whom you ask!  Over the years, different manufacturers have
  441.   adopted varying standards of pin 2 hot and pin 3 hot (and once in a
  442.   while, pin *1* hot!).  But nowadays most manufacturers have adopted  
  443.   pin 2 hot.  Still, it is worth taking the extra minute or two to check  
  444.   the manual.  The current AES standard is pin 2 hot.  [Gabe]
  445.  
  446. --
  447. Q3.5 - What is phantom power?  What is T-power?
  448.  
  449.   Condenser microphones have internal electronics that need power
  450.   to operate. Early condenser microphones were powered by
  451.   batteries, or separate power supplies using multi-conductor
  452.   cables. In the late 1960's, German microphone manufacturers
  453.   developed 2 methods of sending power on the same wires that carry
  454.   the signal from the microphone.
  455.  
  456.   The more common of these methods is called "phantom power" and is
  457.   covered by DIN spec 45596. The positive terminal of a power
  458.   supply is connected through resistors to both signal leads of a
  459.   balanced microphone, and the negative terminal is connected to
  460.   ground. 48 volts is the preferred value, with 6800 ohm resistors
  461.   in each leg of the circuit, but lower voltages and lower resistor
  462.   values are also used. The precise value of the resistors is not
  463.   too critical, but the two resistors must be matched within 0.4%.
  464.  
  465.   Phantom power has the advantage that a dynamic or ribbon mic may
  466.   be plugged in to a phantom powered microphone input and operate
  467.   without damage, and a phantom powered mic can be plugged in to
  468.   the same input and receive power. The only hazard is that in case
  469.   of a shorted microphone cable, or certain old microphones having
  470.   a grounded center tap output, current can flow through the
  471.   microphone, damaging it. It's a good idea anyway to check cables
  472.   regularly to see that there are no shorts between any of the
  473.   pins, and the few ribbon or dynamic microphones with any circuit
  474.   connection to ground can be identified and not used with phantom
  475.   power.
  476.  
  477.   T-power (short for Tonaderspeisung, also called AB or parallel
  478.   power, and covered by DIN spec 45595) was developed for portable
  479.   applications, and is still common in film sound equipment.
  480.   T-power is usually 12 volts, and the power is connected across
  481.   the balanced pair through 180 ohm resistors. Only T-power mics
  482.   may be connected to T-power inputs; dynamic or ribbon mics may be
  483.   damaged and phantom powered mics will not operate properly. [David]
  484.  
  485. --
  486. Q3.6 - How do I interconnect balanced and unbalanced components?
  487.  
  488.   First, let's define what the terms mean. The simplest audio
  489.   circuit uses a single wire to carry the signal; the return path,
  490.   which is needed for current to flow in the wire, is provided
  491.   through a ground connection, usually through a shield around the
  492.   wire.  This system, called unbalanced transmission, is very
  493.   susceptible to hum pickup and cannot be used for low level
  494.   signals, like audio, for more than a few feet. Balanced
  495.   transmission occurs when two separate and symmetrical wires are
  496.   used to carry the signal. A balanced input is sensitive only to
  497.   voltage that appears between the two input terminals; signals
  498.   from one terminal to ground are canceled by the circuit.
  499.  
  500.   The simplest way to connect between balanced and unbalanced
  501.   equipment is to use a transformer. The signals are magnetically
  502.   coupled through the core of the transformer and either side may
  503.   be balanced or unbalanced. Good transformers are expensive,
  504.   however, and there are cheaper methods that can be used in some
  505.   instances.
  506.  
  507.   An unbalanced output can be connected to a balanced input. For
  508.   instance, from the unbalanced output of a CD player, connect the
  509.   center pin to pin 2 of the balanced XLR input connector, and the
  510.   ground to pins 1 and 3.  To connect the balanced output of something
  511.   to an unbalanced input requires different techniques depending on
  512.   whether the output is active balanced (each side has a signal with
  513.   respect to ground) or floating balanced (for instance, the secondary
  514.   of a transformer with no center-tap connection). If it's an active
  515.   balanced output, you can simply use half of it; connect pin 2 to the
  516.   unbalanced input, and pin 1 to ground, leaving pin 3 floating. If this
  517.   doesn't work (no or very weak signal) connect pin 3 of the output to 
  518.   pin 1 and ground and leave pin 2 connected to the unbalanced input 
  519.   center pin. Some active balanced outputs, particularly microphones, 
  520.   use the balanced circuit to cancel distortion, so this hookup may
  521.   result in higher distortion than if a proper balanced-to-unbalanced
  522.   converter such as a differential stage or a transformer were used.
  523.   [David]
  524.  
  525. --
  526. Q3.7 - What are ground loops and how do I avoid them?
  527.  
  528.   One of the most difficult troubleshooting tasks for the audio
  529.   practitioner is finding the source of hum, buzz and other
  530.   interfering signals in the audio signal. Often these are caused
  531.   by "ground loops." This unfortunate and inaccurate term (it need
  532.   not be in the "ground" path, and the "loop" is not what causes
  533.   the problem) is poorly understood by most users of audio
  534.   equipment. A better name for this phenomenon is "shared path
  535.   coupling" because it happens when two signals share the same
  536.   conductor path and couple to each other as a result.
  537.  
  538.   Another semantic problem that should be addressed early on is the
  539.   idea that "ground" is one place where all currents go. It's not,
  540.   there's nothing special about calling a signal "ground," current
  541.   still flows through any path that's available to it.
  542.  
  543.   Referring to the discussion above regarding unbalanced signal
  544.   paths, recall that there must be a complete circuit from the
  545.   output of some device, through the input of another device and
  546.   back to the "return" side of the output if any current is to
  547.   flow. Current doesn't flow by itself, it must have a complete
  548.   path. If there are multiple paths over which the current might
  549.   flow, the current will be divided among them with most of the
  550.   current flowing through the path having the least resistance. Any
  551.   available path, regardless of the resistance in it, will carry
  552.   some of the current, it's not a case of all the current following
  553.   the path that has least resistance.
  554.  
  555.   For example, suppose we have two units connected together through
  556.   a small piece of coaxial cable, and the units are also connected
  557.   together at the wall outlet through their grounded power cords --
  558.   the ground pins are connected to the chassis at each end. The
  559.   audio signal goes along the center of the coaxial cable, and part
  560.   of it might come back along the shield of the coax, but part will
  561.   also go through the ground wire of one unit and back through the
  562.   ground wire of the other unit. A problem arises when some other
  563.   signal is also flowing through this same return path. The other
  564.   signal might be another audio signal, video, data, or power. All
  565.   of the currents in a wire add together, and the resistance of the
  566.   wire causes a voltage to appear in proportion to the current
  567.   flowing. All of these voltages add together, so there is a little
  568.   bit of the video signal added to the audio, some of the power
  569.   signal added to the video, some of the power signal added to the
  570.   audio, etc. In rare instances, the "loop" of wire formed by the
  571.   intended ground return path and the happenstance lower resistance
  572.   return path formed by mounting hardware, power cords, etc. can
  573.   form a magnetic pickup as well, so that magnetic fields radiated
  574.   by transformers, CRT's, etc. can also induce a current in the
  575.   "loop," which makes yet another source of noise voltage.
  576.  
  577.   This shared path coupling is a constant problem with unbalanced
  578.   audio systems. Lots of different methods have been tried to get
  579.   around the problem, many of them dangerous. Clipping off the
  580.   ground leads of equipment so there is no common power line path
  581.   between them simply makes any fault or leakage current follow
  582.   some other path, back through the signal cable to some equipment
  583.   that has a ground -- perhaps through the user's body, if all the
  584.   ground pins have been removed. The only general solution to
  585.   "ground loop" coupling with unbalanced equipment is to connect
  586.   all the chassis together with a very low resistance path (copper
  587.   strap or braid, for example), on the principle that since the
  588.   resistance is so low, any leakage current will produce a
  589.   correspondingly low signal voltage. It may also be effective to
  590.   interrupt the ground path of shield conductors over signal wires;
  591.   force the return path to go through the designated common strap
  592.   while leaving the shield in place only for electrostatic
  593.   screening.
  594.  
  595.   With balanced equipment, no current should be flowing in the
  596.   shield conductors, and in fact performance should be identical
  597.   with the shield left disconnected at one end (preferably the
  598.   receiver end). Therefore balanced systems should be impervious to
  599.   shared path coupling or "ground loop" problems but in fact they
  600.   aren't, because most signals inside a given piece of equipment
  601.   are unbalanced, and there are often return paths internal to the
  602.   equipment that can be shared with return paths between other
  603.   units of equipment connected to it. Especially with mixed
  604.   digital, video and audio signals and high gain, high negative
  605.   feedback amplifier circuitry, this can be a big problem -- small
  606.   currents can create big effects -- and this brings us to the next
  607.   question.  [David]
  608.  
  609. --
  610. Q3.8 - What is the "Pin 1 problem" and how do I avoid it?
  611.  
  612.   This is a special case of "ground loop" or shared path coupling.
  613.   Recently this has been discussed in great detail and clarity by a
  614.   group led by the consultant Neil Muncy of Toronto. Suppose you
  615.   have a mixer, whose balanced output is connected to an
  616.   amplifier's balanced input through a correctly wired cable. Both
  617.   units are powered from the AC mains and one or both have some
  618.   small amount of AC leakage current that travels to ground through
  619.   all available ground paths -- including the shield of the cable
  620.   that connects the two units. So far so good, no harm done because
  621.   the circuit is balanced and any common mode voltage from current
  622.   flowing through the shield will be canceled by the amplifier
  623.   input. However... a small part of this leakage current also
  624.   travels through the shield of the wire going from the back panel
  625.   XLR connector to the PC board, through some "ground" traces on
  626.   the PC board, and back out through the power line ground cable.
  627.   No problem so far, except that some gain stage on that same PC
  628.   board also uses that piece of ground trace in its negative
  629.   feedback loop, and some part of that leakage signal will be added
  630.   to the signal in that gain stage; it might be video, or data, or
  631.   another audio signal, or (most commonly) power.
  632.  
  633.   The solution to this variant of shared path coupling is the same
  634.   sort of approach that applies to other unbalanced signals: give
  635.   the leakage current a very low resistance path to follow, and
  636.   remove as many of the shared paths as possible. Within a unit of
  637.   equipment, all the XLR connectors' pin 1 terminals should be
  638.   connected to ground with very low resistance (big) wire or
  639.   traces, and preferably all of the ground connections should be
  640.   made at one point, the so-called "star ground" system. A brute
  641.   force approach is to assume that the back panel is the star
  642.   ground, and wire every connector's pin 1 solidly to the panel as
  643.   directly as possible, and lift all the ground wires but one that
  644.   go from the connectors to the circuitry. In this way, all the
  645.   external leakage currents (the "fox" to use Neil Muncy's term)
  646.   will be conducted through the back panel and out of the way,
  647.   rather than running them through the ground traces on the PC
  648.   board where they will mix with internal low level signals in high
  649.   gain stages (the "hen house"). Individual wires can be run from
  650.   points on the circuit board that need to be at "ground" potential
  651.   to a common point on the back panel, which is designated a "zero
  652.   signal reference point" (ZSRP). Equipment that has a reputation
  653.   for being "quiet" and easy to use in many different applications
  654.   is often found to be wired this way, while equipment that is
  655.   "temperamental" if often found to be wired in such a way that
  656.   leakage currents are easily coupled to internal signal lines.
  657.  
  658.   There's a simple test that can be done to check equipment
  659.   susceptibility to this problem. Connect the output, preferably
  660.   balanced and floating, of an ordinary audio oscillator to the pin
  661.   1 of any two XLR connectors on the equipment. Now operate the
  662.   equipment through its various modes, gain settings, etc. You may
  663.   be surprised to find the audio oscillator's signal appearing in
  664.   many different places in the equipment. [David]
  665.  
  666. =====
  667. Section IV - Analog tape recording
  668.  
  669. --
  670. Q4.1 - What does it mean to "align" a tape machine? 
  671.  
  672.   There are a number of standard adjustments on any analogue tape
  673.   machine, which can roughly be broken up into mechanical and electronic
  674.   adjustments.  The mechanical adjustments include the head position
  675.   (height, skew, and azimuth), and sometimes tape speed.  Incorrect head
  676.   height will result in poor S/N and leakage between channels, because
  677.   the tracks on the head do not match up exactly with those on the tape.
  678.   Incorrect tape skew will result in level differences between channels
  679.   and uneven head wear, because there is more pressure on the top of the
  680.   head than the bottom (or vice versa).  Incorrect azimuth will result
  681.   in loss of high frequency response and strange skewing of the stereo
  682.   image.  Tape speed error will result in tonal shifts, although on many
  683.   machines with capstan speed controlled by crystal or line frequency,
  684.   it is not adjustable.
  685.  
  686.   Electronic adjustments include level and bias adjustments for each
  687.   channel.  Some machines may have bias frequency adjustments, equalization
  688.   adjustments for playback and record emphasis, pre-distortion adjustments,
  689.   and a varied bevy of adjustments for noise reduction systems.
  690.  
  691.   Alignment is relatively simple, and the same general method applies
  692.   from the smallest cassette deck to the largest multitrack machine.
  693.   First, put a test tape on the machine.  Use a real reference tape,
  694.   from the manufacturer, from MRL, or a similarly legitimate lab.  DO
  695.   NOT EVER use a homebrew test tape that was recorded on a "known good"
  696.   machine.  You will regret it someday.  Spend the money and get a real
  697.   test tape (and not one of the flaky ones from RCA).
  698.  
  699.   1. Speed adjustment (if necessary).  Play back a 1 KHz reference tone
  700.      and, using a frequency counter, adjust the tape speed for proper
  701.      frequency output.  There are strobe tapes available for this as well,
  702.      but with cheap frequency counters available, this method is much easier.
  703.  
  704.   2. Head height and skew adjustments.  Better see your machine's manual
  705.      on this one, because I have seen a variety of ways of doing this.
  706.  
  707.   3. Azimuth adjustment.  I find the easiest way to do this is to take
  708.      the left and right outputs and connect them to the X and Y inputs
  709.      of an oscilloscope, and play back a 1 KHz reference tone, while
  710.      adjusting the azimuth until a perfectly-diagonal line appears.
  711.      You can do this by ear if you are desperate, but I strongly recommend
  712.      the lissajous method, which is faster and more accurate.  On multitrack
  713.      decks, use the two tracks as close as possible to the edge of the tape.
  714.      Now you have the playback head azimuth set... put a 1 KHz source into
  715.      the record input, with a blank tape on the machine, and adjust the
  716.      azimuth of the record head for the proper diagonal line.
  717.  
  718.   4. Playback eq adjustment (if necessary).  This is a case of playing
  719.      back various test tones at different frequencies, and adjusting the
  720.      response curve of the deck to produce a flat output.  You can also
  721.      do this by playing back white noise and using a third-octave spectrum
  722.      analyzer of great accuracy to adjust for flat response.  Again, this
  723.      is one to check your deck's manual for, because the actual 
  724.      adjustments vary from one machine to another, and you will want to 
  725.      use the test tape once again.
  726.  
  727.   5. Record eq adjustment (if necessary).  How this is done (and whether you
  728.      want to do it after biasing the tape) depends a lot on your deck.
  729.  
  730.   6. Bias adjustment.  There are a lot of ways to do this.  My favorite method
  731.      is to use a white noise source, and adjust the bias until the source and
  732.      tape output sound identical.  Some people prefer to use a signal generator
  733.      and set so that the levels of recorded tones at 1 KHz and 20 KHz are
  734.      identical.  I find I can get within .5 dB by ear, though your mileage
  735.      may differ.  [Ed. note:  Many tapes have recommended overbias settings,
  736.      and many decks will also provide a chart that correlates the amount of
  737.      overbias against available tape formulations.  -Gabe]
  738.  
  739.   7. Record level adjustment.  I use a distortion analyzer, and set the level
  740.      so that at +3 dB, I get 3% distortion on the output.  Some folks who are
  741.      using very hot tape set the machines so that a certain magnetic flux is
  742.      produced at the heads given a certain input, but I find setting for
  743.      a given distortion point does well for me.  If you don't have a distortion
  744.      analyzer, use a 1 KHz tone source and set so that you have the onset of
  745.      audible distortion at +3 dB, and you will be extremely close.
  746.  
  747.      [Ed. note:  The traditional way to do this is to align the repro side
  748.      of the machine using a calibration tape, and then to put the machine
  749.      into record.  Monitoring off the repro head, the operator then aligns
  750.      the record electronics until the output is flat. -Gabe]
  751.  
  752.   At this point, you will be pretty much set.  Whether you want to do this
  753.   all on a regular basis is a good question.  You should definitely go
  754.   through the complete procedure if you ever change brands of tape.  Checking
  755.   the mechanical parameters on a regular basis is a good idea with some
  756.   decks (like the Ampex 350), which tend to drift.  Clean your heads
  757.   every time you put a new reel on, and demagnetize regularly.  [Scott]
  758.  
  759. --
  760. Q4.2 - What is bias?  What is overbias?
  761.  
  762.   With just the audio signal applied to a tape, the frequency response
  763.   is very poor.  High frequency response is much better than low
  764.   frequency, and the low frequency distortion is very high.  In 1906,
  765.   the Poulson Telegraphone managed to record an intelligible voice on a
  766.   magnetic medium, but it was not until the 1930s when this problem was
  767.   solved by German engineers.  
  768.  
  769.   To compensate for the tape characteristic, a very high frequency
  770.   signal is applied to the tape in addition to the audio.  This is
  771.   typically in the 100 KHz range, far above the audio range.  With the
  772.   bias adjusted properly, the frequency response should be flat across
  773.   the audible range.  With too low bias, bass distortion will be the
  774.   first audible sign, but with too much bias, the high frequency
  775.   response will drop off.
  776.  
  777.   Incidentally, digital recording equipment takes advantage of the very
  778.   nonlinearity that is a problem with analogue methods.  It records a
  779.   square wave on the tape, driving the tape into saturation at all
  780.   times, and extracts the signal from the waveform edges.  As a result,
  781.   no bias is required.  (For a good example of the various digital
  782.   recording methods, check out NASA SP 5038, _Magnetic Tape Recording_.)
  783.   [Scott]
  784.  
  785.   [Ed. note: For those looking for an understanding of why we need
  786.   bias in the first place, here is one way to think about it.  Tape
  787.   consists of lots of small magnetic particles called domains.  These
  788.   domains are exposed to a magnetic field from the record head and 
  789.   oscillate in polarity as the AC signal voltage changes.  Domains,
  790.   being physical objects, have inertia.  Every time the analog signal
  791.   crosses from positive to negative and back again, the voltage passes
  792.   the zero point for an instant.  At this moment, the domain is at rest,
  793.   and like any other physical object, there is a short period of inertia
  794.   before it gets moving again.  The result is the bizarre high-frequency
  795.   performance characteristic that Scott described.  The high frequency of
  796.   a bias signal simply ensures that the domains are always kept in motion,
  797.   negating the effect of inertia at audio frequencies.  -Gabe]
  798.  
  799. --
  800. Q4.3 - What is the difference between Dolby A, B, C, S, and SR?  How do each
  801.         of these systems work?
  802.  
  803.   The Dolby A, B, C, SR, and S noise reduction (NR) systems are non-linear
  804.   level-dependent companders (compressors/expanders). They offer various
  805.   amounts of noise reduction, as shown in the table below.
  806.  
  807.     Dolby   HF NR   LF NR  Number Of Active              Target
  808.     System  Effect  Effect Frequency Bands               Market     Year
  809.     ------  ------  ------ ----------------------------  ---------  ----
  810.       A     10 dB   10 dB  4 fixed                       Pro audio  1967
  811.       B     10 dB   --     1 sliding (HF)                Domestic   1970
  812.       C     20 dB   --     1 sliding (HF)                Domestic   1981
  813.       SR    24 dB   10 dB  1 sliding (HF), 1 fixed (LF)  Pro audio  1986
  814.       S     24 dB   10 dB  1 sliding (HF), 1 fixed (LF)  Domestic   1990
  815.     ------  ------  -----  ----------------------------  ---------  ----
  816.  
  817.   The band-splitting system used with Dolby A NR is a relatively costly
  818.   technique, although it can deal with noise at all frequencies. The
  819.   single sliding band techniques used in Dolby B and C systems are less
  820.   costly, making them more suitable for consumer tape recording
  821.   applications where the dominant noise contribution occurs at high
  822.   frequencies.
  823.  
  824.   The typical on-record frequency response curves for the Dolby B NR
  825.   system look something like those depicted below. The curves for Dolby C,
  826.   SR, and S are similar, but the actual response levels and behaviour at
  827.   high frequencies are modified to extract better performance form these
  828.   more advanced systems.
  829.  
  830.          |
  831.     0dB -|----------------------------------------------------
  832.          |
  833.          |
  834.   -10dB -|
  835.          |                    /-------------------------------
  836.          |                   /
  837.   -20dB -|------------------/
  838.          |
  839.          |
  840.   -30dB -|                      /-----------------------------
  841.          |                    /
  842.          |                  /
  843.   -40dB -|----------------/
  844.          |______________________________________________________
  845.          |                   |                                 |
  846.         20Hz                1kHz                             20kHz
  847.  
  848.   The above picture attempts to show that the encoding process provides
  849.   selective boost to high frequency signals (decoding is the exact
  850.   reciprocal), and the curves correspond to the results achieved when no
  851.   musical signal is applied. The amount of boost during the compansion
  852.   depends on the signal level and its spectral content. For a tone at
  853.   -40dB at 3 kHz, the boost applied to signals with frequencies above this
  854.   would probably be the full 10dB allowed by the system. If the same tone
  855.   were at a level of -20dB, then the boost would be less, maybe about 5dB.
  856.   If the tone was at 0dB, then no boost would be supplied, as tape
  857.   saturation would be increased (beyond it's normal amount).
  858.  
  859.   The single band of compansion utilized with Dolby B NR reaches
  860.   sufficiently low in frequency to provide useful noise reduction when no
  861.   signal is present. Its width changes dynamically in response to the
  862.   spectral content of music signals. As an example, when used with a solo
  863.   drum note the companding system will slide up in frequency so that the
  864.   low frequency content of the drum will be passed through at its full
  865.   level. On replay, the playback of the bass drum is allowed to pass
  866.   through without modification to its level, while the expander lowers the
  867.   volume at high frequencies above those of the bass drum, thus providing
  868.   a reduction in tape hiss where there is no musical signal. If a guitar
  869.   is now added to the music signal, the companding band slides further up
  870.   in frequency allowing the bass drum and guitar signals through without
  871.   any compansion, while still producing a worthwhile noise reduction
  872.   effect at frequencies above those of the guitar.
  873.  
  874.   The Dolby B NR system is designed to start taking effect from 300Hz, and
  875.   its action increases until it reaches a maximum of 10dB upwards of 4kHz.
  876.   Dolby C improves on this by taking effect from 100Hz and providing about
  877.   15dB of NR at 400Hz, increasing to a maximum of 20dB in the critical
  878.   hiss region from 2kHz to 10kHz. Dolby C also includes spectral skewing
  879.   networks which introduce a rolloff above 10kHz prior to the compander
  880.   when in encoding mode. This helps to reduce compander errors caused by
  881.   unpredictable cassette response above 10kHz, and an inverse boost is
  882.   added after the expander to compensate. Although this reduces the noise
  883.   reduction effect above 10kHz, the ear's sensitivity to noise in that
  884.   region is diminished, and the improved encode/decode tracking provides
  885.   important improvements in overall system performance. An anti-saturation
  886.   shelving network, beginning at about 2kHz, also acts on the high
  887.   frequencies but it only affects the high-level signals that would cause
  888.   tape saturation. A complementary network is provided in the decode chain
  889.   to provide overall flat response.
  890.  
  891.   When the tape is played back, the inverse of the above process takes
  892.   place. For an accurate decoding to occur, it is necessary that playback
  893.   takes place with no offsets in levels between record and replay. i.e. If
  894.   a 400 Hz tone is recorded at 0dB (or -20dB), then it must play back at
  895.   0dB (or -20dB). This will help ensure correct Dolby "tracking".
  896.  
  897.   Just think about it: if a -40dB tone at 8kHz was recorded with
  898.   Dolby B on, then it would actually have a level of -30dB on tape.
  899.   The same tone, if it were at a -20dB level, would have a level of
  900.   about -15dB on tape. If the sensitivity of the tape was such
  901.   that anything recorded at 0dB actually went on tape as -10dB,
  902.   then you can see that the Dolby encoded tones would actually be
  903.   at a lower level, and the system would have no way of determining
  904.   this. It assumes 0dB in = 0dB out. Hence the signal would be
  905.   decoded with the incorrect amount of de-boost.
  906.  
  907.   The Dolby SR and S NR systems provide slightly more NR than Dolby C at
  908.   high frequencies, 24dB vs 20dB, but they also achieve a 10dB NR effect
  909.   at low frequencies below 200Hz as well. This is obtained using a
  910.   two-band approach, the low-frequencies being handled by a fixed-band
  911.   processor, while the high frequencies are tackled by a sliding band
  912.   processor. This reduces the potential for problems such as "noise
  913.   pumping", caused by high-level low frequency transient signals (bass
  914.   notes from drums, double basses, organs), raising the sound level in a
  915.   cyclic fashion. Dolby SR and S also contain the spectral skewing and
  916.   anti-saturation circuits for high-level high-frequency signals that are
  917.   implemented with Dolby C. The performance of the sliding band is
  918.   improved over that obtained with Dolby B and C NR systems by reducing
  919.   the degree of sliding that occurs in the presence of high-frequency
  920.   signals. This increases the noise reduction effect available at
  921.   frequencies below those occurring in the music signal.
  922.  
  923.   An additional benefit of the Dolby S NR system for consumers is that the
  924.   manufacturers of cassette decks who are licensed to use the system must
  925.   adhere to a range of strict performance standards. These include an
  926.   extended high frequency response, tighter overall response tolerances, a
  927.   new standard ensuring head height accuracy, increased overload margin in
  928.   the electronics, lower wow and flutter, and a head azimuth standard.
  929.   These benefit users by enhancing the performance of cassette recorders
  930.   as well as helping to ensure that tapes recorded on one deck will play
  931.   back accurately on any other. [Witold Waldman - witold@aed.dsto.gov.au]
  932.  
  933. --
  934. Q4.4 - What is Dolby HX-Pro?
  935.  
  936.   HX-Pro is a scheme to reduce the level of the bias signal when high
  937.   frequency information is present in the recorded signal.  Sufficient
  938.   high frequency information will act to bias the tape itself, and by
  939.   reducing the AC bias signal somewhat, additional signal can be applied
  940.   without saturating the tape.  This is a single-ended system; it
  941.   requires no decoding on playback, because it merely permits more
  942.   signal to be recorded on the tape.  In theory it is an excellent idea,
  943.   and some implementations have lived up to the promise of the method,
  944.   although some other implementations have produced unpleasant
  945.   artifacts. [Scott]
  946.  
  947. --
  948. Q4.5 - How does DBX compare to Dolby?  
  949.  
  950. [Anyone?  Anyone?  -G]
  951.  
  952. --
  953.  Q4.6 - How much better are external microphone preamplifiers than those 
  954.         found in my portable recorder?
  955.  
  956.   Going by the rule that "external is better than internal," the
  957.   external preamps are likely to sound better.  Besides the issue of
  958.   electrical shielding and interaction, it is simply the case that a
  959.   designer who is spending *all* his time on a project designing only a
  960.   preamp is likely to do a better job of it than a tape machine design
  961.   team that has to worry how they're going to fit the preamp into the
  962.   box and still have enough room for the rest of the tape machine. [Gabe]
  963.  
  964. --
  965. Q4.7 - What is an MRL?  Where do I get one?
  966.  
  967.   An MRL is a reference alignment tape from Magnetic Reference Laboratory.
  968.   These tapes, available in every conceivable tape speed, tape width, 
  969.   equalization, and field strength, contain alignment tones useful in
  970.   calibrating the electronics of analog tape machines.
  971.  
  972.   These tapes can be ordered from many pro audio dealers.  If not, you
  973.   can contact MRL directly at:
  974.  
  975.     Magnetic Reference Laboratory, Inc.
  976.     229 Polaris Avenue, Suite 4
  977.     Mountain View, CA 94043
  978.  
  979.     Tel: (415) 965-8187
  980.     Fax: (415) 965-8548
  981.  
  982. =====
  983. Section V - Digital recording and interconnection
  984.  
  985. --
  986. Q5.1 - What is sampling?  What is a sampling rate?
  987.  
  988.   Sampling can be (roughly) defined as the capture of a continuously
  989.   varying quantity at a precisely defined instant in time. Most usually,
  990.   signals are sampled at a set of sample-points spaced regularly in
  991.   time. Note that sampling in itself implies nothing about the
  992.   representation of sample magnitude by a number. That process is called
  993.   quantisation.
  994.  
  995.   The Nyquist theorem states that in order to faithfully capture all of
  996.   the information in a signal of one-sided bandwidth B, it must be
  997.   sampled at a rate greater than 2B. A direct corollary of this is that
  998.   if we wish to sample at a rate of 2B then we must pre-filter the
  999.   signal to a one-sided bandwidth of B, otherwise it will not be
  1000.   possible to accurately reconstruct the original signal from the
  1001.   samples. The frequency 2B that is the minimum sample rate to retain
  1002.   all of the signal information is called the Nyquist frequency.
  1003.  
  1004.   The spectrum of the sampled signal is the same as the spectrum of the
  1005.   continuous signal except that copies (known as aliases) of the
  1006.   original now appear centred on all integer multiples of the sample
  1007.   rate. As an example, if a signal of 20 kHz bandwidth is sampled at 50
  1008.   kHz then alias spectra appear from 30 - 70 kHz, 80 - 120 kHz, and so
  1009.   on. It is because the alias spectra must not overlap that a sample
  1010.   rate of greater than 2B is required.  In digital audio we are
  1011.   concerned with the base-band - that is to say the signal components
  1012.   which extend from 0 to B. Therefore, to sample at the standard digital
  1013.   audio rate of 44.1 kHz requires the input signal to be band-limited to
  1014.   the range 0 Hz to 22.05 kHz.  [Chris]
  1015.  
  1016. --
  1017. Q5.2 - What is oversampling?
  1018.  
  1019.   To take distortionless samples at 44.1kHz requires that the analogue
  1020.   signal be bandlimited to 22.05kHz. Since the audio band is reckoned to
  1021.   extend to 20kHz we require an analogue filter that cuts off very
  1022.   sharply between 20kHz and 22kHz to accomplish this. This is expensive,
  1023.   and suffers from all the ailments associated with analogue
  1024.   electronics.
  1025.  
  1026.   Oversampling is a technique whereby some of this filtering may be done
  1027.   (relatively cheaply and easily) in the digital domain. By sampling at
  1028.   a high rate (for example 4 times 44.1kHz, or 176.4kHz) the analogue
  1029.   filter can have a much lower slope since its transition band is now
  1030.   20kHz to 88kHz (ie half of 176kHz). The samples are then passed
  1031.   through a digital filter with a sharp cutoff at 20kHz, after which
  1032.   three of every four are discarded, resulting in the sample stream at
  1033.   44.1kHz that we require.  [Chris]
  1034.  
  1035. --
  1036. Q5.3 - What is the difference between a "1 bit" and a "multibit" converter?
  1037.        What is MASH?  What is Delta/Sigma?  Should I really care?
  1038.  
  1039.   Audio data is stored on CD as 16-bit words. It is the job of the
  1040.   digital to analogue converter (DAC) to convert these numbers to a
  1041.   varying voltage. Many DAC chips do this by storing electric charge in
  1042.   capacitors (like water in buckets) and selectively emptying these
  1043.   buckets to the analogue ouput, thereby adding their contents. Others
  1044.   sum the outputs of current or voltage sources, but the operating
  1045.   principles are otherwise similar.
  1046.  
  1047.   A multi-bit converter has sixteen buckets corresponding to the sixteen
  1048.   bits of the input word, and sized 1, 2, 4, 8 ... 32768 charge units.
  1049.   Each word (ie sample) decoded from the disc is passed directly to the
  1050.   DAC, and those buckets corresponding to 1's in the input word are
  1051.   emptied to the output.
  1052.  
  1053.   To perform well the bucket sizes have to be accurate to within +/-
  1054.   half a charge unit; for the larger buckets this represents a tolerance
  1055.   tighter than 0.01%, which is difficult.  Furthermore the image
  1056.   spectrum from 24kHz to 64kHz must be filtered out, requiring a
  1057.   complicated, expensive filter.
  1058.  
  1059.   Alternatively, by using some digital signal processing, the stream of
  1060.   16-bit words at 44.1kHz can be transformed to a stream of shorter
  1061.   words at a higher rate. The two data streams represent the same signal
  1062.   in the audio band, but the new data stream has a lot of extra noise in
  1063.   it resulting from the wordlength reduction. This extra noise is made
  1064.   to appear mostly above 20kHz through the use of noise-shaping, and the
  1065.   oversampling ensures that the first image spectrum occurs at a much
  1066.   higher frequency than in the multi-bit case.
  1067.  
  1068.   This new data stream is now converted to an analogue voltage by a DAC
  1069.   of short word length; subsequently, most of the noise above 20kHz can
  1070.   be filtered out by a simple analogue filter without affecting the
  1071.   audio signal.
  1072.  
  1073.   Typical configurations use 1-bit words at 11.3MHz (256 times over-
  1074.   sampled), and 4-bit words at 2.8MHz (64 times oversampled).  The
  1075.   former requires one bucket of arbitrary size (very simple); it is the
  1076.   basis of the Philips Bitstream range of converters. The latter
  1077.   requires four buckets of sizes 1, 2, 4 and 8 charge units, but the
  1078.   tolerance on these is relaxed to about 5%.
  1079.  
  1080.   MASH and other PWM systems are similar to Bitstream, but they vary the
  1081.   pulse width at the output of the digital signal processor. This can be
  1082.   likened to using a single bucket but with the provision to part fill
  1083.   it. For example, MASH allows the bucket to be filled to eleven
  1084.   different depths (this is where they get 3.5 bits from, as 2^(3.5) is
  1085.   approximately eleven).
  1086.  
  1087.   Lastly it is important to note that these are all simply different
  1088.   ways of performing the same function. It is easy to make a lousy CD
  1089.   player based around any of these technologies; it is rather more
  1090.   difficult to make an excellent one, regardless of the DAC technology
  1091.   employed. Each of the conversion methods has its advantages and
  1092.   disadvantages, and as ever it is the job of the engineer to balance a
  1093.   multitude of parameters to design a product that represents value for
  1094.   money to the consumer.  [Chris]
  1095.  
  1096. --
  1097. Q5.4 - On an analog recorder, I was always taught to make sure the signal
  1098.        averages around 0 VU.  But on my new DAT machine, 0 is all the way at
  1099.        the top of the scale.  What's going on here?
  1100.  
  1101.   Analog recorders are operated such that the signal maintains a nominal
  1102.   level that strikes a good balance between signal-to-noise ratio and
  1103.   headroom.  Further, since analog distorts very gently, you often can
  1104.   exceed your headroom in little bits and not really notice it.
  1105.  
  1106.   Digital is not nearly as forgiving.  Since digital represents audio as
  1107.   numerical values, higher levels will eventually force you to run out
  1108.   of numbers.  As a result, there is an absolute ceiling as to how hot
  1109.   you can record.  If you record analog and have a nominal 12 dB of
  1110.   headroom, you'll probably be okay if you have one 15 dB transient that
  1111.   lasts for 1/10th of a second.  The record amps _might_ overload, the
  1112.   tape _might_ saturate, but you'll probably be fine.  In a digital
  1113.   system, those same 3 dB of overshoot would cause you to clip hard.  It
  1114.   would not be subtle or forgiving.  You would hear a definite snap as
  1115.   you ran out of room and chopped the top of your waveform off.
  1116.  
  1117.   The reality is that digital has NO HEADROOM, because there is no
  1118.   margin for overshoot.  You simply must make sure that the entire
  1119.   dynamic range of the signal fits within the limits of the dynamic
  1120.   range of your recorder, without exception.  The only meaningful
  1121.   absolute on a digital recorder, therefore, is the point at which you
  1122.   will go into overload.  The result is the metering system we now have.
  1123.   0 dB represents digital ceiling, or full-scale.  The negative numbers
  1124.   on the scale represents your current level relative to the ceiling.
  1125.  
  1126.   Thus, to return to our example, if you have a transient with 15dB of
  1127.   overshoot past your nominal level, you must then place your nominal
  1128.   level at a maximum of -15 dB.  0 dB on the meters is the absolute limit
  1129.   of what you can record.  [Gabe]
  1130.  
  1131. --
  1132. Q5.5 - Why doesn't MiniDisc or Digital Compact Cassette sound as good as DAT
  1133.         or CD?  After all, they're both digital.
  1134.  
  1135.   Both MD and DCC use lossy compression algorithms (called ATRAC and
  1136.   PASC respectively); crudely, this means that the numbers coming out of
  1137.   the machine are not the same as those that went in. The algorithms use
  1138.   complex models of the way the ear works to discard the information
  1139.   that it thinks would not be heard anyway.
  1140.  
  1141.   For example, if a pin dropped simultaneously with a gunshot, it may be
  1142.   reasonable to suggest that it isn't worth bothering to record the
  1143.   sound of the pin! In fact it turns out that around 75 to 80 per cent
  1144.   of the data for typical music can be discarded with surprisingly
  1145.   little quality loss.
  1146.  
  1147.   However, nobody denies that there is a quality loss, particularly
  1148.   after a few generations of copying. This fact and others make both MD
  1149.   and DCC useful only as a consumer-delivery format. They have very
  1150.   little use in the studio as a recording or (heaven forbid!) mastering
  1151.   format.  [Chris]
  1152.  
  1153. --
  1154. Q5.6 - What is S/P-DIF?  What is AES/EBU?
  1155.  
  1156.   AES/EBU and S/P-DIF describe two similar protocols for communicating
  1157.   two-channel digital audio information over a serial link. They are
  1158.   slightly different in details, their basic format is almost identical,
  1159.   but there are enough differences that the two are, for all intents and
  1160.   purposes electrically incompatible.  Both of these digital protocols
  1161.   are described fully in an international standard, IEC 958, available
  1162.   from the International Electrotechnical Commission.
  1163.  
  1164.   AES/EBU (which stands for the joint Audio Engineering Society/European
  1165.   Broadcasting Union standard) is the so-called "professional" protocol.
  1166.   It uses standard 3-pin XLR connectors and 110-ohm balanced
  1167.   differential cables for connection (no, standard microphone cables,
  1168.   not even good quality cables, won't work, even though it seems they
  1169.   might) and a 5 volt, differential signal.
  1170.  
  1171.   S/P-DIF (which stands for Sony/Philips Digital InterFace, a now
  1172.   obsolete standard superseded by IEC 958) is the so-called "consumer"
  1173.   format. It uses what appears to be standard RCA connectors and cables,
  1174.   but, in fact, require 75-ohm connectors and cables. Good quality video
  1175.   "patch" cables have proven adequate (no, standard "audio" patch cords,
  1176.   even excellent quality versions, have been shown not to work). The
  1177.   signals are 0.5 volts unbalanced.
  1178.  
  1179.   The actual datastream, are very similar.  Each sample period a "frame"
  1180.   is transmitted. Each frame consists of two "subframes", one each for
  1181.   left and right channels, each subframe is 32 bits wide. In that
  1182.   subframe, 4 bits are used for synchronization, then up to 24 bits are
  1183.   usable for audio (the "consumer mode" format is limited to 16 bits).
  1184.   The remaining four bits are used for parity (the first level of error
  1185.   detection), validity, user status and channel status. 192 subframes
  1186.   are collected, and the 192 user bits and 192 channel status bits are
  1187.   collected into separate 24 8 bit status bytes for each channel.
  1188.  
  1189.   The channel status bytes are interesting, because they contain the
  1190.   important control information and the major differences between the
  1191.   two protocol formats. One bit tells whether the data stream is
  1192.   professional or consumer format.  There are bits that specify
  1193.   (optionally) the sample rate, deemphasis standards, channel usage, and
  1194.   other information.  The consumer format has several bits allocated to
  1195.   copy protection and control: the SCMS bits.
  1196.  
  1197.   Now, the notion that all of this is encoded in a standard may be
  1198.   reassuring, but a standard is nothing but a voluntary statement of
  1199.   common industry practice. There is a lot of incompatibility between
  1200.   equipment out there caused directly by subtle differences between
  1201.   interpretations and implementations.  The result is that some
  1202.   equipment simply refuses to talk to each other.  Even THAT 
  1203.   possibility is stated in the standard!  [Dick]
  1204.  
  1205. --
  1206. Q5.7 - What is clock jitter?
  1207.  
  1208.   Clock jitter is a colloquialism for what engineers would readily call
  1209.   time-domain distortion.  Clock jitter does not actually change the
  1210.   physical content of the information being transmitted, only the time
  1211.   at which it is delivered.  Depending on circumstance, this may or may
  1212.   not affect the ultimate decoded output.
  1213.  
  1214.   Let's look at this a little more closely.  Digital audio is sent as a
  1215.   set of binary digits....1's and 0's.  But that is only a logical
  1216.   construct.  In order to transmit binary math electrically, we use
  1217.   square waves.  Realize that although we have two mathematical states,
  1218.   we have to transmit such a construct using control voltages and
  1219.   comparators.
  1220.  
  1221.   All digital audio systems start with a crystal controlled oscillator
  1222.   producing a square wave signal that is used to synchronize the entire
  1223.   digital audio sampling and playback processes.  Now, for a clock, we
  1224.   don't really care about the fact that the clock might be at state 1 or
  1225.   state 0 at any given moment.  That doesn't give us any information.
  1226.   As a computer, I can't tell if my clock has just gotten to state 1, or
  1227.   if it's been sitting there for a microsecond.  Thus it isn't the
  1228.   states we care about.  Instead, we care about the state
  1229.   *changes*....when the clock shifts from one state to the other.
  1230.  
  1231.   Now, in a perfect square wave (no such thing exists), the change of
  1232.   state would be instantaneous.  BOOM...it's done.  But in reality, it
  1233.   doesn't work this way.  Square waves contain high orders of harmonics.  
  1234.   Fourier teaches us that all complex waveforms are made up of simpler
  1235.   waveforms.  Thus, as we run through noisy electronics, long cables,
  1236.   inadvertent filtering circuits, we begin to lose some of our
  1237.   harmonics.  When this happens, our square wave begins to lose form.
  1238.  
  1239.   The result of this is that our nice sharp corners become rounded.  So
  1240.   our state changes are no longer precisely at the edge anymore, because
  1241.   there is no more edge.  The pointy edge is now all fuzzy.  It now
  1242.   depends on design of the electronic comparator circuit as to when the
  1243.   clock state will change, as the stage change has shifted.  The clock
  1244.   is, essentially, jittering.
  1245.  
  1246.   People love to bark out "Bits is bits.  A copy of a computer file
  1247.   works as well as the original."  Yes, this is true.  But these
  1248.   jittering bits can create audible distortion during the digital-to-
  1249.   analog conversion, and the industry is working hard to reduce the
  1250.   amount of jitter present in digital systems.
  1251.  
  1252.   Furthermore, emerging research is suggesting that certain types of
  1253.   jitter may produce digital copies with eccentricities that result in
  1254.   more jittery output on playback.  The jury is still out on the
  1255.   specifics however.  Stay tuned.  [Gabe]
  1256.  
  1257. --
  1258. Q5.8 - What kind of cable AES/EBU or S/P-DIF cables should I use? How long
  1259.        can I run them?
  1260.  
  1261.   The best, quick answer is what cables you should NOT use!
  1262.  
  1263.   Even though AES/EBU cables look like orinary microphone cables, and S/P-DIF
  1264.   cables look like ordinary RCA interconnects, they are very different.
  1265.  
  1266.   Unlike microphone and audio-frequency interconnect cables, which are
  1267.   designed to handle signals in the normal audio bandwidth (let's say that
  1268.   goes as high as 50 kHz or more to be safe), the cables used for digital
  1269.   interconnects must handle a much wider bandwidth. At 44.1 kHz, the digital
  1270.   protocols are sending data at the rate of 2.8 million bits per second,
  1271.   resulting in a bandwidth (because of the biphase encoding method) 
  1272.   of 5.6 MHz.
  1273.  
  1274.   This is no longer audio, but falls in the realm of bandwidths used by
  1275.   video. Now, considerations such as cable impedance and termination become 
  1276.   very important, factors that have little or no effect below 50 kHz.
  1277.  
  1278.   The interface requirements call for the use of 110 ohm balanced cables for
  1279.   AES/EBU interconnects, and 75 ohm coaxial unbalanced interconnects for
  1280.   S/P-DIF interconnects. The used of the proper cable and the proper
  1281.   terminating connectors cannot be overemphasised. I can personally testify
  1282.   (having, in fact, looked at the interconnections between many different
  1283.   kinds of pro and consumer digital equipment) that ordinary microphone or
  1284.   RCA audio interconnects DO NOT WORK. It's not that the results sound
  1285.   subtly different, it's that much of the time, it the receiving equipment
  1286.   is simply unable to decode the resulting output, and simply shuts down.
  1287.  
  1288.   Fortunately, there is a ready solution for S/P-DIF cables. Any store that
  1289.   sells high quality 75 ohm RCA video interconnect (or "dubbing") connectors
  1290.   also sells high-quality S/P-DIF interconnects as well. They may not know
  1291.   it, but they do. This is because the signal and bandpass requirements for
  1292.   video and S/P-DIF cables are the same. National chains such as Radio Shack
  1293.   sell such cables, and the data seems to indicate that they are good digital
  1294.   interconnects.
  1295.  
  1296.   For AES/EBU, there are fewer, less common solutions. Companies such as
  1297.   Canare make excellent cables. Professional audio suppliers and distributors
  1298.   may be good sources for such cables. If you are handy with a soldering
  1299.   iron, then you can purchase 110 ohm balanced shielded cable and make your
  1300.   own (which I have done quite successfully). Cables such as Alpha Twinax,
  1301.   Carol Twin Coaxial, Belden 9207 twin axial, and the like, all work well for
  1302.   this application. Use high-quality XLR connectors (be warned that these
  1303.   cables are 0.330 inches in diameter and are a VERY tight fit in the
  1304.   neoprene strin reliefs of many connectors: warming them in hot water makes
  1305.   them pliable enough to work well).
  1306.  
  1307.   As to how long these cables can be, it's hard to say. However, a couple of
  1308.   general rules apply.
  1309.  
  1310.   S/P-DIF was NEVER intended to be a long-haul hardware interconnect. The
  1311.   relevant specifications talk of interconnect lengths less than 10 meters
  1312.   (33 feet). In fact, many pieces of equipment cannot tolerate cables even
  1313.   that long, due to the excessive capacitance and possibly induced common
  1314.   mode interference.
  1315.  
  1316.   AES/EBU is more tolerant of longer runs because it is balanced (thus more
  1317.   immune to interference) and it's run at a higher signal level (5 volts
  1318.   instead of 0.5 volts). The standards "allow signal transmission up to a few
  1319.   hundred meters in length."
  1320.  
  1321.   The reality is that much is highly dependent upon the actual conditions at
  1322.   hand. The requirements are that the received signal fit within certain
  1323.   requirements of rise time/period and voltage level, the so-called "eye
  1324.   diagram". In other words, regardless of what kind of cable you use, if it
  1325.   can't move the voltage at the receiver far enough soon enough, it simply
  1326.   isn't going to work.
  1327.  
  1328.   Another complicating factor is that both protocols allow a degree of
  1329.   multi-drop capability. This means a single transmitter can drive several
  1330.   receivers (the last of which must be terminated with the proper termination
  1331.   impedance). However, implementing multi-drop puts more stingent
  1332.   requirements on impedance matching. [Dick]
  1333.  
  1334. --
  1335. Q5.9 - What is SCMS?  How do I defeat it?
  1336.  
  1337.   SCMS is the Serial Copy Management System, a form of copy protection
  1338.   that was mandated by Federal law (the Home Recording Rights Act).
  1339.   SCMS consists of a set of subcode flags that indicate to a digital
  1340.   recorder whether or not the source may be copied.  Under the HRRA,
  1341.   consumers are permitted to make one digital generation, but no more.
  1342.   Thus when, for instance, the consumer copies a CD onto DAT, the SCMS
  1343.   flag is set on the copy, and no further generations can be made.
  1344.  
  1345.   SCMS is only mandated in consumer machines.  Any recorder sold 
  1346.   through professional channels, and which is intended for use in
  1347.   professional applications, does not have to implement it.
  1348.  
  1349.   There are several professional products, such as Digital Domain's
  1350.   FCN-1 format converter, which allow manipulation of the SCMS flags.
  1351.   These units exist so that professional engineers may adjust the 
  1352.   subcode bits of the recordings they produce.  [Gabe]
  1353.  
  1354. --
  1355. Q5.10 - What is PCM-F1 format?
  1356.  
  1357.   In the 1980s, before the DAT era, Sony produced a set of PCM adaptors
  1358.   that enabled one to record digital audio using a video cassette
  1359.   machine.  These units had RCA audio connections for input and output,
  1360.   as well as video I/O that could be sent to, and received from, the
  1361.   VCR.  At the time, these systems offered performance far in excess of
  1362.   conventional analog recorders available in the price category.
  1363.  
  1364.   Sony released many models, including the PCM-F1, PCM-501, PCM-601, and
  1365.   PCM-701.  Perhaps the most interesting is the PCM-601, which has
  1366.   S/P-DIF digital I/O.  These units are highly prized since they are the
  1367.   only units that can be used to make digital transfers of F1 tapes to
  1368.   modern hardware.
  1369.  
  1370.   There are some engineers who insist that, despite the clunkiness of the
  1371.   format by modern DAT standards, the F1 series was the best digital format
  1372.   ever developed.  To this day, it is not surprising to see an F1 encoder 
  1373.   on a classical recording session. [Gabe]
  1374.  
  1375. --
  1376. Q5.11 - How do digital recorders handle selective synchronization?
  1377.  
  1378.   Selective Synchronization, or "sel-sync" as it is often called, is the
  1379.   ability of a recorder to play and record simultaneously, allowing
  1380.   synchronous recording of new material onto specific tracks without 
  1381.   erasing everything on tape.  This technique is what makes overdubbing 
  1382.   possible.
  1383.  
  1384.   On an analog recorder, audio tracks are discrete entities, and the
  1385.   sync head is really just a stack of individual heads, any one of which
  1386.   is capable of recording or playing back.  Thus sel-sync is a
  1387.   relatively simple matter of putting some heads into record and others
  1388.   into repro.
  1389.  
  1390.   In the digital world, the problem is highly complex.  First, A/D and
  1391.   D/A conversion involves an acquisition delay of several milliseconds.
  1392.   Second, and more importantly, digital tracks are not discrete.  Rather,
  1393.   they are multiplexed together on a tape, along with subcode and other
  1394.   non-audio information.  So how can you replace one track and leave the
  1395.   others untouched?
  1396.  
  1397.   The answer is a technique called "read before write" (RBW) or "read,
  1398.   modify, write" (RMW) which involves a second set of heads.  The data
  1399.   is read from the tape and flushed into a buffer, where it can be
  1400.   modified, and ultimately written back to the tape.  Thus when you
  1401.   "punch in" on a digital deck, you are physically re-writing all the
  1402.   tracks, not just the one you're overdubbing.  You are not, however,
  1403.   changing the data on any track other than the one you want to 
  1404.   replace.  [Gabe]
  1405.  
  1406. --
  1407. Q5.12 - How can a 44.1 kHz sampling rate be enough to record all the 
  1408. harmonics of music?  Doesn't that mean that we chop off all the harmonics
  1409. above 20 khz?  Doesn't this affect the music?  After all, analog systems
  1410. don't filter out all the information above 20 kHz, do they?
  1411.  
  1412.   This whole question is based on the premise that "analog systems don't
  1413.   filter out all the information above 20 kHz." Indeed there are mixers
  1414.   and power amplifiers and other electronic systems that are capable of
  1415.   stunningly wide bandwidth, often exceeding 100 kHz, the same cannot be
  1416.   said for the entire analog reproduction chain. The mechanical
  1417.   transducers, microphones, speaker and phono cartridges seldom have
  1418.   real response far exceeding 20 kHz. In fact, some of the most highly
  1419.   regarded large diaphragm condensor microphones often used in very high
  1420.   quality recordings seldom exceed 18 kHz bandwidth. Analog tape
  1421.   recorders rarely have bandwidths as wide as 25 kHz, and LP
  1422.   reproduction systems have similar limitations in reality.
  1423.  
  1424.   So while it may be possible to send very high frequency ultrasonic
  1425.   signals through parts of both analog and digital reproduction chains,
  1426.   there are, in both technologies, fundamental and insurmountable limits
  1427.   to the bandwidth that, in reality, lead to very similar actual
  1428.   reproducible bandwidths in each.
  1429.  
  1430.   Thus, one of the basic premises of the question is flawed. Analog
  1431.   systems DO filter out information above 20 kHz. Further, the frequency
  1432.   response and phase errors of even the very best well-maintained analog
  1433.   reproduction systems have response errors far exceeding those of even
  1434.   middle of the line digital equipment. Whether one person may find
  1435.   those errors tolerable or even likeable or not is a matter or personal
  1436.   preference that is beyond the scope of this or any other technical
  1437.   discussion.
  1438.  
  1439.   There are a variety of anecdotal tales that are advanced to "prove"
  1440.   that the ear can hear far beyond what is conventionally accepted as
  1441.   the 20 kHz upper limit (an upper limit that, for the most part,
  1442.   applies to young people only: modern high SPL music and noise levels
  1443.   has lead to a widespread deterioration in the hearing of the adult
  1444.   population at large, and especially amongst young males).
  1445.  
  1446.   For example, there is an apocryphal story about Rupert Neve that
  1447.   tells of a console channel that sounded particularly "bad". It was
  1448.   later discovered that it was oscillating at some ultrasonic frequency,
  1449.   like 48 kHz. Rupert Neve is rumored to have seized upon this as
  1450.   "proof" that the ear can hear well beyond 20 kHz. However, there exist
  1451.   an entire range of perfectly plausible mechanisms that require NO
  1452.   ultrasonic acuity to detect such a problem. For example, the existence
  1453.   of ANY nonlinearity in the system would result in the production of
  1454.   intermodulation tones that would fall well within the 20 kHz audio
  1455.   band and certainly would make it sound awful. Even the problem that
  1456.   was causing the oscillation itself could lead to massive artifacts at
  1457.   much lower frequencies that would completely account for the alleged
  1458.   sound of the mixer in the complete absence of a 48 kHz "whistle."
  1459.  
  1460.   Whether 20 kHz is an adequate bandwidth is a debatable subject.
  1461.   However, several important facts have to be remembered. First, BOTH
  1462.   analog AND digital reproduction systems suffer from roughly the same
  1463.   bandwidth limiting. Second, digital systems using properly implemented
  1464.   oversampling techniques have far less severe phase and frequency
  1465.   response errors within the audible band. No analog storage and
  1466.   reproduction system can match the phase and response linearity of a
  1467.   digital system, both at low and high frequencies. Once those
  1468.   demonstrable facts are acknowledged, then the discussion about
  1469.   supra-20 kHz aural detectability can continue, knowing that, if it is
  1470.   demonstrated to be significant, both systems are provably deficient.
  1471.   [Dick]
  1472.  
  1473. --
  1474. Q5.13 - Yeah, well what about square waves? I've seen square wave
  1475. tests of digital systems that show a lot of ringing. Isn't that bad?
  1476.  
  1477.   Square waves are a mathematically precisely defined signal. One of the
  1478.   ways to describe a perfect square wave is as the sum an infinite series
  1479.   of sine waves in a precise phase, harmonic and amplitude relationship.
  1480.   The relation is:
  1481.  
  1482.                      1           1           1           1
  1483.     F(t) = sin(wt) + -sin(3wt) + -sin(5wt) + -sin(7wt) + -sin(9wt) ...
  1484.                      3           5           7           9
  1485.  
  1486.   where t is time, w is "radian frequency", or 2 pi times frequency.
  1487.     
  1488.   Remember, we require an infinite number of terms to describe a perfect
  1489.   square wave. If we limit the number of terms to, say, 10 terms, (such as
  1490.   the case with a 1 kHz square wave perfectly band limited to 20 kHz),
  1491.   there simply aren't enough terms to describe a perfect square wave.
  1492.   What will result is a square wave with the highest harmonic imposed on
  1493.   top as "ringing." In fact, this appearance indicates that the phase
  1494.   and frequency response is perfect out to 20 kHz, and the bandwidth
  1495.   limiting is limiting the number of terms in the series.
  1496.  
  1497.   Well, what would a perfect analog system do with square waves? As it
  1498.   turns out, if you take a high quality 15 IPS tape recorder, bias and
  1499.   adjust it for the flattest possible frequency response over the widest
  1500.   possible bandwidth, the result looks remarkably like that of a good
  1501.   digital system for exactly the same reasons. 
  1502.   
  1503.   On the other hand, adjust the analog tape recorder for a square wave
  1504.   response that has no ringing, but the fastest possible rise time. Now
  1505.   listen to it: it sounds remarkably dull and muffled compared to the
  1506.   input. Why? Because in order to achieve that square wave response, it's
  1507.   necessary to severely roll off the high end response in order to
  1508.   suppress the high-frequency components needed to achieve fastest rise
  1509.   time. [Dick]
  1510.  
  1511. --
  1512. Q5.14 - How can a 16-bit word length be enough to record all the detail
  1513. in music?  Doesn't that mean that the sound below -96 dB gets lost in the
  1514. noise? Since it is commonly understood that humans can perceive audio
  1515. that IS below the noise floor, aren't we losing something in digital
  1516. that we don't lose in analog?
  1517.  
  1518.   You're correct in saying that human hearing is capable of perceiving
  1519.   audio that is well below the noise floor (we won't say what kind of
  1520.   noise floor just yet). The reason it can do this is through a process
  1521.   the ear and brain employ called averaging.
  1522.    
  1523.   If we look at a single sample in a digital system or an instantaneous
  1524.   shapshot in an analog system, the resulting value that we measure will
  1525.   consist of some part signal and some part ambiguity. Regardless of the
  1526.   real value of the signal, the presence of noise in the analog system
  1527.   or quantization in the digital system sets a limit on the accuracy to
  1528.   which we can unambiguously know what the original signal value was. So
  1529.   on an individual sample or instantaneous snapshot, there is no way
  1530.   that either ear or measurement instrument can detect signals that are
  1531.   buried below either the noise or the quantization level (when properly
  1532.   dithered).
  1533.   
  1534.   However, if we look at (or listen to) much more than a single sample,
  1535.   through the process of averaging, both instruments and the ear are
  1536.   capable of detecting real signals below the noise floor. Let's look at
  1537.   the simple case of a constant voltage that is 1/10th the value of the
  1538.   noise floor. At the instantaneous or sample point, the noise value
  1539.   overwhelms the signal completely. But, as we collect more consecutive
  1540.   snapshots or samples, an interesting thing begins to happen. The noise
  1541.   (or dither) is random and its long term average is, in fact, 0. But the
  1542.   signal has a definite value, 1/10. Average the signal long enough, and the
  1543.   average value due to the noise approaches 0, but the average value of
  1544.   the signal remains constant at 1/10.
  1545.   
  1546.   A somewhat analogous process happens with high frequency tones. In
  1547.   this case the averaging effect is that of a narrow-band filter. The
  1548.   spectrum of the noise (or simple dither) is broadband, but the
  1549.   spectrum of the tone is very narrow band. Place a filter centered on
  1550.   the tone and while we make the filter narrower and narrower, the
  1551.   contribution of the noise gets less and less, but the contribution of
  1552.   the signal remains the same.
  1553.   
  1554.   Both the ear and measurement instruments are capable of averaging
  1555.   and filtering, and together are capable of pulling real signals from
  1556.   deep down within the noise, as long as the signals have one of two
  1557.   properties: either a period that is long compared to the inherent
  1558.   sampling period of the signal in a digital system or long compared to
  1559.   the reciprocal of the bandwidth in an analog system, or a periodic
  1560.   signal that remains periodic for a comparably long time.
  1561.   
  1562.   Special measurement instrument were developed decades ago that were
  1563.   capable of easily detecting real signals that were 60 dB below the
  1564.   broadband noise floor. And these devices are equally capable of
  1565.   detecting signals under similar conditions in properly dithered
  1566.   digital systems as well.
  1567.  
  1568.   How much the ear is capable of detecting is dependent upon many
  1569.   conditions, such as the frequency and relative strength of the tone,
  1570.   as well as individual factors such as aging, hearing damage and the
  1571.   like.
  1572.  
  1573.   But the same rules apply to both analog systems with noise and digital
  1574.   systems with decorrelated quantization noise. [Dick]
  1575.  
  1576. Q5.15 -  Q5.14 - What's all this about 20- and 24-bit digital audio?  Aren't
  1577.          CDs limited to 16 bits?
  1578.  
  1579.   Yes, CDs are limited to 16 bits, but we can use >16-bit systems to produce
  1580.   16-bit CDs with higher quality than we could otherwise.
  1581.  
  1582.   We are able to record audio with effective 20-bit resolution nowadays.
  1583.   The finest A/D converter systems have THD+N values around -118 dB with
  1584.   linearity extending far below even that.  When it comes time to reduce
  1585.   our word-length to 16 bits, we can use any one of a variety of noise
  1586.   shaping curves, the job of which is to mix with our 24-bit audio, shift
  1587.   the dither spectrum of the noise into areas where our ears are less
  1588.   sensitive, thus enabling the noise component to comprise audio information
  1589.   at the spectral areas where our ears are most sensitive.  See Lipschitz's
  1590.   seminal papers for fuller detail on this subject.
  1591.  
  1592.   Furthermore, we often perform DSP calculations on our audio, and to that
  1593.   end it is worthwhile to carry out the arithmetic with as much precision
  1594.   as we can in order to avoid rounding errors.  Most digital mixers carry
  1595.   their math out to 24-bit precision at the I/O, with significantly longer
  1596.   word lengths internally.  As a result, two 16-bit signals mixed together
  1597.   can produce a valid 24-bit output word.  For that matter, a 16-bit signal
  1598.   subjected to a level change can produce a 24-bit output if desired (except,
  1599.   of course, for a level change that is a multiple of 6 dB, as that's just
  1600.   a shift left or right).
  1601.  
  1602.   The number of noise shaping curves available today is staggering.  Sony
  1603.   SBM, Weiss, Meridian 618, Sonic TBM, Apogee UV-22, Prism SNS, Lexicon 
  1604.   PONS, Waves, and, of course, the classic Lipschitz curve are just a few
  1605.   of the multitudinous options that now exist. [Gabe]
  1606.  
  1607. =====
  1608. Section VI - Digital editing and mastering
  1609.  
  1610. --
  1611. Q6.1 - What is a digital audio workstation?
  1612.  
  1613.   A digital audio workstation (DAW) is one of our newest audio buzzwords,
  1614.   and applies to nearly any computer system that is meant to handle or 
  1615.   process digital audio in some way.  For the most part however, the
  1616.   term refers to computer-based nonlinear editing systems.  These systems
  1617.   can comprise a $500 board that gets thrown into a PC, or can refer to
  1618.   a $150,000 dedicated digital mastering desk.  [Gabe]
  1619.  
  1620. --
  1621. Q6.2 - How is digital editing different from analog editing?
  1622.  
  1623.   In the days of analog editing, one edited with a razor blade and a
  1624.   diagonal splicing block.  Making a cut meant scrubbing the tape over
  1625.   the head, marking it with a grease pencil, cutting, and then taping 
  1626.   the whole thing back together.  Analog editing (particularly on music)
  1627.   was as much art as it was craft, and good music editors were worth
  1628.   their weight in gold.
  1629.  
  1630.   In many circles, analog editing has gone the way of the Edsel,
  1631.   replaced by digital workstation editing.  For complex tasks, DAW-based
  1632.   editing offers remarkable speed, the ability to tweak an edit after
  1633.   you make it, a plethora of crossfade parameters that can be optimized
  1634.   for the edit being made, and most importantly, the ability to undo
  1635.   mistakes with a keystroke.  Nearly all commercial releases are being
  1636.   edited digitally nowadays.  Since satisfactory editing systems can
  1637.   be had for around $1,000, even home recordists are catching onto the
  1638.   advantages.  More elaborate systems can cost tens of thousands of
  1639.   dollars.
  1640.  
  1641.   There are certain areas where analog editing still predominates,
  1642.   however.  Radio is sometimes cited as an example, though this has begun
  1643.   to change thanks to products like the Orban DSE 7000.  The needs of 
  1644.   radio production are often quite different from those of music editors,
  1645.   and a number of products (the Orban being a fine example) have sprung
  1646.   up to fill the niche.  Nonetheless, in spite of the rapid growth of
  1647.   DAWs in the radio market, razor blades are still found in daily use
  1648.   in radio stations.  [Gabe]
  1649.  
  1650. --
  1651. Q6.3 - What is mastering? 
  1652.  
  1653.   Mastering is a multifaceted term that is often misunderstood.  Back in
  1654.   the days of vinyl records, mastering involved the actual cutting of
  1655.   the master that would be used for pressing.  This often involved a
  1656.   variety of sonic adjustments so that the mixed tape would ultimately
  1657.   be properly rendered on vinyl.
  1658.  
  1659.   The age of the CD has changed the meaning of the term quite a bit.
  1660.   There are now two elements often called mastering.  The first is the
  1661.   eminently straightforward process of preparing a master for pressing.
  1662.   As most mixdowns now occur on DAT, this often involves the relatively
  1663.   simple tasks of generating the PQ subcode necessary for CD replication.
  1664.   PQ subcode is the data stream that contains information such as the 
  1665.   number of tracks on a disc, the location of the start points of each
  1666.   track, the clock display information, and the like.  This information
  1667.   is created during mastering and prepared as a PQ data burst which the
  1668.   pressing plant uses to make the glass pressing master.
  1669.  
  1670.   Mastering's more common meaning, however, is the art of making a
  1671.   recording sound "commercial."  Is is the last chance one has to get
  1672.   the recording sounding the way it ought to.  Tasks often done in
  1673.   mastering include: adjustment of time between pieces, quality of
  1674.   fade-in/out, relation of levels between tracks (such that the listener
  1675.   doesn't have to go swinging the volume control all over the place),
  1676.   program EQ to achieve a desired consistency, compression to make one's
  1677.   disc sound LOUDER than others on the market, the list goes on.
  1678.  
  1679.   A good mastering engineer can often take a poorly-produced recording
  1680.   and make it suitable for the market.  A bad one can make a good
  1681.   recording sound terrible.  Some recordings are so well produced,
  1682.   mixed, and edited that all they need is to be given PQ subcode and
  1683.   sent right out.  Other recordings are made by people on ego trips, who
  1684.   think they know everything about recording, and who make recordings
  1685.   that are, technically speaking, wretched trash.
  1686.  
  1687.   Good mastering professionals are acquainted with many styles of music,
  1688.   and know what it is that their clients hope to achieve.  They then use
  1689.   their tools either lightly or severely to accomplish all the multiple
  1690.   steps involved in preparing a disc for pressing. [Gabe]
  1691.  
  1692. --
  1693. Q6.4 - What is normalizing?
  1694.  
  1695.   Normalizing means bringing a digital audio signal up in level such
  1696.   that the highest peak in the recording is at full scale.  As we saw in
  1697.   Q5.4, 0 dB represents the highest level that our digital system can
  1698.   produce.  If our highest level is, for instance, -6 dB, then the
  1699.   absolute signal level produced by the player will be 6 dB lower than
  1700.   it could have been.  Normalizing just maximizes the output so that the
  1701.   signal appears louder.
  1702.  
  1703.   Contrary to many frequently-held opinions, normalizing does NOT
  1704.   improve the dynamic range of the recording in any way, since as you
  1705.   bring up the signal, you also bring up the noise.  The signal-to-noise
  1706.   ratio is a function of the original recording level.  If you have a
  1707.   peak at -6 dB, that's 6 dB of dynamic range you didn't use, and when
  1708.   you normalize it to 0 dB, your noise floor will rise an equivalent
  1709.   amount.
  1710.  
  1711.   Normalizing may help optimize the gain structure on playback, however.
  1712.   Since the resultant signal will be hotter, you'll hear less noise from
  1713.   your playback system.
  1714.  
  1715.   But the most common reason for normalizing is to make one's recordings
  1716.   sound, LOUDER, BRIGHTER, and have more PUNCH, since we all know that
  1717.   louder recordings are better, right? :-)  [Gabe]
  1718.  
  1719. --
  1720.  Q6.5 - I have a fully edited DAT that sounds just like I want it to sound on
  1721.         the CD.  Is it okay to send it to the factory?
  1722.  
  1723.   This is a highly case-specific question.  Some people truly have the
  1724.   experience to produce DATs on mixdown or editing that are ready to go
  1725.   in every conceivable way.  Often these people can send their tapes out
  1726.   for pressing without the added expense of a mastering house.
  1727.  
  1728.   However, if you do not have this sort of expertise, and if your only
  1729.   reason for wanting to send it out immediately is because you know that
  1730.   it is technically possible to press from what you have, then you would
  1731.   be advised to let a mastering engineer listen to and work on your
  1732.   material.  A good mastering engineer will often turn up problems and
  1733.   debatable issues that you didn't even know were there.  Also, any 
  1734.   decent mastering house will provide you with a master on a format 
  1735.   significantly more robust than DAT.  
  1736.  
  1737.   DAT is a fine reference tape format, but it simply is not the sort of
  1738.   thing you want to be sending to a pressing plant. [Gabe]
  1739.  
  1740. --
  1741. Q6.6 - What is PCM-1630?  What is PMCD?
  1742.  
  1743.   PCM-1630 is a modulation format designed to be recorded to 3/4"
  1744.   videotape.  It was, for many years, the only way one could deliver a
  1745.   digital program and the ancillary PQ information to the factory for
  1746.   pressing.  The PCM-1630 format is still widely used for CD production.
  1747.  
  1748.   But PCM-1630 is now certainly an obsolete system, as there are many 
  1749.   new formats that are superior to it in every way.  One of the most
  1750.   popular formats for pressing now is PMCD (Pre-Master Compact Disc).
  1751.   This format, developed by Sonic Solutions, allows for CD pressing 
  1752.   masters to be written out to CD-Rs that can be sent to the factory
  1753.   directly.  These CD-Rs contain a PQ burst written into the leadout
  1754.   of the discs.
  1755.  
  1756.   Some plants have gone a step further and now accept regular CD-Rs,
  1757.   Exabyte tapes, or even DATs for pressing.  The danger here is that
  1758.   some users may think that they can prepare their own masters without
  1759.   the slightest understanding of what the technical specifications are.
  1760.   For instance, users preparing their own CD-Rs must do so in one
  1761.   complete pass.  It is not permitted, for instance, to stop the CD-R
  1762.   deck between songs, as this creates unreadable frames that will cause
  1763.   the disc to be rejected at the plant.  [Gabe]
  1764.  
  1765. --
  1766. Q6.7 - When preparing a tape for CD, how hot should the levels be?
  1767.  
  1768.   Ideally you should record a digital master such that your highest
  1769.   level is at 0 dB, if only to maximize the dynamic range of your
  1770.   recordings.  Many people like their CDs to be loud, and thus they
  1771.   will normalize anyway even if they don't hit 0 dB during recording.
  1772.  
  1773.   Some classical recordings are deliberately recorded with peaks 
  1774.   that are significantly lower than 0 dB.  This is done in order to
  1775.   prevent quiet instruments such as lutes and harpsichords from
  1776.   being played too loud.  If you record a quiet instrument such as
  1777.   a harpsichord out to 0 dB, the listener would have to put the 
  1778.   volume control all the way at the bottom in order to get a
  1779.   realistic level, and the inclination would be to play it at a
  1780.   "normal" listening level.  By dropping the mastering level, the
  1781.   listener is more likely to set the playback level appropriately.
  1782.  
  1783. --
  1784. Q6.8 - Where can I get CDs manufactured?
  1785.  
  1786. [To come]
  1787.  
  1788. --
  1789. Q6.9  - How are CD error rates measured, and what do they mean?
  1790.  
  1791. [Forthcoming.  -Gabe]
  1792.  
  1793. =====
  1794. Section VII - Market survey.  What are my options if I want --
  1795.  
  1796. --
  1797. Q7.1 - A portable DAT machine
  1798.  
  1799. --
  1800. Q7.2 - A rack size DAT machine
  1801.  
  1802. --
  1803. Q7.3 - An inexpensive stereo microphone
  1804.  
  1805. --
  1806. Q7.4 - An inexpensive pair of microphones for stereo
  1807.  
  1808. --
  1809. Q7.5 - A good microphone for recording vocals
  1810.  
  1811. --
  1812. Q7.6 - A good microphone for recording [insert instrument here]
  1813.  
  1814. --
  1815. Q7.7 - A a small mixer
  1816.  
  1817. --
  1818. Q7.8 - A portable cassette machine
  1819.  
  1820. --
  1821. Q7.9 - A computer sound card for my IBM PC or Mac
  1822.  
  1823. --
  1824. Q7.10 - An eight-track digital recorder?
  1825.  
  1826. =====
  1827. Section VIII - Sound reinforcement
  1828.  
  1829. --
  1830.  Q8.1 - We have a fine church choir, but the congregation can't hear them.
  1831.         How do we mic the choir?
  1832.  
  1833. --
  1834.  Q8.2 - How do I 'ring out' a system?
  1835.  
  1836. --
  1837.  Q8.3 - How much power to I need for [insert venue here]?
  1838.  
  1839. --
  1840.  Q8.4 - How good is the Sabine feedback eliminator?
  1841.  
  1842. =====
  1843. Section IX - Sound restoration
  1844.  
  1845. --
  1846. Q9.1 - How can I play old 78s?  
  1847.  
  1848.   First rule of thumb:  DO NOT PLAY THEM WITH AN LP STYLUS!  
  1849.  
  1850.   The grooves on 78s are gigantic compared to the microgroove LPs.  
  1851.   As a result, specialized styli are needed for proper playback of 78s.
  1852.   Also, the RIAA equalization curve normally used for LPs has no
  1853.   relation to the frequencies that were equalized on 78 recordings.
  1854.  
  1855.   The easiest stylus to obtain is the Shure V15 with the 78 pickup.  This
  1856.   is a good, though not great, 78 stylus and will do an okay job at playing
  1857.   most discs. 
  1858.  
  1859.   The serious 78 collector will want to obtain not only a collection of
  1860.   78 styli for the various discs in their collection (groove sizes varied,
  1861.   and most serious collectors own a handful of styli), but also a preamp
  1862.   with variable equalization curves.  One supplier of all this apparatus
  1863.   is Audio-78 Archival Supplies at (415) 457-7878.  [Gabe]
  1864.  
  1865. --
  1866. Q9.2 - How can I play Edison cylinders?
  1867.  
  1868.   Edison cylinders are best played back with Audio 78's adaptor.  You
  1869.   remove the horn and reproducer element from your cylinder machine,
  1870.   install their electric reproducer, and connect it up to a phono
  1871.   preamp, sans RIAA. [Gabe]
  1872.  
  1873. --
  1874. Q9.3 - What are "Hill and Dale" recordings, and how do I play them back?
  1875.  
  1876.   Hill & Dale recordings are discs where the grooves move vertically 
  1877.   instead of horizontally.  Edison, for instance, cut his discs this 
  1878.   way.  In order to play Edison discs, one needs a special glass ball
  1879.   stylus that is 3.7-4.0 mil wide.  This is available from Audio 78,
  1880.   among other places.
  1881.  
  1882.   Also, since the information is vertical instead of horizontal, one
  1883.   must rewire a stereo phono cartridge to reject the normal horizontal
  1884.   information and reproduce only the normally-discarded vertical
  1885.   information.  This is easily accomplished by wiring a stereo cartridge
  1886.   in mono, summing the channels, with one channel out of phase.  In
  1887.   other words, connect the cartridge as follows:
  1888.  
  1889.               ______________
  1890.               |         ____  to preamp
  1891.         + L -     + R -    |
  1892.         |   |         |    |
  1893.         |   |_________|    |
  1894.         |__________________
  1895.         
  1896.   One caveat: if your cartridge has one lug shorted to ground, make
  1897.   sure that this lug is connected to the ground on your preamplifier.
  1898.   It doesn't actually matter which channel you invert.
  1899.  
  1900.   Some preamps like the FM Acoustics 222 or the OWL 1 have a switch
  1901.   that will do this for you without rewiring.  [Gabe]
  1902.  
  1903. --
  1904. Q9.4 - What exactly are NoNOISE and CEDAR?  How are they used?
  1905.  
  1906.   NoNOISE and CEDAR are systems for noise removal.  Both of them approach
  1907.   the same sorts of noise, but use different algorithms and have different
  1908.   user interfaces, often with differing effectiveness.
  1909.  
  1910.   Noise can be broken down into several categories:
  1911.  
  1912.     IMPULSIVE NOISE:  Pops, clicks, thumps, snaps.
  1913.     CRACKLE:  The low-level "bacon frying" effect heard on 
  1914.           LPs and 78s.
  1915.     HISS:     Tape hiss, surface noise, amplifier hiss, broadband noise
  1916.     BUZZ:      60 Hz hum, any other steady-state noise that is relatively
  1917.               narrow-band.
  1918.  
  1919.   NoNOISE and CEDAR are two (expensive) techniques for removing many of
  1920.   these ailments.  It is rare that it is possible to remove all of the
  1921.   problem, nor is it ever possible to remove it with no degradation of
  1922.   the program material.  [Gabe]
  1923.  
  1924. --
  1925.  Q9.5 - How do noise suppression systems like NoNOISE and CEDAR work?
  1926.  
  1927. Digital techniques have been applied to many facets of sound processing
  1928. and recording and have, on the whole, been found to give results far
  1929. superior to their analogue counterparts. Nowhere is this more true than
  1930. in the field of audio restoration, where excellent processes have been
  1931. developed for removal of impulsive noise (thumps, clicks and ticks) and
  1932. attenuation of continuous broadband noise (such as tape hiss). Example
  1933. techniques for these two are outlined below.
  1934.  
  1935.    Impulsive noise
  1936.  
  1937. In this category we include many types of disturbance, from the click
  1938. generated by a scratch on a 78rpm disc, to the tiny tick created by a
  1939. single corrupt bit in a digital data stream. Also included is crackly
  1940. surface noise from 78's (that sounds like a frying pan), though this
  1941. requires somewhat different treatment; however the outline presented
  1942. below is fairly similar for both processes. Typically, audible clicks
  1943. are of a few microseconds to a few milliseconds in duration, and their
  1944. density can be up to a few thousand clicks per second on poor-quality
  1945. material.
  1946.  
  1947. First the audio is split into short blocks of maybe 10ms duration. A
  1948. model is fitted to each block; this model can be thought of as a
  1949. description of the signal in simple mathematical terms. The model is
  1950. chosen such that musical data is a good fit, but the impulsive noise
  1951. is a poor fit.
  1952.  
  1953. For example, a simple model could be a sum of sinewaves, whose number,
  1954. frequencies, amplitudes and phases are the model parameters. The para-
  1955. meters are calculated such that when these sinewaves are added together
  1956. they match the musical parts of the signal accurately, but match the
  1957. impulsive noise badly.
  1958.  
  1959. Now the model can be thought of as a prediction of the music. In
  1960. undamaged sections the prediction is close (since music is known to
  1961. consist of a sum of sinewaves, at least approximately); during clicks
  1962. and pops etc. the prediction is poor, because the model has been
  1963. designed to match the music, and not the noise.
  1964.  
  1965. Now we can achieve impulsive noise removal by replacing the data that
  1966. fits the model badly (ie the clicks) with data predicted by the model,
  1967. which is known to be a close approximation to the music.
  1968.  
  1969.    Broadband Noise
  1970.  
  1971. Broadband noise is usually better tackled in the frequency domain. What
  1972. this entails is taking a block of data (as in the impulsive noise case)
  1973. but then calculating its spectrum. From the spectrum an estimate can
  1974. be made of which frequencies contain mostly signal, and which contain
  1975. mostly noise.
  1976.  
  1977. To help in making this discrimination we first take a "fingerprint" of
  1978. the noise from an unrecorded section, such as the lead-in groove of a
  1979. record, or a silence between movements of a symphony. This spectrum of
  1980. this fingerprint is then compared with the spectrum of each block of
  1981. musical data in order to decide what is noise and what is music.
  1982.  
  1983. The denoising process itself can be thought of as an automagically-
  1984. controlled, cut-only graphic equaliser. For each block, the algorithm
  1985. adjusts the attenuation of each frequency band so as to let the music
  1986. through, but not the noise. If the SNR in a particular band is high
  1987. (ie lots of signal, little noise) then the gain is left close to
  1988. unity. If the SNR is poor in a given band, then that band is heavily
  1989. attenuated.  [Chris]
  1990.  
  1991. --
  1992.  Q9.6 - What is forensic audio?  
  1993.  
  1994.   Forensic audio is audio services for legal applications.  Forensics 
  1995.   breaks down into four main categories.
  1996.  
  1997.     TAPE ENHANCEMENT:  Digital and analog processing to restore
  1998.     verbal clarity and make tapes easier to understand in a courtroom
  1999.     situation.  
  2000.  
  2001.     AUTHENTICITY:  Electronic and physical microscopic examination
  2002.     of a tape to prove that it has not been tampered with, altered,
  2003.     or otherwise changed from its original state.  Another common
  2004.     authenticity challenge is to determine whether a given was tape
  2005.     was indeed made on a given machine.
  2006.  
  2007.     VOICE IDENTIFICATION:  Voice ID, or voiceprinting, is the science
  2008.     that attempts to determine what was said, and by whom.  A variety
  2009.     of analog and digital analysis processes are used to analyze the
  2010.        frequency and amplitude characteristics of a human voice and
  2011.     compare it against known samples.
  2012.  
  2013.     [More to come on this]    [Gabe]
  2014.  
  2015. =====
  2016. Section X - Recording technique, Speakers, Acoustics, Sound
  2017.  
  2018. --
  2019.  Q10.1 - What are the various stereo microphone techniques? 
  2020.  
  2021. [I'm working on it!  -Gabe]
  2022.  
  2023. --
  2024.  Q10.2 - How do I know which technique to use in a given circumstance?
  2025.  
  2026. [This one too! -Gabe]
  2027.  
  2028. --
  2029.  Q10.3 - How do I soundproof a room?
  2030.  
  2031. Despite what you may have seen in the movies or elsewhere, egg crates
  2032. on the wall don't work!
  2033.  
  2034. First, understand what's meant by "soundproofing". Here we mean the
  2035. means and methods to prevent sound from the outside getting in, or
  2036. sound from the inside getting out. The acoustics within the room are
  2037. another matter altogether.
  2038.  
  2039. There are three very important requirements for soundproofing: mass,
  2040. absorption, and isolation.  Actually, there are also three others:
  2041. mass, absorption, and isolation. And to finish the job, you should
  2042. also use: mass, absorption, and isolation.
  2043.  
  2044. Sound is the mechanical vibration propagating through a material.  The
  2045. level of the sound is directly related to the size of those
  2046. vibrations. The more massive an object is, the harder it is to move
  2047. and the smaller the amplitude of the vibration set up in it under the
  2048. influence of an external sound. That's why well-isolated rooms are
  2049. very massive rooms.  A solid concrete wall will transmit much less
  2050. sound then a standard wood-framed, gypsum board wall. And a thicker
  2051. concrete wall transmits less than a thinner one: not so much because
  2052. of the distance, but mostly because it's heavier.
  2053.  
  2054. Secondly, sound won't be transmitted between two objects unless it's
  2055. mechanically coupled.  Air is not the best coupling mechanism. But
  2056. solid objects usually are. That's why well isolated rooms are often
  2057. set on springs and rubber isolators.  It's also why you may see
  2058. rooms-within rooms: The inner room is isolated from the outer, and
  2059. there may be a layer of absorptive material in the space between the
  2060. two. That's also why you'll also see two sets of doors into a
  2061. recording studio: so the sound does not couple directly through the
  2062. door (and those doors are also very heavy!).
  2063.  
  2064. If you are trying to isolate the sound in one room from an adjoining
  2065. room, one way is to build a second wall, not attached to the first.
  2066. This can go a long way to increasing the mechanical isolation. Try
  2067. using two sheets of drywall instead of one on each wall, and use 5/8"
  2068. drywall instead of 3/8", it's heavier.
  2069.  
  2070. But remember: make it heavy, and isolate it. Absorptive materials like
  2071. foam wedges or Sonex and such can only control the acoustics in the
  2072. room: they will do nothing to prevent sound from getting in or out to
  2073. begin with.  [Dick]
  2074.  
  2075. --
  2076.  Q10.4 - What is a near-field monitor?
  2077.  
  2078. A near field monitor is one that is design to be listened to in the
  2079. near field. Simple, eh?
  2080.  
  2081. The "near field" of a loudspeaker is area where the direct,
  2082. unreflected sound from the speaker dominates significantly over the
  2083. indirect and reflected sound, sound bouncing off walls, floors,
  2084. ceilings, the console. Monitoring in the near field can be useful
  2085. because the influence of the room on the sound is minimized.
  2086.  
  2087. Near field monitors have to be physically rather small, because you
  2088. essentially need a small relative sound source to listen to (imagine
  2089. sitting two feet away from an 18" woofer and a large multi- cellular
  2090. horn!). The physics of loudspeakers puts severe constraints on the
  2091. efficiency, power capabilities and low frequency response of small
  2092. boxes, so these small, near-field monitors can be inefficient and not
  2093. have the lowest octave of bass and not play ungodly loud. [Dick]
  2094.  
  2095. --
  2096.  Q10.5 - What are the differences between "studio monitors" and home
  2097.          loudspeakers?
  2098.  
  2099. It depends upon who you ask.  There are speakers called "monitor"
  2100. speakers that are found almost exclusively in homes and never in
  2101. studios.
  2102.  
  2103. The purpose of a monitor speaker is to monitor the recording and
  2104. editing process.  If you buy the concept that they are but one tool in
  2105. the process (and probably the most frequently used single tool at
  2106. that), and if you buy the concept that your tools should be flawless,
  2107. than the requirements for a monitor speaker are easy to state (but
  2108. hard to achieve): they should be the most neutral, revealing and
  2109. unbiased possible.  They are the final link between your work and your
  2110. ears, and if they hide something, you'll never hear it.  If they color
  2111. something, you might be tempted to uncolor it incorrectly the other
  2112. way.
  2113.  
  2114. There is another camp that suggests that monitor speakers should
  2115. represent the lowest common denominator in the target audience. The
  2116. editing and mix process should be done so that the results sound good
  2117. over the worst car speaker or boom box around. While such an idea has
  2118. validity as a means of verifying that the mix will sound good over
  2119. such speakers, using them exclusively for the process invites (as has
  2120. been thoroughly demonstrated in many examples of absolutely terrible
  2121. sounding albums) the possibility of making gross mistakes that simply
  2122. can't be heard in the mixing process. [Dick]
  2123.  
  2124. --
  2125. Q10.6 - My near field monitors are affecting the colors on my video
  2126.      monitor. What can I do to shield the speakers?
  2127.  
  2128.   Despite a lot of folk lore and some very impressive sounding wisdom
  2129.   here on the net and in showrooms, there is effectively nothing that
  2130.   you can do to the speakers or the monitor, short of moving them away
  2131.   from one another, that will solve this problem.
  2132.  
  2133.   The problem comes from the magnetic field created by and surrounding
  2134.   the magnets in the loudspeaker. It's possible to design a magnet that
  2135.   has very little external field, but it can be an expensive proposition
  2136.   for a manufacturer.  If the magnets do have large external fields, the
  2137.   only technique that works is by solving the problem at the source: the
  2138.   magnet.  Special cancelling magnets are used, sometimes in conjunction
  2139.   with a "cup" shield directly around the magnet.
  2140.  
  2141.   You'll hear suggestions from people about placing a sheet of iron or
  2142.   steel between the speakers and the monitor. That might change the
  2143.   field, but it will not eliminate it. As often as not, it will make it
  2144.   worse.
  2145.  
  2146.   You'll also here from people about shielding the speaker by lining the
  2147.   enclosure with lead or copper.  This method is absolutely guaranteed
  2148.   to fail: lead, copper, aluminum, tin, zinc and other such materials
  2149.   have NO magnetic properties at all, they will simply make the speaker
  2150.   heavier and won't solve the problem at all. There is but one material
  2151.   that has a shot at working: something called mu-metal, a heavy, very
  2152.   expensive, material designed for magnetic shield that requires
  2153.   extremely sophisticated and difficult fabrication and annealing
  2154.   techniques. Its cost is far greater than buying a new set of speakers
  2155.   that does not have the problem, and it may not even work if the
  2156.   majority of the offending field is radiated from the front of the
  2157.   speaker, which you obviously can't shield.
  2158.  
  2159.   Try moving the speakers relative to your monitor. Often, moving them
  2160.   an inch or two is enough to cure the problem or at least make it
  2161.   acceptable. Sometimes, placing the speakers on their sides with the
  2162.   woofers (the major offenders in most cases) farthest away from the
  2163.   monitor works.  [Dick]
  2164.  
  2165. -----
  2166. Section XI - Industry information
  2167.  
  2168. Q11.1 - Is there a directory of industry resources?
  2169. Q11.2 - What are the industry periodicals?
  2170. Q11.3 - What are the industry trade organizations?
  2171. Q11.4 - Are there any conventions or trade shows that deal specifically 
  2172.         with professional audio?
  2173.  
  2174. -----
  2175. Section XII - Miscellaneous
  2176.  
  2177. Q12.1 - How do I modify Radio Shack PZMs?
  2178.  
  2179.  [Chris?]
  2180.  
  2181. Q12.2 - Can I produce good demos at home?
  2182.  
  2183.  [Who wants to do this?]
  2184.  
  2185.  [That's a request for a writer, NOT a professional opinion!]
  2186.  
  2187. Q12.3 - How do I remove vocals from a song?
  2188.  
  2189.   You probably want a device called the Thompson Vocal Eliminator made
  2190.   by LT Sound in Atlanta, Georgia.  The device will cancel out any
  2191.   vocal that is mono and panned dead-center.  The unit works by
  2192.   filtering out the low frequencies, phase cancelling the rest of the
  2193.   signal, and then mixing the filtered bass back in.  The result is a
  2194.   signal with the center, common information cancelled out.  Sometimes
  2195.   it works well, other times it sounds awful. [Gabe]
  2196.  
  2197. -----
  2198. Section XIII - Bibliography
  2199.  
  2200.  Q13.1 - Fundamentals of Audio Technology
  2201.  Q13.2 - Studio recording techniques
  2202.  Q13.3 - Live recording techniques
  2203.  
  2204. Q13.4 - Digital audio theory and practice
  2205.  
  2206.   * Ken C. Pohlmann, "Principles of Digital Audio," SAMS/Prentice Hall, 1993
  2207.     [Excellent introduction and explanation of all aspects of digital audio
  2208.     principals and practices]
  2209.  
  2210.    * John Watkinson, "The Art of Digital Audio," Focal Press, 1989
  2211.     [ditto]
  2212.  
  2213.   * Francis Rumsey and John Watkinson, "The Digital Interface Handbook,"
  2214.     Focal Press, 1993
  2215.     [deals with interfacing standards and protocols for both audio and video]
  2216.  
  2217.   * IEC Standard Publication 958, "Digital Audio Interface," International
  2218.     Electro-Technical Commission, 1989, 1993
  2219.     [THE standard!]
  2220.  
  2221.   * Claude E. Shannon and Warren Weaver, "The Mathematical Theory of
  2222.     Communication," U. Chicago Press, 1963.  [The seminal work on digital
  2223.     sampling...includes the original 1948 BSTJ sampling paper]
  2224.  
  2225. Q13.5 - Acoustics
  2226.  
  2227.   * Leo Beranek, "Acoustics," New York, American Institue of Physics, 1986
  2228.     [The bible, but heavily mathematical, very thick and obtuse, a good book
  2229.      despite the Lincoln Hall disaster.]
  2230.  
  2231.   * F. Alton Everest, "The Master Handbook of Acoustics," Tab Books 1989
  2232.     [A good entry level text on acoustics, studio and listening room design,
  2233.      not heavily mathematical].
  2234.  
  2235.   * Arthur H. Benade, "Fundamentals of Musical Acoustics," New York, Dover
  2236.     Publications, 1990
  2237.     [A thorough book, more on the acoustics of PRODUCING music rather than
  2238.     REPRODUCING it.]
  2239.  
  2240.   * Any good physics text book is useful for keeping the bunk at bay.
  2241.  
  2242. Q13.6 - Practical recording guides
  2243.  
  2244. -----
  2245. Section XIV - Miscellaneous
  2246.  
  2247. Q14.1 - Who wrote the FAQ?
  2248.  
  2249.   [Mini-bios of the FAQ maintainers...one day]
  2250.  
  2251. Q14.2 - How do you spell and pronounce the FAQ maintainer's surname?
  2252.  
  2253.   Those who paid attention during fourth grade English learned the rule 
  2254.   "I before E except after C."  There is no C in my name, and therefore
  2255.   the I comes before the E.  My last name is spelled "Wiener" not "Weiner."
  2256.  
  2257.   And it rhymes with cleaner, and starts with a W, not a V.  [Gabe]
  2258.  
  2259. =====
  2260.  
  2261.  
  2262. -- 
  2263. Gabe Wiener   Dir., PGM Early Music Recordings |"I am terrified at the thought 
  2264. A Div. of Quintessential Sound, Inc., New York | that so much hideous and bad
  2265. Recording-Mastering-Restoration (212) 586-4200 | music may be put on records 
  2266. gabe@pgm.com                http://www.pgm.com | forever."--Sir Arthur Sullivan
  2267.