home *** CD-ROM | disk | FTP | other *** search
/ Rat's Nest 1 / ratsnest1.iso / incoming / dec.arj / MANUAL.TXT < prev    next >
Text File  |  1996-11-07  |  12KB  |  297 lines

  1. Manual.txt for Version 2.61 of ISO/MPEG Audio Layer 3 software only 
  2. encoder/decoder for PCs.
  3.  
  4. 1. ENCODER V2.61
  5.    =============
  6.  
  7.  L3ENC.EXE is an ISO/MPEG Layer-3 software only encoder. It takes 
  8.  audio data files as input and delivers Layer-3 coded bitstream 
  9.  files as output. Several options can be selected via command line 
  10.  switches. Usage:
  11.  
  12.    L3ENC <audio_data> <bitstream> [-switch1 [-switch2 [...]]]
  13.  
  14.  L3ENC.EXE should work on any IBM PC compatible computer with a 386 type 
  15.  CPU or better with external or built in 387 hardware floating point 
  16.  support. A Pentium CPU or better is recommended.
  17.  
  18.  L3ENC uses the DOS extender GO32.EXE.
  19.  
  20.  PLEASE NOTE:
  21.  ------------
  22.  o For non-registered users, ancillary data processing is not supported.
  23.  
  24.  o Non-registered users may use the encoder only with the
  25.    following options (input must be 44.1 kHz!):
  26.    112 kbit/s stereo @ 44.1   kHz
  27.     56 kbit/s stereo @ 22.05  kHz
  28.     16 kbit/s mono   @ 11.025 kHz
  29.  
  30.  o Registered users may use the encoder additionally with the following
  31.    options:
  32.      8 kbit/s mono   @ 8                 kHz
  33.     16 kbit/s mono   @ 11.025, 16        kHz
  34.     24 kbit/s mono   @ 16,     22.05, 24 kHz.
  35.     32 kbit/s mono   @ 16,     22.05, 24 kHz.
  36.     56 kbit/s stereo @ 16,     22.05, 24 kHz.
  37.     64 kbit/s stereo @ 16,     22.05, 24 kHz.
  38.     56 kbit/s mono   @ 32,     44.1,  48 kHz
  39.     64 kbit/s mono   @ 32,     44.1,  48 kHz
  40.     96 kbit/s stereo @ 32,     44.1,  48 kHz
  41.    112 kbit/s stereo @ 32,     44.1,  48 kHz
  42.    128 kbit/s stereo @ 32,     44.1,  48 kHz
  43.    256 kbit/s stereo @ 32,     44.1,  48 kHz
  44.    If the input has a sampling frequency of x2, x3, x4 or x6, it is
  45.    downsampled on the fly.
  46.    If you need other bitrates, please contact layer3@iis.fhg.de.
  47.  
  48. 1.1 <audio_data>: audio input file
  49.  The first command line argument specifies the name for the PCM audio
  50.  data file. Version 2.61 of the encoder accepts either raw PCM audio 
  51.  data files, PCM audio data files in RIFF/WAVE format as used by
  52.  Microsoft Windows, PCM audio data files in the sun .au or PCM audio
  53.  data files in the Apple AIFF/AIFC format.
  54.  The samples must be 16 bit signed integer values.
  55.    
  56.  for raw PCM audio data:
  57.     By default the input file is assumed to contain raw PCM audio data.
  58.     Stereo audio data is input in interleaved format, the first channel
  59.     beeing the left channel.
  60.       <sample #1 channel #1> <s. #1 ch. #2> <s.#2 ch.#1> <s.#2 ch.#2> ...
  61.     Mono audio data has the format
  62.       <sample #1> <sample #2> <sample #3> ....
  63.     Whether the input file is treated as mono or stereo audio data is set
  64.     by the downmix switch (1.4). Default is stereo.
  65.     Please see for the -sr, -tfc and -tfs switches below.
  66.  
  67.  PLEASE NOTE: Non-registered users may use the encoder only with 
  68.  .snd/.wav/.aiff files.
  69.  
  70. 1.2 <bitstream>: Layer 3 output file
  71.  The second command line argument specifies the name for the bitstream 
  72.  output file. The extension of the file name should be .mp3.
  73.  The format of the bitstream is as defined in the
  74.  ISO/MPEG publications IS11172-3 (MPEG-1) and IS13818-3 (MPEG-2).
  75.  For very low bitrates a special Fraunhofer format called "MPEG 2.5"
  76.  is used.
  77.  
  78. 1.3 bitrate
  79.  The bitrate of the bitstream output is selected via the '-br' switch.  The 
  80.  bitrate is specified in bits/second. The bitrate is the total bitrate for 
  81.  all encoded channels, i.e. if you select 'br 112000' and 'stereo', both 
  82.  channels will be stuffed into one bitstream of 112000 bits/second. 
  83.  Valid bitrates are:
  84.   o   8000 bit/s
  85.   o  16000 bit/s
  86.   o  24000 bit/s
  87.   o  32000 bit/s
  88.   o  56000 bit/s
  89.   o  64000 bit/s
  90.   o  96000 bit/s
  91.   o 112000 bit/s
  92.   o 128000 bit/s
  93.   o 256000 bit/s
  94.  
  95.  The default bitrate is 112000 bit/s.
  96.  
  97. 1.4 downmix
  98.   If a stereo input file should be treated as mono, the '-dm' swich can be
  99.   used.
  100.   The mono signal is calculated by (l+r)/2.
  101.  
  102. 1.5 high quality
  103.   If the '-hq' option is specified, the encoder will try to produce higher
  104.   audio quality, but at the cost of a reduced encoding speed.
  105.  
  106. 1.6 crc check
  107.  If '-crc' is asserted, ISO/MPEG crc checking is enabled. Without the 'crc' 
  108.  switch, crc checking is disabled.
  109.  
  110. 1.7 ancillary data
  111.   If the '-anc <filename> <rate>' option is specified, the named file is
  112.   is inserted as ancillary data in the bitstream.
  113.   The rate is in bits/frame.
  114.  
  115. 1.8 sampling rate
  116.  If a raw PCM file is used as input, the '-sr' switch supports the encoder
  117.  with the sampling rate.
  118.  THIS IS NOT NEEDED FOR .wav/.snd/.aiff INPUT!
  119.  
  120. 1.9 swap input samples
  121.  If a raw PCM file is used as input, the '-tfs' switch swaps each 16 bit
  122.  input sample prior to processing.
  123.  THIS IS NOT NEEDED FOR .wav/.snd/.aiff INPUT!
  124.  
  125. 1.10 number of channels
  126.  If a raw PCM file is used as input, the '-tfc' switch indicates the number of
  127.  channels (1=mono, 2=stereo).
  128.  THIS IS NOT NEEDED FOR .wav/.snd/.aiff INPUT!
  129.  
  130. 1.11 examples of switch settings
  131.     l3enc infile.pcm out.mp3 -br 112000 -crc
  132.     l3enc c:\music\pcm\newage.pcm c:\music\mp3\newage.mp3 -br 64000
  133.     l3enc pop.wav pop.mp3 -br 96000
  134.  
  135. 1.12 Encoding Recommendations
  136.  Depending on the desired bitrate, the encoding process will be done
  137.  with different parameter settings.
  138.  'l3enc' supports three versions of Layer-3 bitstreams called MPEG-1,
  139.  MPEG-2 and "MPEG 2.5". 
  140.  The basic difference is the use of different sampling frequencies:
  141.  
  142.     MPEG-1     Layer 3       sampling frequencies 32, 44.1,   48 kHz
  143.     MPEG-2     Layer 3       sampling frequencies 16, 22.05,  24 kHz
  144.     "MPEG-2.5" Layer 3       sampling frequencies  8, 11.025, 12 kHz
  145.  
  146.  MPEG-1 supports higher audio bandwidth and is therefore the best 
  147.  choice for high quality audio coding at bitrates >= 96 kbit/s (stereo) 
  148.  or >= 48 kbit/s (mono). For bitrates <= 64 kbit/s (stereo) or
  149.  <=32 kbit/s (mono),MPEG-2 offers better sound quality compared
  150.  to MPEG-1.
  151.  "MPEG 2.5" is a special format developed for very low bitrates.
  152.  
  153.  l3enc selects between MPEG-1 and MPEG-2 automatically depending on the
  154.  bitrate switch (see section 1.3)
  155.  
  156.  For the coding of stereo files with bitrates <=96 kbit/s, the encoder
  157.  will use theintensity stereo technique.
  158.  Note, however, that the use of intensity stereo may demage information
  159.  which is needed for sound processing schemes like Dolby Surround. 
  160.  For bitrates >= 112 kbit/s, intensity stereo is not used.
  161.  
  162.  The following table summarizes the recommendations.
  163.  
  164.  - Coding of Mono Input
  165.  
  166.  bitrate       coding standard  
  167.  -----------------------------
  168.  <= 16 kbit/s  "MPEG-2.5"
  169.  <= 40 kbit/s  MPEG-2
  170.  >= 48 kbit/s  MPEG-1
  171.        
  172.  - Coding of Stereo Input
  173.  
  174.  bitrate       coding standard  use of intensity stereo
  175.  ------------------------------------------------------
  176.  <= 64 kbit/s  MPEG-2           on
  177.     96 kbit/s  MPEG-1           on
  178.  >=112 kbit/s  MPEG-1           off
  179.  
  180.  
  181. 2. DECODER V2.61
  182.    =============
  183.  
  184.  L3DEC.EXE is an ISO/MPEG Layer 3 software only decoder. It takes 
  185.  Layer 3 bitstream files as input and delivers PCM audio data files 
  186.  as output. A number of options can be selected via command line 
  187.  switches. Usage:
  188.  
  189.     l3dec <bitstream> <audio_data> [-switch1 [switch2 [...]]]
  190.  
  191.  L3DEC.EXE should work on any IBM PC compatible computer with a 386 CPU 
  192.  or better with external or built in 387 hardware floating point support.
  193.  
  194.  L3DEC uses the DOS extender GO32.EXE.
  195.  
  196.  If you specify no output file name and use the -sto option, the audio
  197.  data is written to stdout. If you specify -sti, the decoder reads from stdin
  198.  instead of the bitstream file.
  199.  
  200. 2.1 <bitstream>: bitstream input file
  201.  The format of the bitstream input file must comply with ISO/IEC
  202.  IS11172-3 or IS 13818-3.
  203.  The decoder will process all valid MPEG1 Layer-3 bitstream data 
  204.  without restrictions to bitrate or sampling frequency.
  205.  It supports also MPEG2 Layer-3 low sampling frequencies.
  206.  For very low bitrates an special Fraunhofer format called "MPEG 2.5"
  207.  is used.
  208.  
  209. 2.2 <audio_data>: audio data output file
  210.  Audio data is output as samples of 16 bit signed integer PCM data. 
  211.  The default format is raw PCM data and can be either one channel or 
  212.  two interleaved channels.
  213.     format of one (mono) channel PCM audio data:
  214.         <sample #1><sample #2>....
  215.     format of two channel (stereo) PCM audio data:
  216.         <spl.#1 ch.#1><spl.#1 ch.#2><sp.#2 ch.#1><spl.#2 ch.#2>...
  217.  If one or two audio channels are used depends on the encoded information in 
  218.  the bitstream. For stereo output data the first channel is the left 
  219.  channel. Information about sampling frequency and number of used channels 
  220.  is displayed at the beginning of the decoding process.
  221.  
  222. 2.3 RIFF/WAVE format
  223.  If selected by the '-wav' switch, audio data is output in RIFF/WAVE format 
  224.  (*.WAV) as used by Microsoft Windows. The audio data itself is still 
  225.  written as 16 bit PCM data as described in 2.2 but it is preceded by a 
  226.  WAVE-header. The WAVE-Header contains information about the number of 
  227.  channels (1 or 2), sampling frequency (32k/44.1k/48k) and used bits per 
  228.  sample (16).
  229.  
  230. 2.4 SND format
  231.  If selected by the '-snd' switch, audio data files are output in
  232.  the SND format used on SUN and NeXT-Workstations.
  233.  
  234. 2.5 AIFF format
  235.  If selected by the '-aif' switch, audio data files are output in
  236.  the AIFF format.
  237.  
  238. 2.6 AIFC format
  239.  If selected by the '-aic' switch, audio data files are output in
  240.  the AIFC format.
  241.  
  242. 2.7 skip frames
  243.  With the '-fb' option you can skip a number of frames in the bitstream 
  244.  before the decoding starts. '-fb nnn' skips the first nnn frames. Each 
  245.  frame contains 1152 (MPEG-1) or 576 (MPEG-2) samples of audio data.
  246.  Depending on the sampling frequency used, the duration of a frame is
  247.  calculated as 24 msec (@ 48kHz, 24kHz), 26.1 msec (@ 44.1kHz, 22.05kHz)
  248.  or 36 msec (@ 32kHz, 16 kHz).
  249.  
  250. 2.8 decode only nnn frames
  251.  If you want to decode only a certain number of frames, specify the '-fn' 
  252.  option. '-fn xxx' will decode only xxx frames (see also 2.6).
  253.  
  254. 2.9 search again after loss of synchronisation
  255.  Normally the decoding process is stopped, if a loss of synchronisation is 
  256.  detected, i.e. the synch information is incorrect. To enable decoding of 
  257.  partially damaged bitstream files, you may assert the '-sa' option. In 
  258.  this mode the decoding is not stopped and the file is searched for valid 
  259.  synch information until the end of file is encountered.
  260.  
  261. 2.10 write audio data as ascii hex 24bit output file
  262.  If the option '-h24 xxx' is specified an (additional) output file with 
  263.  name 'xxx' is opened. PCM Audio data is output as 24 bit ascii hex values
  264.  followed by carriage return and line feed. Accuracy of the output values
  265.  is 24 bit compared to the 16 bits raw output mode. Files output in 
  266.  'h24' format take four times the storage capacity necessary for raw 
  267.  16bit output format.
  268.  
  269. 2.11 ignore error messages
  270.  If errors in the bitstream are detected, the decoding process is normally
  271.  halted. If the '-ign' option is specified, the decoder tries to continue 
  272.  with the decoding process.
  273.  
  274. 2.11 accept free format bitstream
  275.  If the '-ff' option is specified, a free format bitstream is accepted.
  276.  
  277. 2.11 ancillary data
  278.  If the bitstream contains ancillary data (user data integrated into
  279.  the bitstream) the decoder can write this data into an ancillary 
  280.  data file. Use the switch '-a file' to specify the filename for the
  281.  ancillary data. The default alignment of ancillary data is byte
  282.  aligned ('-aba'). You can also use the switch '-afh' for the FhG mode.
  283.  In FhG-mode, ancillary data is framed, beginning with a Sync, a length
  284.  byte and has a trailing checksum.
  285.  
  286. 2.12 write to stdout
  287.  If the '-sto' option is specified, the PCM data output is written to
  288.  stdout.
  289.  
  290. 2.13 read from stdin
  291.  If the '-sti' option is specified, the bitstream input is read from
  292.  stdin.
  293.  
  294.  
  295. All brand names are registered trade marks of their respective owners.
  296.  
  297.