home *** CD-ROM | disk | FTP | other *** search
/ Nebula 1994 June / NEBULA_SE.ISO / Documents / FAQ / Audio-fmts-faq / diff < prev    next >
Encoding:
Internet Message Format  |  1993-07-20  |  12.5 KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!spool.mu.edu!sdd.hp.com!swrinde!cs.utexas.edu!uunet!mcsun!sun4nl!cwi.nl!guido
  2. From: guido@cwi.nl (Guido van Rossum)
  3. Newsgroups: alt.binaries.sounds.misc,alt.binaries.sounds.d,comp.dsp,comp.answers,news.answers
  4. Subject: Changes to: FAQ: Audio File Formats
  5. Message-ID: <audio-diff_743091234@charon.cwi.nl>
  6. Date: 19 Jul 93 14:14:28 GMT
  7. Expires: 16 Aug 93 14:13:54 GMT
  8. Sender: news@cwi.nl
  9. Reply-To: guido@cwi.nl
  10. Followup-To: alt.binaries.sounds.d,comp.dsp
  11. Lines: 333
  12. Approved: news-answers-request@MIT.Edu
  13. Supersedes: <audio-diff_740136129@charon.cwi.nl>
  14. Xref: senator-bedfellow.mit.edu alt.binaries.sounds.misc:8710 alt.binaries.sounds.d:3429 comp.dsp:6707 comp.answers:1342 news.answers:10511
  15.  
  16. Archive-name: audio-fmts/diff
  17. Submitted-by: Guido van Rossum <guido@cwi.nl>
  18. Version: 3.04
  19. Last-modified: 19-Jul1993
  20.  
  21. *** 1.3    1993/06/15 09:22:23
  22. --- audio.part1    1993/07/19 14:08:13
  23. ***************
  24. *** 8,11 ****
  25.   Submitted-by: Guido van Rossum <guido@cwi.nl>
  26. ! Version: 3.03
  27. ! Last-modified: 15-Jun-1993
  28.   
  29. --- 8,11 ----
  30.   Submitted-by: Guido van Rossum <guido@cwi.nl>
  31. ! Version: 3.04
  32. ! Last-modified: 19-Jul-1993
  33.   
  34. ***************
  35. *** 121,123 ****
  36.   like a tiny floating point number; however, their dynamic range is
  37. ! that of 14 bit linear data.  Source for converting to/from U-LAW
  38.   (written by Jef Poskanzer) is distributed as part of the SOX package
  39. --- 121,123 ----
  40.   like a tiny floating point number; however, their dynamic range is
  41. ! that of 12 bit linear data.  Source for converting to/from U-LAW
  42.   (written by Jef Poskanzer) is distributed as part of the SOX package
  43. ***************
  44. *** 216,223 ****
  45.   Public standards for voice compression are slowly gaining popularity,
  46. ! e.g. CCITT G.721 and G.723 (ADPCM at 32 and 24 kbits/sec).  (ADPCM ==
  47. ! Adaptive Delta Pulse Code Modulation.)  Free source code for a *fast*
  48. ! 32 kbits/sec ADPCM algorithm is available by ftp from ftp.cwi.nl as
  49. ! /pub/adpcm.shar.  (** NOTE: if you are using v1.0, you should get
  50. ! v1.1, released 17-Dec-1992, which fixes a serious bug -- the quality
  51. ! of v1.1 is claimed to be better than uLAW **)
  52.   
  53. --- 216,229 ----
  54.   Public standards for voice compression are slowly gaining popularity,
  55. ! e.g. CCITT G.721 (ADPCM at 32 kbits/sec) and G.723 (ADPCM at 24 and 40
  56. ! kbits/sec).  (ADPCM == Adaptive Delta Pulse Code Modulation.)  Sun
  57. ! Microsoft has placed the source code of a portable implementation of
  58. ! these algorithms (as well as G.711, which defines A-LAW and U-LAW) in
  59. ! the public domain (needless to say, their proprietary implementation
  60. ! distributed in binary form with Solaris is better :-).  One place to
  61. ! ftp this source code from is ftp.cwi.nl:/pub/audio/ccitt-adpcm.tar.Z.
  62. ! Source for another 32 kbits/sec ADPCM implementation, assumed to be
  63. ! compatible with Intel's DVI audio format, can be ftp'ed from
  64. ! ftp.cwi.nl:/pub/audio/adpcm.shar.  (** NOTE: if you are using v1.0,
  65. ! you should get v1.1, released 17-Dec-1992, which fixes a serious bug
  66. ! -- the quality of v1.1 is claimed to be better than U-LAW **)
  67.   
  68. ***************
  69. *** 232,233 ****
  70. --- 238,245 ----
  71.   
  72. + Tony Robinson <ajr@eng.cam.ac.uk> has written a good FAST loss-less
  73. + compression for lots of different audio formats (particularly good for
  74. + WAV and MOD files).  The software is available by anonymous ftp from
  75. + svr-ftp.eng.cam.ac.uk [129.169.24.20], directory misc, file
  76. + shorten-1.08.tar.Z.
  77.   (Note that U-LAW and silence detection can also be considered
  78. ***************
  79. *** 313,315 ****
  80. --- 325,329 ----
  81.   DEC 3000/300-500    U-LAW           8k                   1
  82. + DEC 5000/20-25      U-LAW           8k                   1
  83.   Tandy 1000/*L*      8               22k                  3
  84. + Tandy 2500          8               22k                  3
  85.   HP9000/705,710,425e U,A-LAW,16      8k                   1
  86. ***************
  87. *** 338,339 ****
  88. --- 352,359 ----
  89.   
  90. + Notes for the DECstation 5000/20-25: You need either XMedia tools from
  91. + DEC ($$$$), or the AudioFile package (which works nicely) from
  92. + crl.dec.com (see below). The audio device is "/dev/bba", you cannot
  93. + send ".au" files directly to the device, the Xmedia/AF software
  94. + provide an "audioserver" which must be run to play/record sounds.
  95.   The SGI Personal IRIS 4D/30 and 4D/35 have the same capabilities as
  96. ***************
  97. *** 654,657 ****
  98.   
  99. ! The Tandy 1000 uses a (proprietary?) compressed format.  There is a
  100. ! PD Mac to Tandy conversion program called CONVERT.
  101.   
  102. --- 674,680 ----
  103.   
  104. ! The Tandy 1000 uses a (proprietary?) compressed format.  There is a PD
  105. ! Mac to Tandy conversion program called CONVERT.  Leonard Erickson
  106. ! <leonard@qiclab.scn.rain.com> writes: There is a WAV driver from Tandy
  107. ! if people ask.  There also appears to be a program that purports to
  108. ! convert other formats to Tandy, but I haven't tested this one yet.
  109.   
  110. *** 1.3    1993/06/15 09:22:23
  111. --- audio.part2    1993/07/19 14:08:58
  112. ***************
  113. *** 8,11 ****
  114.   Submitted-by: Guido van Rossum <guido@cwi.nl>
  115. ! Version: 3.03
  116. ! Last-modified: 15-Jun-1993
  117.   
  118. --- 8,11 ----
  119.   Submitted-by: Guido van Rossum <guido@cwi.nl>
  120. ! Version: 3.04
  121. ! Last-modified: 19-Jul-1993
  122.   
  123. ***************
  124. *** 518,543 ****
  125.   
  126. ! From: Joe Campbell  N3JBC  jpcampb@afterlife.ncsc.mil  74040.305@compuserve.com
  127.   
  128. ! The U.S. DoD's Federal-Standard-1016 4800 bps code excited linear prediction
  129. ! voice coder version 3.2 (CELP 3.2) Fortran and C simulation source codes are
  130. ! now available for worldwide distribution at no charge (on DOS diskettes,
  131. ! but configured to compile on Sun SPARC stations) from:
  132. ! Bob Fenichel
  133. ! National Communications System
  134. ! Washington, D.C.  20305
  135. ! 1-703-692-2124
  136. ! 1-703-746-4960 (fax)
  137. ! In addition to the source codes, example input and processed speech files
  138. ! are included along with a technical information bulletin to assist in
  139. ! implementation of FS-1016 CELP.  (An anonymous ftp site is being considered
  140. ! for future releases.)
  141. ! Copies of the FS-1016 document are available for $2.50 each from:
  142. ! GSA Rm 6654
  143. ! 7th & D St SW
  144. ! Washington, D.C.  20407
  145. ! 1-202-708-9205
  146.   
  147. --- 518,552 ----
  148.   
  149. ! From: jpcampb@afterlife.ncsc.mil (Joe Campbell)
  150.   
  151. ! The U.S. DoD's Federal-Standard-1016 based 4800 bps code excited linear
  152. ! prediction voice coder version 3.2 (CELP 3.2) Fortran and C simulation
  153. ! source codes are available for worldwide distribution (on DOS
  154. ! diskettes, but configured to compile on Sun SPARC stations) from NTIS
  155. ! and DTIC.  Example input and processed speech files are included.  A
  156. ! Technical Information Bulletin (TIB), "Details to Assist in
  157. ! Implementation of Federal Standard 1016 CELP," and the official
  158. ! standard, "Federal Standard 1016, Telecommunications:  Analog to
  159. ! Digital Conversion of Radio Voice by 4,800 bit/second Code Excited
  160. ! Linear Prediction (CELP)," are also available.
  161. ! This is available through the National Technical Information Service:
  162. ! NTIS
  163. ! U.S. Department of Commerce
  164. ! 5285 Port Royal Road
  165. ! Springfield, VA  22161
  166. ! USA
  167. ! (703) 487-4650
  168. ! The "AD" ordering number for the CELP software is AD M000 118
  169. ! (US$ 90.00) and for the TIB it's AD A256 629 (US$ 17.50).  The LPC-10
  170. ! standard, described below, is FIPS Pub 137 (US$ 12.50).  There is a
  171. ! $3.00 shipping charge on all U.S. orders.  The telephone number for
  172. ! their automated system is 703-487-4650, or 703-487-4600 if you'd prefer
  173. ! to talk with a real person.
  174. ! (U.S. DoD personnel and contractors can receive the package from the
  175. ! Defense Technical Information Center:  DTIC, Building 5, Cameron
  176. ! Station, Alexandria, VA 22304-6145.  Their telephone number is
  177. ! 703-274-7633.)
  178.   
  179. ***************
  180. *** 559,563 ****
  181.   
  182. - For U.S. FED-STD-1016 (4800 bps CELP) _realtime_ DSP code
  183. - and information about products using this code, contact:
  184.   
  185.   John DellaMorte
  186. --- 568,601 ----
  187.   
  188.   
  189. + The U.S. DoD's Federal-Standard-1015/NATO-STANAG-4198 based 2400 bps
  190. + linear prediction coder (LPC-10) was republished as a Federal
  191. + Information Processing Standards Publication 137 (FIPS Pub 137).
  192. + It is described in:
  193. + Thomas E. Tremain, "The Government Standard Linear Predictive Coding
  194. + Algorithm:  LPC-10," Speech Technology Magazine, April 1982, p. 40-49.
  195. + There is also a section about FS-1015 in the book:
  196. + Panos E. Papamichalis, Practical Approaches to Speech Coding,
  197. + Prentice-Hall, 1987.
  198. + The voicing classifier used in the enhanced LPC-10 (LPC-10e) is described in:
  199. + Campbell, Joseph P., Jr. and T. E. Tremain, "Voiced/Unvoiced Classification
  200. + of Speech with Applications to the U.S. Government LPC-10E Algorithm,"
  201. + Proceedings of the IEEE International Conference on Acoustics, Speech, and
  202. + Signal Processing, 1986, p. 473-6.
  203. + Copies of the official standard
  204. + "Federal Standard 1016, Telecommunications: Analog to Digital Conversion
  205. + of Radio Voice by 4,800 bit/second Code Excited Linear Prediction (CELP)"
  206. + are available for US$ 5.00 each from:
  207. +  
  208. + GSA Federal Supply Service Bureau
  209. + Specification Section, Suite 8100
  210. + 470 E. L'Enfant Place, S.W.
  211. + Washington, DC  20407
  212. + (202)755-0325
  213. + Realtime DSP code for FS-1015 and FS-1016 is sold by:
  214. +  
  215.   John DellaMorte
  216. ***************
  217. *** 566,567 ****
  218. --- 604,606 ----
  219.   Bedford, MA  01730
  220. + USA
  221.   1-617-275-3733
  222. ***************
  223. *** 570,582 ****
  224.   
  225. ! DSP Software Engineering's code can run on a DSP Research's Tiger 30 board
  226. ! (a PC board with a TMS320C3x and analog interface suited to development work)
  227. ! or on Intellibit's AE2000 TMS320C31 based 3" by 2.5" card.
  228. ! DSP Research                Intellibit
  229. ! 1095 E. Duane Ave.          P.O. Box 9785
  230. ! Sunnyvale, CA  94086        McLean, VA  22102-0785
  231. ! (408)773-1042               (703)442-4781
  232. ! (408)736-3451 (fax)         (703)442-4784 (fax)
  233.   
  234. ! From: tobiasr@monolith.lrmsc.loral.com (Richard Tobias )
  235.   
  236. --- 609,621 ----
  237.    
  238. ! DSP Software Engineering's FS-1016 code can run on a DSP Research's Tiger 30
  239. ! (a PC board with a TMS320C3x and analog interface suited to development work).
  240. !  
  241. ! DSP Research                
  242. ! 1095 E. Duane Ave.          
  243. ! Sunnyvale, CA  94086        
  244. ! USA
  245. ! (408)773-1042               
  246. ! (408)736-3451 (fax)         
  247.   
  248. ! From: tobiasr@monolith.lrmsc.loral.com (Richard Tobias)
  249.   
  250. ***************
  251. *** 593,623 ****
  252.   
  253. ! Newsgroups: comp.dsp
  254. ! From: bae@hplsdrn.col.hp.com (Bruce Erickson)
  255. ! Subject: Re: FTP site for CELP audio compression source?
  256. ! In comp.dsp (subj: FTP site for CELP audio compression source?), Joe
  257. ! Campbell writes:
  258. ! > I would like to mention that a document, that is a vital part of the CELP
  259. ! > release package, is not available in electronic form.  Therefore, I urge
  260. ! > anyone who is seriously interested in this coder to obtain this document:
  261. ! > 
  262. ! >  Details to Assist in Implementation of Federal Standard 1016 CELP.
  263. ! >  National Communications System, Office of Technology & Standards, 1992.
  264. ! >  Technical Information Bulletin 92-1.
  265. ! [Available for free from Bob Fenichel above --GvR]
  266. ! I would also like to mention that when Bob gave me permission to put the
  267. ! CELP disks on wsmr-simutel he asked for people who fetch them to let
  268. ! him know that they have them.  
  269. ! So if you grab the sources -- from whatever source -- please give him
  270. ! a call or send him USmail.
  271. ! I am still waiting for wsmr-simutel to let me know how to upload the CELP
  272. ! disks -- I will be sure to post here & elsewhere when I upload them!
  273. !                      - Bruce Erickson
  274. !                      bae@col.hp.com
  275.   
  276. ! From: Cole Erskine <cole@analogical.com> [paraphrased]
  277.   
  278. --- 632,636 ----
  279.   
  280. ! From: Cole Erskine <cole@analogical.com>
  281.   
  282. ! [paraphrased]
  283.   
  284. ***************
  285. *** 681,682 ****
  286. --- 694,696 ----
  287.         07     End repeat      0                   (NONE)
  288. +       08     Extended        4                   ***
  289.   
  290. ***************
  291. *** 688,690 ****
  292. --- 702,712 ----
  293.   
  294. +     ***Extended Info Format:
  295. +        ---------------------
  296. +        00-01  Time Constant: Mono: 65536 - (256000000/sample_rate)
  297. +                              Stereo: 65536 - (25600000/(2*sample_rate))
  298. +        02     Pack
  299. +        03     Mode: 0 = mono
  300. +                     1 = stereo
  301.   
  302.     Marker#           -- Driver keeps the most recent marker in a status byte
  303. ***************
  304. *** 771,772 ****
  305. --- 793,813 ----
  306.   Copyright 1959, 1964, 1970, 1982
  307. + A note on the resolution of U-LAW by Frank Klemm <pfk@rz.uni-jena.de>:
  308. + 8 bit U-LAW has the same lowest  magnitude like 12 bit linear and 12 bit
  309. + U-LAW like 16 linear.
  310. + Device/Coding    Resolution        Resolution
  311. +         on maximal level    on low level
  312. +  8 bit linear     8             8
  313. +  8 bit ulaw     6            12    (used for digital telephone)
  314. + 12 bit linear    12            12
  315. + 12 bit ulaw    10            16    (used in DAT/Longplay)
  316. + 16 bit linear    16            16
  317. + estimated for some analoge technique:
  318. + tape recorder (HiFi DIN)
  319. +          8             9      (no Problem today)
  320. + tape recorder (semiprofessional)
  321. +         10.5            13.5 
  322.   
  323.