home *** CD-ROM | disk | FTP | other *** search
/ Unix System Administration Handbook 1997 October / usah_oct97.iso / rfc / 900s / rfc978.txt < prev    next >
Text File  |  1986-03-03  |  9KB  |  291 lines

  1.  
  2.  
  3.    Network Working Group                            J. K. Reynolds (ISI)
  4.    Request for Comments:  978                   R. Gillmann (Inner Loop)
  5.                                             W. A. Brackenridge (Alembic)
  6.                                                A. Witkowski (Inner Loop)
  7.                                                          J. Postel (ISI)
  8.                                                            February 1986
  9.  
  10.    
  11.                  VOICE FILE INTERCHANGE PROTOCOL (VFIP)
  12.    
  13.  
  14. STATUS OF THIS MEMO
  15.  
  16.    This memo describes a proposed voice file interchange format for use
  17.    in the ARPA-Internet community.  Suggestions for improvement are
  18.    encouraged.  Distribution of this memo is unlimited.
  19.  
  20. 1.  INTRODUCTION
  21.  
  22.    The purpose of the Voice File Interchange Protocol (VFIP) is to
  23.    permit the interchange of various types of speech files between
  24.    different systems.  Currently, there are many different types of
  25.    voice implementations, but no specific standard has been set with an
  26.    eye towards compatability between these systems.  With the increasing
  27.    interest and development of voice, specifically in Multimedia Mail,
  28.    there is an increased need to include standardized speech into a
  29.    common data structure.
  30.  
  31.    The Voice File Interchange Protocol defines a header to describe the
  32.    voice data.  The 18-byte header contains the identifier, the header
  33.    version number, the header length, a DTMF mask for Touch-Tones, the
  34.    recording rate in bits per second, the total time in deci-seconds
  35.    (tenths of a second), and the encoding/recording method (see
  36.    Figure 1).
  37.  
  38. 2.  THE VOICE FILE INTERCHANGE PROTOCOL HEADER
  39.  
  40.    The Voice File Interchange Protocol header is organized as follows:
  41.  
  42.    2.1  The Header Version Number
  43.  
  44.       The version number is 1-byte.  This first version is number one.
  45.  
  46.    2.2  The Header Length
  47.  
  48.       The length is a 1-byte field indicating the length of the entire
  49.       header in bytes.  For this first version, the length is
  50.       18 (bytes).
  51.  
  52.  
  53.  
  54.  
  55.  
  56.  
  57. Reynolds, et al.                                                [Page 1]
  58.  
  59.  
  60.  
  61. Voice File Interchange Protocol                                  RFC 978
  62.  
  63.  
  64.    2.3  The DTMF Mask
  65.  
  66.       This field describes what is known about DTMF Touch-Tones in the
  67.       data.  The field consists of a 16 flag bits which indicate what is
  68.       known about particular DTMF tones.  The 16 possible DTMF tones, in
  69.       order, are:  0 1 2 3 4 5 6 7 8 9 # * A B C D.  The low order bit
  70.       of the field is tone 0.
  71.  
  72.       A 1-bit signifies that the corresponding tone is guaranteed NOT to
  73.       be in the speech file.  A 0-bit signifies that it may or may not
  74.       be in the speech file.  Therefore, a field of 16 zeros denotes
  75.       that nothing is known about the tones.  A field of 16 ones denotes
  76.       that there are no tones in the file.
  77.  
  78.    2.4  Recording Rate
  79.  
  80.       The recording rate is a 32-bit field and is the approximate rate
  81.       in bits/second of the method used to record the speech.  For
  82.       variable rate methods, this may be very approximate.
  83.  
  84.    2.5  Total Time
  85.  
  86.       A 32-bit number indicating the total time of the recording in
  87.       deci-seconds.  For example, 600 indicates 1 minute of speech.
  88.  
  89.    2.6  Methods of Encoding/Recording
  90.  
  91.       This 6-byte ASCII field indicates the method of
  92.       encoding/recording.  Names shorter than six characters are padded
  93.       out to the right with blanks (the ASCII space character, code 32
  94.       decimal).  For comparisons, the names are case insensitive.
  95.  
  96.       Some known methods of Encoding/Recording are:
  97.  
  98.         TI - The Texas Instruments card for the IBM PC [5].
  99.  
  100.         IBM - PC Voice Communications Options.
  101.  
  102.         NVP-1 and NVP-2 - Network Voice Protocol [1,2].
  103.  
  104.         COMPUT - Computalker card for the IBM PC [4].
  105.  
  106.  
  107.  
  108.  
  109.  
  110.  
  111.  
  112.  
  113.  
  114.  
  115. Reynolds, et al.                                                [Page 2]
  116.  
  117.  
  118.  
  119. Voice File Interchange Protocol                                  RFC 978
  120.  
  121.  
  122. 3.  SUMMARY
  123.  
  124.    This 18-byte header will permit interchange of speech files between
  125.    different systems, as well as facilitate automatic conversion between
  126.    formats.  The header does not have to be prepended to the speech file
  127.    proper; it may be in the form of a separate associated file, if that
  128.    is more convenient.
  129.  
  130.                    <------------16-bits------------>
  131.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  132.                    |    Version    |      Length   |
  133.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  134.                    |             -DTMF-            |
  135.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  136.                    |          -Recording-          |
  137.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  138.                    |             -Rate-            |
  139.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  140.                    |            -Total-            |
  141.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  142.                    |             -Time-            |
  143.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  144.                    |       M       |       E       |
  145.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  146.                    |       T       |       H       |
  147.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  148.                    |       O       |       D       |
  149.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  150.  
  151.                                 Figure 1
  152.  
  153.  
  154.  
  155.  
  156.  
  157.  
  158.  
  159.  
  160.  
  161.  
  162.  
  163.  
  164.  
  165.  
  166.  
  167.  
  168.  
  169.  
  170.  
  171.  
  172.  
  173. Reynolds, et al.                                                [Page 3]
  174.  
  175.  
  176.  
  177. Voice File Interchange Protocol                                  RFC 978
  178.  
  179.  
  180. 4.  EXAMPLES
  181.  
  182.    Example 1 is for one minute of 2400 bps NVP-2 speech.  Nothing is
  183.    known about DTMF tones in the data.
  184.  
  185.                    <------------16-bits------------>
  186.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  187.                    |       1       |      18       |
  188.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  189.                    |               0               |
  190.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  191.                    |                               |
  192.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  193.                    |              2400             |
  194.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  195.                    |                               |
  196.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  197.                    |              600              |
  198.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  199.                    |       N       |       V       |
  200.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  201.                    |       P       |       -       |
  202.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  203.                    |       2       |      <sp>     |
  204.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  205.  
  206.                                 Example 1
  207.  
  208.  
  209.  
  210.  
  211.  
  212.  
  213.  
  214.  
  215.  
  216.  
  217.  
  218.  
  219.  
  220.  
  221.  
  222.  
  223.  
  224.  
  225.  
  226.  
  227.  
  228.  
  229.  
  230.  
  231. Reynolds, et al.                                                [Page 4]
  232.  
  233.  
  234.  
  235. Voice File Interchange Protocol                                  RFC 978
  236.  
  237.  
  238.    Example 2 shows the header for 10 seconds of 1200 bps TI speech, with
  239.    none of the DTMF tone 0-9 in the data, but no information about
  240.    tones *, #, A-D.
  241.  
  242.                    <------------16-bits------------>
  243.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  244.                    |       1       |      18       |
  245.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  246.                    |              1023             |
  247.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  248.                    |                               |
  249.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  250.                    |              1200             |
  251.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  252.                    |                               |
  253.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  254.                    |              100              |
  255.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  256.                    |       T       |       I       |
  257.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  258.                    |      <sp>     |      <sp>     |
  259.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  260.                    |      <sp>     |      <sp>     |
  261.                    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  262.  
  263.                                 Example 2
  264.  
  265. REFERENCES
  266.  
  267.    [1]  Cohen, Danny, "Specifications for the Network Voice Protocol
  268.         (NVP)", RFC 741 (NIC 42444), USC/Information Sciences Institute,
  269.         January 1976.
  270.  
  271.    [2]  Cohen, Danny, "A Network Voice Protocol (NVP-II)",
  272.         USC/Information Sciences Institute, April 1981.
  273.  
  274.    [3]  O'Leary, G. C., "Local Access Area Facilities for Packet Voice",
  275.         MIT/LL, October 1980.
  276.  
  277.    [4]  Computalker, "Compu Phone for the IBM PC/XT", Santa Monica,
  278.         California, August 1985.
  279.  
  280.    [5]  Texas Instruments, Inc., "The TI Speech Application Tool Kit
  281.         Guide", TI Part #2232384-1, May 1985.
  282.  
  283.  
  284.  
  285.  
  286.  
  287.  
  288.  
  289. Reynolds, et al.                                                [Page 5]
  290.  
  291.