home *** CD-ROM | disk | FTP | other *** search
/ The Hacker's Encyclopedia 1998 / hackers_encyclopedia.iso / rfc / 3 / rfc2288.txt < prev    next >
Encoding:
Text File  |  2003-06-11  |  21.1 KB  |  564 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7. Network Working Group                                          C. Lynch
  8. Request for Comments: 2288          Coalition for Networked Information
  9. Category: Informational                                      C. Preston
  10.                                                         Preston & Lynch
  11.                                                               R. Daniel
  12.                                          Los Alamos National Laboratory
  13.                                                           February 1998
  14.  
  15.  
  16.                 Using Existing Bibliographic Identifiers
  17.                                    as
  18.                          Uniform Resource Names
  19.  
  20. Status of this Memo
  21.  
  22.    This memo provides information for the Internet community.  It does
  23.    not specify an Internet standard of any kind.  Distribution of this
  24.    memo is unlimited.
  25.  
  26. Copyright Notice
  27.  
  28.    Copyright (C) The Internet Society (1998).  All Rights Reserved.
  29.  
  30. Abstract
  31.  
  32.    A system for Uniform Resource Names (URNs) must be capable of
  33.    supporting identifiers from existing widely-used naming systems.
  34.    This document discusses how three major bibliographic identifiers
  35.    (the ISBN, ISSN and SICI) can be supported within the URN framework
  36.    and the currently proposed syntax for URNs.
  37.  
  38. 1. Introduction
  39.  
  40.    The ongoing work of several IETF working groups, most recently in the
  41.    Uniform Resource Names working group, has culminated the development
  42.    of a syntax for Uniform Resource Names (URNs).   The functional
  43.    requirements and overall framework for Uniform Resource Names are
  44.    specified in RFC 1737 [Sollins & Masinter] and the specification for
  45.    the URN syntax is RFC 2141 [Moats].
  46.  
  47.    As part of the validation process for the development of URNs the
  48.    IETF working group has agreed that it is important to demonstrate
  49.    that the current URN syntax proposal can accommodate existing
  50.    identifiers from well established namespaces.  One such
  51.    infrastructure for assigning and managing names comes from the
  52.    bibliographic community.  Bibliographic identifiers function as names
  53.    for objects that exist both in print and, increasingly, in electronic
  54.    formats.  This memo demonstrates the feasibility of supporting three
  55.  
  56.  
  57.  
  58. Lynch, et. al.               Informational                      [Page 1]
  59.  
  60. RFC 2288                Bibligraphic Identifiers           February 1998
  61.  
  62.  
  63.    representative bibliographic identifiers within the currently
  64.    proposed URN framework and syntax.
  65.  
  66.    Note that this document does not purport to define the "official"
  67.    standard way of moving these bibliographic identifiers into URNs; it
  68.    merely demonstrates feasibility.  It has not been developed in
  69.    consultation with these standards bodies and maintenance agencies
  70.    that oversee the existing bibliographic identifiers.  Any actual
  71.    Internet standard for encoding these bibliographic identifiers as
  72.    URNs will need to be developed in consultation with the responsible
  73.    standards bodies and maintenance agencies.
  74.  
  75.    In addition, there are several open questions with regard to the
  76.    management and registry of Namespace Identifiers (NIDs) for URNs.
  77.    For purposes of illustration, we have used the three NIDs "ISBN",
  78.    "ISSN" and "SICI" for the three corresponding bibliographic
  79.    identifiers discussed in this document.  While we believe this to be
  80.    the most appropriate choice, it is not the only one.  The NIDs could
  81.    be based on the standards body and standard number (e.g.  "US-ANSI-
  82.    NISO-Z39.56-1997" rather than "SICI").  Alternatively, one could lump
  83.    all bibliographic identifiers into a single "BIBLIOGRAPHIC" name
  84.    space, and structure the namespace-specific string to specify which
  85.    identifier is being used.  Any final resolution of this must wait for
  86.    the outcome of namespace management discussions in the working group
  87.    and the broader IETF community.
  88.  
  89.    For the purposes of this document, we have selected three major
  90.    bibliographic identifiers (national and international) to fit within
  91.    the URN framework.  These are the International Standard Book Number
  92.    (ISBN) [ISO1], the International Standard Serials Number (ISSN)
  93.    [NISO1,ISO2, ISO3], and the Serial Item and Contribution Identifier
  94.    (SICI) [NISO2].  An ISBN is used to identify a monograph (book).  An
  95.    ISSN is used to identify serial publications (journals, newspapers)
  96.    as a whole.   A SICI augments the ISSN in order to identify
  97.    individual issues of serial publications, or components within those
  98.    issues (such as an individual article, or the table of contents of a
  99.    given issue).  The ISBN and ISSN are defined in the United States by
  100.    standards issued by the National Information Standards Organization
  101.    (NISO) and also by parallel international standards issued under the
  102.    auspices of the International Organization for Standardization (ISO).
  103.    NISO is the ANSI-accredited standards body serving libraries,
  104.    publishers and information services.  The SICI code is defined by a
  105.    NISO document in the United States and does not have a parallel
  106.    international standards document at present.
  107.  
  108.  
  109.  
  110.  
  111.  
  112.  
  113.  
  114. Lynch, et. al.               Informational                      [Page 2]
  115.  
  116. RFC 2288                Bibligraphic Identifiers           February 1998
  117.  
  118.  
  119.    Many other bibliographic identifiers are in common use (for example,
  120.    CODEN, numbers assigned by major bibliographic utilities such as OCLC
  121.    and RLG, national library numbers such as the Library of Congress
  122.    Control Number) or are under development.  While we do not discuss
  123.    them in this document, many of these will also need to be supported
  124.    within the URN framework as it moves to large scale implementation.
  125.    The issues involved in supporting those additional identifiers are
  126.    anticipated to be broadly similar to those involved in supporting
  127.    ISBNs, ISSNs, and SICIs.
  128.  
  129. 2. Identification vs. Resolution
  130.  
  131.    It is important to distinguish between the resource identified by a
  132.    URN and the resources a URN resolver that can reasonably return when
  133.    attempting to resolve an identifier.  For example, the ISSN 0040-781X
  134.    identifies the popular magazine "Time" -- all of it, every issue for
  135.    from the start of publication to present.  Resolving such an
  136.    identifier should not result in the equivalent of hundreds of
  137.    thousands of pages of text and photos being dumped to the user's
  138.    machine.  It is more reasonable for ISSNs to resolve to a
  139.    navigational system, such as an HTML-based search form, so the user
  140.    may select issues or articles of interest.  ISBNs and SICIs, on the
  141.    other hand, do identify finite, manageably-sized objects, but these
  142.    objects may still be large enough that resolution to a hierarchical
  143.    system is appropriate.
  144.  
  145.    In addition, the materials identified by an ISSN, ISBN or SICI may
  146.    exist only in printed or other physical form, not electronically.
  147.    The best that a resolver may be able to offer is information about
  148.    where to get the physical resource, such as library holdings or a
  149.    bookstore or publisher order form.  The URN Framework provides
  150.    resolution services that may be used to describe any differences
  151.    between the resource identified by a URN and the resource that would
  152.    be returned as a result of resolving that URN.
  153.  
  154. 3. International Standard Book Numbers
  155.  
  156. 3.1 Overview
  157.  
  158.    An International Standard Book Number (ISBN) identifies an edition of
  159.    a monographic work.  The ISBN is defined by the standard
  160.    NISO/ANSI/ISO 2108:1992 [ISO1]
  161.  
  162.    Basically, an ISBN is a ten-digit number (actually, the last digit
  163.    can be the letter "X" as well, as described below) which is divided
  164.    into four variable length parts usually separated by hyphens when
  165.    printed.  The parts are as follows (in this order):
  166.  
  167.  
  168.  
  169.  
  170. Lynch, et. al.               Informational                      [Page 3]
  171.  
  172. RFC 2288                Bibligraphic Identifiers           February 1998
  173.  
  174.  
  175.    * a group identifier which specifies a group of publishers, based on
  176.    national, geographic or some other criteria,
  177.  
  178.    * the publisher identifier,
  179.  
  180.    * the title identifier,
  181.  
  182.    * and a modulus 11 check digit, using X instead of 10.
  183.  
  184.    The group and publisher number assignments are managed in such a way
  185.    that the hyphens are not needed to parse the ISBN unambiguously into
  186.    its constituent parts.  However, the ISBN is normally transmitted and
  187.    displayed with hyphens to make it easy for human beings to recognize
  188.    these parts without having to make reference to or have knowledge of
  189.    the number assignments for group and publisher identifiers.
  190.  
  191. 3.2 Encoding Considerations and Lexical Equivalence
  192.  
  193.    Embedding ISBNs within the URN framework presents no particular
  194.    encoding problems, since all of the characters that can appear in an
  195.    ISBN are valid in the identifier segment of the URN.  %-encoding, as
  196.    described in [MOATS] is never needed.
  197.  
  198.    Example: URN:ISBN:0-395-36341-1
  199.  
  200.    For the ISBN namespace, some additional equivalence rules are
  201.    appropriate.  Prior to comparing two ISBN URNs for equivalence, it is
  202.    appropriate to remove all hyphens, and to convert any occurrences of
  203.    the letter X to upper case.
  204.  
  205. 3.3 Additional considerations
  206.  
  207.    The ISBN standard and related community implementation guidelines
  208.    define when different versions of a work should be assigned the same
  209.    or differing ISBNs.  In actuality, however, practice varies somewhat
  210.    depending on publisher as to whether different ISBNs are assigned for
  211.    paperbound vs.  hardbound versions of the same work, electronic vs.
  212.    printed versions of the same work, or versions of the same work
  213.    distinguished in some other way (e.g., published for example in the
  214.    US and in Europe).  The choice of whether to assign a new ISBN or to
  215.    reuse an existing one when publishing a revised printing of an
  216.    existing edition of a work or even a revised edition of a work is
  217.    somewhat subjective.  Practice varies from publisher to publisher
  218.    (indeed, the distinction between a revised printing and a new edition
  219.    is itself somewhat subjective).  The use of ISBNs within the URN
  220.    framework simply reflects these existing practices.  Note that it is
  221.    likely that an ISBN URN will often resolve to many instances of the
  222.    work (many URLs).
  223.  
  224.  
  225.  
  226. Lynch, et. al.               Informational                      [Page 4]
  227.  
  228. RFC 2288                Bibligraphic Identifiers           February 1998
  229.  
  230.  
  231. 4. International Standard Serials Numbers
  232.  
  233. 4.1 Overview
  234.  
  235.    International Standard Serials Numbers (ISSN) identify a work that is
  236.    published on a continued basis in issues; they identify the entire
  237.    (often open-ended, in the case of an actively published) work.  ISSNs
  238.    are defined by the international standards ISO 3297:1986 [ISO2] and
  239.    ISO/DIS 3297 [ISO3] and within the United States by NISO Z39.9-1992
  240.    [NISO1].  The ISSN International Centre is located in Paris and
  241.    coordinates a network of regional centers.  The National Serials Data
  242.    Program within the Library of Congress is the US Center of this
  243.    network.
  244.  
  245.    ISSNs have the form NNNN-NNNN where N is a digit, the last digit may
  246.    be an upper case X as the result of the check character calculation.
  247.    Unlike the ISBN the ISSN components do not have much structure;
  248.    blocks of numbers are passed out to the regional centers and
  249.    publishers.
  250.  
  251. 4.2 Encoding Considerations and Lexical Equivalence
  252.  
  253.    Again, there is no problem representing ISSNs in the namespace-
  254.    specific string of URNs since all characters valid in the ISSN are
  255.    valid in the namespace-specific URN string, and %-encoding is never
  256.    required.
  257.  
  258.    Example: URN:ISSN:1046-8188
  259.  
  260.    Supplementary comparison rules are also appropriate for the ISSN
  261.    namespace.  Just as for ISBNs, hyphens should be dropped prior to
  262.    comparison and occurrences of 'x' normalized to uppercase.
  263.  
  264. 4.3 Additional Considerations
  265.  
  266.    The ISSN standard and related community implementation guidelines
  267.    specify when new ISSNs should be assigned vs.  continuing to use an
  268.    existing one.  There are some publications where practice within the
  269.    bibliographic community varies from institution to institution, such
  270.    as annuals or annual conference proceedings.  In some cases these are
  271.    treated as serials and ISSNs are used, and in some cases they are
  272.    treated as monographs and ISBNs are used.  For example SIGMOD Record
  273.    volume 24 number 2 June 1995 contains the Proceedings of the 1995 ACM
  274.    SIGMOD International Conference on Management of Data.  If you
  275.    subscribe to the journal (ISSN 0163-5808) this is simply the June
  276.    issue.  On the other hand you may have acquired this volume as the
  277.    conference proceedings (a monograph) and as such would use the ISBN
  278.    0-89791-731-6 to identify the work.  There are also varying practices
  279.  
  280.  
  281.  
  282. Lynch, et. al.               Informational                      [Page 5]
  283.  
  284. RFC 2288                Bibligraphic Identifiers           February 1998
  285.  
  286.  
  287.    within the publishing community as to when new ISSNs are assigned due
  288.    to the change in the name of a periodical (e.g. Atlantic becomes
  289.    Atlantic Monthly); or when a periodical is published both in printed
  290.    and electronic versions (e.g. The New York Times).  The use of ISSNs
  291.    in URNs will reflect these judgments and practices.
  292.  
  293. 5. Serial Item and Contribution Identifiers
  294.  
  295. 5.1 Overview
  296.  
  297.    The standard for Serial Item and Contribution Identifiers (SICI)
  298.    codes, which has recently been extensively revised, is defined by
  299.    NISO/ANSI Z39.56-1997 [NISO2].  The maintenance agency for the SICI
  300.    code is the UnCover Corporation.
  301.  
  302.    SICI codes can be used to identify an issue of a serial, or a
  303.    specific contribution (e.g., an article, or the table of contents)
  304.    within an issue of a serial.  SICI codes are not assigned, they are
  305.    constructed based on information about the issue or issue component
  306.    in question.
  307.  
  308.    The complete syntax for the SICI code will not be discussed here; see
  309.    NISO/ANSI Z39.56-1997 [NISO2] for details.  However, an example and
  310.    brief review of the major components is needed to understand the
  311.    relationship with the ISSN and how this identifier differs from an
  312.    ISSN.  An example of a SICI code is: 0015-
  313.    6914(19960101)157:1<62:KTSW>2.0.TX;2-F
  314.  
  315.    The first nine characters are the ISSN identifying the serial title.
  316.    The second component, in parentheses, is the chronology information
  317.    giving the date the particular serial issue was published.  In this
  318.    example that date was January 1, 1996.  The third component, 157:1,
  319.    is enumeration information (volume, number) for the particular issue
  320.    of the serial.  These three components comprise the "item segment" of
  321.    a SICI code.  By augmenting the ISSN with the chronology and/or
  322.    enumeration information, specific issues of the serial can be
  323.    identified.  The next segment, <62:KTSW>, identifies a particular
  324.    contribution within the issue.  In this example we provide the
  325.    starting page number and a title code constructed from the initial
  326.    characters of the title.  Identifiers assigned to a contribution can
  327.    be used in the contribution segment if page numbers are
  328.    inappropriate.  The rest of the identifier is the control segment,
  329.    which includes a check character.  Interested readers are encouraged
  330.    to consult the standard for an explanation of the fields in that
  331.    segment.
  332.  
  333.  
  334.  
  335.  
  336.  
  337.  
  338. Lynch, et. al.               Informational                      [Page 6]
  339.  
  340. RFC 2288                Bibligraphic Identifiers           February 1998
  341.  
  342.  
  343. 5.2 Encoding Considerations and Lexical Equivalence
  344.  
  345.    The character set for SICIs is intended to be email-transport-
  346.    transparent, so it does not present major problems.  However, all
  347.    printable excluded and reserved characters from the URN syntax are
  348.    valid in the SICI character set and must be %-encoded.
  349.  
  350.    Example of a SICI for an issue of a journal:
  351.  
  352.               URN:SICI:1046-8188(199501)13:1%3C%3E1.0.TX;2-F
  353.  
  354.    For an article contained within that issue:
  355.  
  356.           URN:SICI:1046-8188(199501)13:1%3C69:FTTHBI%3E2.0.TX;2-4
  357.  
  358.    Equivalence rules for SICIs are not appropriate for definition as
  359.    part of the namespace and incorporation in areas such as cache
  360.    management algorithms.  It is best left to resolver systems which try
  361.    to determine if two SICIs refer to the same content.  Consequently,
  362.    we do not propose any specific rules for equivalence testing through
  363.    lexical manipulation.
  364.  
  365. 5.3 Additional Considerations
  366.  
  367.    Since the serial is identified by an ISSN, some of the ambiguity
  368.    currently found in the assignment of ISSNs carries over into SICI
  369.    codes.  In cases where an ISSN may refer to a serial that exists in
  370.    multiple formats, the SICI contains a qualifier that specifies the
  371.    format type (for example, print, microform, or electronic).  SICI
  372.    codes may be constructed from a variety of sources (the actual issue
  373.    of the  serial, a citation or a record from an abstracting service)
  374.    and, as such are based on the principle of using all available
  375.    information, so there may be multiple SICI codes representing the
  376.    same article [NISO2, Appendix D].  For example, one code might be
  377.    constructed with access to both chronology and enumeration (that is,
  378.    date of issue and volume, issue and page number), another code might
  379.    be constructed based only on enumeration information and without
  380.    benefit of chronology.  Systems that use SICI codes employ complex
  381.    matching algorithms to try to match SICI codes constructed from
  382.    incomplete information to SICI codes constructed with the benefit of
  383.    all relevant information.
  384.  
  385.  
  386.  
  387.  
  388.  
  389.  
  390.  
  391.  
  392.  
  393.  
  394. Lynch, et. al.               Informational                      [Page 7]
  395.  
  396. RFC 2288                Bibligraphic Identifiers           February 1998
  397.  
  398.  
  399. 6. Security Considerations
  400.  
  401.    This document proposes means of encoding several existing
  402.    bibliographic identifiers within the URN framework. This document
  403.    does not discuss resolution; thus questions of secure or
  404.    authenticated resolution mechanisms are out of scope.  It does not
  405.    address means of validating the integrity or authenticating the
  406.    source or provenance of URNs that contain bibliographic identifiers.
  407.    Issues regarding intellectual property rights associated with objects
  408.    identified by the various bibliographic identifiers are also beyond
  409.    the scope of this document, as are questions about rights to the
  410.    databases that might be used to construct resolvers.
  411.  
  412. 7. References
  413.  
  414.    [ISO1] NISO/ANSI/ISO 2108:1992 Information and documentation
  415.          -- International standard book number (ISBN)
  416.    [ISO2] ISO 3297:1986 Documentation -- International standard
  417.          serial numbering (ISSN)
  418.    [ISO3] ISO/DIS 3297 Information and documentation --
  419.          International standard serial numbering (ISSN) (Revision of ISO
  420.          3297:1986)
  421.    [Moats] Moats, R., "URN Syntax", RFC 2141, May 1997.
  422.    [NISO 1] NISO/ANSI Z39.9-1992 International standard serial
  423.          numbering (ISSN)
  424.    [NISO 2] NISO/ANSI Z39.56-1997 Serial Item and Contribution
  425.          Identifier
  426.    [Sollins & Masinter] Sollins, K., and L. Masinter, "Functional
  427.          Requirements for Uniform Resource Names", RFC 1737, December
  428.          1994.
  429.  
  430.  
  431.  
  432.  
  433.  
  434.  
  435.  
  436.  
  437.  
  438.  
  439.  
  440.  
  441.  
  442.  
  443.  
  444.  
  445.  
  446.  
  447.  
  448.  
  449.  
  450. Lynch, et. al.               Informational                      [Page 8]
  451.  
  452. RFC 2288                Bibligraphic Identifiers           February 1998
  453.  
  454.  
  455. 8. Authors' Addresses
  456.  
  457.    Clifford Lynch
  458.    Executive Director
  459.    Coalition for Networked Information
  460.    21 Dupont Circle
  461.    Washington, DC 20036
  462.  
  463.    EMail: cliff@cni.org
  464.  
  465.  
  466.    Cecilia Preston
  467.    Preston & Lynch
  468.    PO Box 8310
  469.    Emeryville, CA 94662
  470.  
  471.    EMail: cecilia@well.com
  472.  
  473.  
  474.    Ron Daniel Jr.
  475.    Advanced Computing Lab, MS B287
  476.    Los Alamos National Laboratory
  477.    Los Alamos, NM, 87545
  478.  
  479.    EMail: rdaniel@acl.lanl.gov
  480.  
  481.  
  482.  
  483.  
  484.  
  485.  
  486.  
  487.  
  488.  
  489.  
  490.  
  491.  
  492.  
  493.  
  494.  
  495.  
  496.  
  497.  
  498.  
  499.  
  500.  
  501.  
  502.  
  503.  
  504.  
  505.  
  506. Lynch, et. al.               Informational                      [Page 9]
  507.  
  508. RFC 2288                Bibligraphic Identifiers           February 1998
  509.  
  510.  
  511. 9.  Full Copyright Statement
  512.  
  513.    Copyright (C) The Internet Society (1998).  All Rights Reserved.
  514.  
  515.    This document and translations of it may be copied and furnished to
  516.    others, and derivative works that comment on or otherwise explain it
  517.    or assist in its implementation may be prepared, copied, published
  518.    and distributed, in whole or in part, without restriction of any
  519.    kind, provided that the above copyright notice and this paragraph are
  520.    included on all such copies and derivative works.  However, this
  521.    document itself may not be modified in any way, such as by removing
  522.    the copyright notice or references to the Internet Society or other
  523.    Internet organizations, except as needed for the purpose of
  524.    developing Internet standards in which case the procedures for
  525.    copyrights defined in the Internet Standards process must be
  526.    followed, or as required to translate it into languages other than
  527.    English.
  528.  
  529.    The limited permissions granted above are perpetual and will not be
  530.    revoked by the Internet Society or its successors or assigns.
  531.  
  532.    This document and the information contained herein is provided on an
  533.    "AS IS" basis and THE INTERNET SOCIETY AND THE INTERNET ENGINEERING
  534.    TASK FORCE DISCLAIMS ALL WARRANTIES, EXPRESS OR IMPLIED, INCLUDING
  535.    BUT NOT LIMITED TO ANY WARRANTY THAT THE USE OF THE INFORMATION
  536.    HEREIN WILL NOT INFRINGE ANY RIGHTS OR ANY IMPLIED WARRANTIES OF
  537.    MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE.
  538.  
  539.  
  540.  
  541.  
  542.  
  543.  
  544.  
  545.  
  546.  
  547.  
  548.  
  549.  
  550.  
  551.  
  552.  
  553.  
  554.  
  555.  
  556.  
  557.  
  558.  
  559.  
  560.  
  561.  
  562. Lynch, et. al.               Informational                     [Page 10]
  563.  
  564.