home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / drafts / draft_ietf_u_z / draft-ietf-urn-biblio-02.txt < prev    next >
Text File  |  1997-09-26  |  19KB  |  508 lines

  1.  
  2.  
  3. Internet Draft                                 Clifford Lynch
  4. September 8. 1997         Coalition for Networked Information
  5. draft-ietf-urn-biblio-02.txt                  Cecilia Preston
  6.                                               Preston & Lynch
  7.                                                Ron Daniel Jr.
  8.                                Los Alamos National Laboratory
  9.  
  10.  
  11.           Using Existing Bibliographic Identifiers
  12.                              as
  13.                    Uniform Resource Names
  14.  
  15.  
  16. Status of this Document
  17.  
  18. This document is an Internet-Draft.  Internet-Drafts are
  19. working documents of the Internet Engineering Task Force
  20. (IETF), its areas, and its working groups.  Note that other
  21. groups may also distribute working documents as Internet-
  22. Drafts.
  23.  
  24. Internet-Drafts are draft documents valid for a maximum of
  25. six months and may be updated, replaced or made obsolete by
  26. other documents at any time.  It is inappropriate to use
  27. Internet-Drafts as reference material or to cite them other
  28. than as works in progress.
  29.  
  30. Distribution of this document is unlimited.
  31.  
  32. This document does not specify a standard; it is purely
  33. informational.
  34.  
  35.  
  36. 0. Abstract
  37.  
  38. A system for Uniform Resource Names (URNs) must be capable
  39. of supporting identifiers from existing widely-used naming
  40. systems.  This document discusses how three major
  41. bibliographic identifiers (the ISBN, ISSN and SICI) can be
  42. supported within the URN framework and the currently
  43. proposed syntax for URNs.
  44.  
  45.                                                      [Page 1]
  46.  
  47. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  48.  
  49.  
  50. 1. Introduction
  51.  
  52. The ongoing work of several IETF working groups, most
  53. recently in the Uniform Resource Names working group, has
  54. culminated the development of a syntax for Uniform Resource
  55. Names (URNs).   The functional requirements and overall
  56. framework for Uniform Resource Names are specified in RFC
  57. 1737 [Sollins & Masinter] and the specification for the
  58. URN syntax is RFC 2141 [Moats].
  59.  
  60. As part of the validation process for the development of
  61. URNs the IETF working group has agreed that it is important
  62. to demonstrate that the current URN syntax proposal can
  63. accommodate existing identifiers from well established
  64. namespaces.  One such infrastructure for assigning and
  65. managing names comes from the bibliographic community.
  66. Bibliographic identifiers function as names for objects that
  67. exist both in print and, increasingly, in electronic formats.
  68. This Internet draft demonstrates the feasibility of
  69. supporting three representative bibliographic identifiers
  70. within the currently proposed URN framework and syntax.
  71.  
  72. Note that this document does not purport to define the
  73. "official" standard way of moving these bibliographic
  74. identifiers into URNs; it merely demonstrates feasibility.
  75. It has not been developed in consultation with these
  76. standards bodies and maintenance agencies that oversee the
  77. existing bibliographic identifiers.  Any actual Internet
  78. standard for encoding these bibliographic identifiers as
  79. URNs will need to be developed in consultation with the
  80. responsible standards bodies and maintenance agencies.
  81.  
  82. In addition, there are several open questions with regard to
  83. the management and registry of Namespace Identifiers (NIDs)
  84. for URNs.  For purposes of illustration, we have used the
  85. three NIDs "ISBN", "ISSN" and "SICI" for the three
  86. corresponding bibliographic identifiers discussed in this
  87. document.  While we believe this to be the most appropriate
  88. choice, it is not the only one.  The NIDs could be based on
  89.  
  90.  
  91.                                                      [Page 2]
  92.  
  93. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  94.  
  95.  
  96. the standards body and standard number (e.g. "US-ANSI-NISO-
  97. Z39.56-1997" rather than "SICI").  Alternatively, one could
  98. lump all bibliographic identifiers into a single
  99. "BIBLIOGRAPHIC" name space, and structure the namespace-
  100. specific string to specify which identifier is being used.
  101. Any final resolution of this must wait for the outcome of
  102. namespace management discussions in the working group and
  103. the broader IETF community.
  104.  
  105. For the purposes of this document, we have selected three
  106. major bibliographic identifiers (national and international)
  107. to fit within the URN framework.  These are the International
  108. Standard Book Number (ISBN) [ISO1], the International
  109. Standard Serials Number (ISSN) [NISO1,ISO2, ISO3], and the
  110. Serial Item and Contribution Identifier (SICI) [NISO2].  An
  111. ISBN is used to identify a monograph (book).  An ISSN is used
  112. to identify serial publications (journals, newspapers) as a
  113. whole.   A SICI augments the ISSN in order to identify
  114. individual issues of serial publications, or components
  115. within those issues (such as an individual article, or the
  116. table of contents of a given issue).  The ISBN and ISSN are
  117. defined in the United States by standards issued by the
  118. National Information Standards Organization (NISO) and also
  119. by parallel international standards issued under the auspices
  120. of the International Organization for Standardization (ISO).
  121. NISO is the ANSI-accredited standards body serving libraries,
  122. publishers and information services.  The SICI code is
  123. defined by a NISO document in the United States and does not
  124. have a parallel international standards document at present.
  125.  
  126. Many other bibliographic identifiers are in common use (for
  127. example, CODEN, numbers assigned by major bibliographic
  128. utilities such as OCLC and RLG, national library numbers such
  129. as the Library of Congress Control Number) or are under
  130. development.  While we do not discuss them in this document,
  131. many of these will also need to be supported within the URN
  132. framework as it moves to large scale implementation.  The
  133. issues involved in supporting those additional identifiers
  134. are anticipated to be broadly similar to those involved in
  135. supporting ISBNs, ISSNs, and SICIs.
  136.  
  137.                                                      [Page 3]
  138.  
  139. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  140.  
  141.  
  142. 2. Identification vs. Resolution
  143.  
  144. It is important to distinguish between the resource
  145. identified by a URN and the resources a URN resolver that can
  146. reasonably return when attempting to resolve an identifier.
  147. For example, the ISSN 0040-781X identifies the popular
  148. magazine "Time" -- all of it, every issue for from the start
  149. of publication to present.  Resolving such an identifier
  150. should not result in the equivalent of hundreds of thousands
  151. of pages of text and photos being dumped to the user's
  152. machine.  It is more reasonable for ISSNs to resolve to a
  153. navigational system, such as an HTML-based search form, so
  154. the user may select issues or articles of interest.  ISBNs
  155. and SICIs, on the other hand, do identify finite, manageably-
  156. sized objects, but these objects may still be large enough
  157. that resolution to a hierarchical system is appropriate.
  158.  
  159. In addition, the materials identified by an ISSN, ISBN or
  160. SICI may exist only in printed or other physical form, not
  161. electronically.  The best that a resolver may be able to
  162. offer is information about where to get the physical
  163. resource, such as library holdings or a bookstore or
  164. publisher order form.  The URN Framework provides resolution
  165. services that may be used to describe any differences
  166. between the resource identified by a URN and the resource
  167. that would be returned as a result of resolving that URN.
  168.  
  169.  
  170. 3. International Standard Book Numbers
  171.  
  172. 3.1 Overview
  173.  
  174. An International Standard Book Number (ISBN) identifies an
  175. edition of a monographic work.  The ISBN is defined by the
  176. standard NISO/ANSI/ISO 2108:1992 [ISO1]
  177.  
  178. Basically, an ISBN is a ten-digit number (actually, the last
  179. digit can be the letter "X" as well, as described below)
  180. which is divided into four variable length parts usually
  181.  
  182.  
  183.                                                      [Page 4]
  184.  
  185. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  186.  
  187.  
  188. separated by hyphens when printed.  The parts are as follows
  189. (in this order):
  190.  
  191. * a group identifier which specifies a group of publishers,
  192. based on national, geographic or some other criteria,
  193.  
  194. * the publisher identifier,
  195.  
  196. * the title identifier,
  197.  
  198. * and a modulus 11 check digit, using X instead of 10.
  199.  
  200. The group and publisher number assignments are managed in
  201. such a way that the hyphens are not needed to parse the ISBN
  202. unambiguously into its constituent parts.  However, the ISBN
  203. is normally transmitted and displayed with hyphens to make
  204. it easy for human beings to recognize these parts without
  205. having to make reference to or have knowledge of the number
  206. assignments for group and publisher identifiers.
  207.  
  208. 3.2 Encoding Considerations and Lexical Equivalence
  209.  
  210. Embedding ISBNs within the URN framework presents no
  211. particular encoding problems, since all of the characters
  212. that can appear in an ISBN are valid in the identifier
  213. segment of the URN.  %-encoding, as described in [MOATS] is
  214. never needed.
  215.  
  216. Example: URN:ISBN:0-395-36341-1
  217.  
  218. For the ISBN namespace, some additional equivalence rules
  219. are appropriate.  Prior to comparing two ISBN URNs for
  220. equivalence, it is appropriate to remove all hyphens, and to
  221. convert any occurrences of the letter X to upper case.
  222.  
  223. 3.3 Additional considerations
  224.  
  225. The ISBN standard and related community implementation
  226. guidelines define when different versions of a work should
  227. be assigned the same or differing ISBNs.  In actuality,
  228.  
  229.                                                      [Page 5]
  230.  
  231. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  232.  
  233.  
  234. however, practice varies somewhat depending on publisher as
  235. to whether different ISBNs are assigned for paperbound vs.
  236. hardbound versions of the same work, electronic vs. printed
  237. versions of the same work, or versions of the same work
  238. distinguished in some other way (e.g., published for example
  239. in the US and in Europe).  The choice of whether to assign a
  240. new ISBN or to reuse an existing one when publishing a
  241. revised printing of an existing edition of a work or even a
  242. revised edition of a work is somewhat subjective.  Practice
  243. varies from publisher to publisher (indeed, the distinction
  244. between a revised printing and a new edition is itself
  245. somewhat subjective).  The use of ISBNs within the URN
  246. framework simply reflects these existing practices.  Note
  247. that it is likely that an ISBN URN will often resolve to many
  248. instances of the work (many URLs).
  249.  
  250. 4. International Standard Serials Numbers
  251.  
  252. 4.1 Overview
  253.  
  254. International Standard Serials Numbers (ISSN) identify a
  255. work that is published on a continued basis in issues; they
  256. identify the entire (often open-ended, in the case of an
  257. actively published) work.  ISSNs are defined by the
  258. international standards ISO 3297:1986 [ISO2] and ISO/DIS
  259. 3297 [ISO3] and within the United States by NISO Z39.9-1992
  260. [NISO1].  The ISSN International Centre is located in Paris and coordinates
  261. a network of regional centers.  The National
  262. Serials Data Program within the Library of Congress is the US
  263. Center of this network.
  264.  
  265. ISSNs have the form NNNN-NNNN where N is a digit, the last
  266. digit may be an upper case X as the result of the check
  267. character calculation.  Unlike the ISBN the ISSN components
  268. do not have much structure; blocks of numbers are passed out
  269. to the regional centers and publishers.
  270.  
  271.  
  272.  
  273.  
  274.                                                      [Page 6]
  275.  
  276.  
  277. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  278.  
  279.  
  280. 4.2 Encoding Considerations and Lexical Equivalence
  281.  
  282. Again, there is no problem representing ISSNs in the
  283. namespace-specific string of URNs since all characters valid
  284. in the ISSN are valid in the namespace-specific URN string,
  285. and %-encoding is never required.
  286.  
  287. Example: URN:ISSN:1046-8188
  288.  
  289. Supplementary comparison rules are also appropriate for the
  290. ISSN namespace.  Just as for ISBNs, hyphens should be
  291. dropped prior to comparison and occurrences of 'x'
  292. normalized to uppercase.
  293.  
  294. 4.3 Additional Considerations
  295.  
  296. The ISSN standard and related community implementation
  297. guidelines specify when new ISSNs should be assigned vs.
  298. continuing to use an existing one.  There are some
  299. publications where practice within the bibliographic
  300. community varies from institution to institution, such as
  301. annuals or annual conference proceedings.  In some cases
  302. these are treated as serials and ISSNs are used, and in some
  303. cases they are treated as monographs and ISBNs are used.  For
  304. example SIGMOD Record volume 24 number 2 June 1995 contains
  305. the Proceedings of the 1995 ACM SIGMOD International
  306. Conference on Management of Data.  If you subscribe to the
  307. journal (ISSN 0163-5808) this is simply the June issue.  On
  308. the other hand you may have acquired this volume as the
  309. conference proceedings (a monograph) and as such would use
  310. the ISBN 0-89791-731-6 to identify the work.  There are also
  311. varying practices within the publishing community as to when
  312. new ISSNs are assigned due to the change in the name of a
  313. periodical (e.g. Atlantic becomes Atlantic Monthly); or when
  314. a periodical is published both in printed and electronic
  315. versions (e.g. The New York Times).  The use of ISSNs in URNs
  316. will reflect these judgments and practices.
  317.  
  318.  
  319.  
  320.                                                      [Page 7]
  321.  
  322.  
  323. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  324.  
  325.  
  326. 5. Serial Item and Contribution Identifiers
  327.  
  328. 5.1 Overview
  329.  
  330. The standard for Serial Item and Contribution Identifiers
  331. (SICI) codes, which has recently been extensively revised,
  332. is defined by NISO/ANSI Z39.56-1997 [NISO2].  The maintenance
  333. agency for the SICI code is the UnCover Corporation.
  334.  
  335. SICI codes can be used to identify an issue of a serial, or
  336. a specific contribution (e.g., an article, or the table of
  337. contents) within an issue of a serial.  SICI codes are not
  338. assigned, they are constructed based on information about
  339. the issue or issue component in question.
  340.  
  341. The complete syntax for the SICI code will not be discussed
  342. here; see NISO/ANSI Z39.56-1997 [NISO2] for details.
  343. However, an example and brief review of the major components
  344. is needed to understand the relationship with the ISSN and
  345. how this identifier differs from an ISSN.  An example of a
  346. SICI code is: 0015-6914(19960101)157:1<62:KTSW>2.0.TX;2-F
  347.  
  348. The first nine characters are the ISSN identifying the
  349. serial title.  The second component, in parentheses, is the
  350. chronology information giving the date the particular serial
  351. issue was published.  In this example that date was January
  352. 1, 1996.  The third component, 157:1, is enumeration
  353. information (volume, number) for the particular issue of the
  354. serial.  These three components comprise the "item segment"
  355. of a SICI code.  By augmenting the ISSN with the chronology
  356. and/or enumeration information, specific issues of the
  357. serial can be identified.  The next segment, <62:KTSW>,
  358. identifies a particular contribution within the issue.  In
  359. this example we provide the starting page number and a title
  360. code constructed from the initial characters of the title.
  361. Identifiers assigned to a contribution can be used in the
  362. contribution segment if page numbers are inappropriate.  The
  363. rest of the identifier is the control segment, which
  364. includes a check character.  Interested readers are
  365. encouraged to consult the standard for an explanation of the
  366. fields in that segment.
  367.  
  368.                                                      [Page 8]
  369.  
  370. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  371.  
  372.  
  373. 5.2 Encoding Considerations and Lexical Equivalence
  374.  
  375. The character set for SICIs is intended to be email-
  376. transport-transparent, so it does not present major problems.
  377. However, all printable excluded and reserved characters from
  378. the URN syntax are valid in the SICI character set and must
  379. be %-encoded.
  380.  
  381. Example of a SICI for an issue of a journal:
  382.  
  383.      URN:SICI:1046-8188(199501)13:1%3C%3E1.0.TX;2-F
  384.  
  385. For an article contained within that issue:
  386.  
  387.      URN:SICI:1046-8188(199501)13:1%3C69:FTTHBI%3E2.0.TX;2-4
  388.  
  389. Equivalence rules for SICIs are not appropriate for
  390. definition as part of the namespace and incorporation in
  391. areas such as cache management algorithms.  It is best left
  392. to resolver systems which try to determine if two SICIs refer
  393. to the same content.  Consequently, we do not propose any
  394. specific rules for equivalence testing through lexical manipulation.
  395.  
  396. 5.3 Additional Considerations
  397.  
  398. Since the serial is identified by an ISSN, some of the
  399. ambiguity currently found in the assignment of ISSNs carries
  400. over into SICI codes.  In cases where an ISSN may refer to a
  401. serial that exists in multiple formats, the SICI contains a
  402. qualifier that specifies the format type (for example,
  403. print, microform, or electronic).  SICI codes may be
  404. constructed from a variety of sources (the actual issue of
  405. the  serial, a citation or a record from an abstracting
  406. service) and, as such are based on the principle of using
  407. all available information, so there may be multiple SICI
  408. codes representing the same article [NISO2, Appendix D].
  409. For example, one code might be constructed with access to
  410. both chronology and enumeration (that is, date of issue and
  411. volume, issue and page number), another code might be
  412.  
  413.                                                      [Page 9]
  414.  
  415. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  416.  
  417.  
  418. constructed based only on enumeration information and
  419. without benefit of chronology.  Systems that use SICI codes
  420. employ complex matching algorithms to try to match SICI
  421. codes constructed from incomplete information to SICI codes
  422. constructed with the benefit of all relevant information.
  423.  
  424. 6. Security Considerations
  425.  
  426. This document proposes means of encoding several existing
  427. bibliographic identifiers within the URN framework. This
  428. document does not discuss resolution; thus questions of
  429. secure or authenticated resolution mechanisms are out of
  430. scope.  It does not address means of validating the integrity
  431. or authenticating the source or provenance of URNs that
  432. contain bibliographic identifiers.  Issues regarding
  433. intellectual property rights associated with objects
  434. identified by the various bibliographic identifiers are also
  435. beyond the scope of this document, as are questions about
  436. rights to the databases that might be used to construct
  437. resolvers.
  438.  
  439. 7. References
  440.  
  441. [ISO1] NISO/ANSI/ISO 2108:1992 Information and documentation
  442.       -- International standard book number (ISBN)
  443. [ISO2] ISO 3297:1986 Documentation -- International standard
  444.       serial numbering (ISSN)
  445. [ISO3] ISO/DIS 3297 Information and documentation --
  446.       International standard serial numbering (ISSN)
  447.       (Revision of ISO 3297:1986)
  448. [Moats] R. Moats, URN Syntax RFC 2141 May 1997.
  449. [NISO 1] NISO/ANSI Z39.9-1992 International standard serial
  450.       numbering (ISSN)
  451. [NISO 2] NISO/ANSI Z39.56-1997 Serial Item and Contribution
  452.       Identifier
  453. [Sollins & Masinter] K. Sollins and L. Masinter, "Functional
  454.        Requirements for Uniform Resource Names", RFC 1737
  455.        December 1994.
  456.  
  457.  
  458.                                                     [Page 10]
  459.  
  460. INTERNET DRAFT: Bibliographic Identifiers as URNs      9/1997
  461.  
  462.  
  463. 8. Author's Addresses
  464.  
  465. Clifford Lynch
  466. Executive Director
  467. Coalition for Networked Information
  468. 21 Dupont Circle
  469. Washington, DC 20036
  470. cliff@cni.org
  471.  
  472. Cecilia Preston
  473. Preston & Lynch
  474. PO Box 8310
  475. Emeryville, CA 94662
  476. cecilia@well.com
  477.  
  478. Ron Daniel Jr.
  479. Advanced Computing Lab, MS B287
  480. Los Alamos National Laboratory
  481. Los Alamos, NM, 87545
  482. rdaniel@acl.lanl.gov
  483.  
  484.  
  485.  
  486.  
  487.  
  488.  
  489.  
  490.  
  491.  
  492.  
  493.  
  494.  
  495.  
  496.  
  497.  
  498.  
  499.  
  500.  
  501.  
  502.  
  503.  
  504.                                                     [Page 11]
  505.  
  506.  
  507.  
  508.