home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / isoc / pub / isoc_news / 1-3 / n-1-3-040.31.2b < prev    next >
Text File  |  1994-03-26  |  4KB  |  84 lines

  1.  
  2.  
  3. N-1-3-040.31.2, "Internet Uniform Resource Indentifiers", by Alan
  4. Emtage*, <bajan@bunyip.com>
  5.  
  6.  
  7. We in the Internet community are now seeing the cold, hard reality of
  8. what it means to have exponential growth and not one of Sacred Seven
  9. Layers has been spared in this attack.  One of the most obvious
  10. examples of this from the user's point of view, has been the explosion
  11. in Information Services.  From archie to Z39.50, users are being asked
  12. to navigate through hundreds of Gigabytes of data to try and find just
  13. that information for which they are searching.
  14.  
  15. In moving from an Internet world composed of weenies & wizards in the
  16. darkened offices to John Doe on Maple Street, a fundamental change
  17. occurs: suddenly we will have millions of "librarians" and
  18. "publishers" who won't be (and can't be expected to be) trained in the
  19. knowledge of those professionals.  Recently, much attention has been
  20. focussed in the Information Systems community on how to identify,
  21. locate and access the (potentially) millions of resources on the
  22. network.  Although there remains much work to be done, consensus seems
  23. to have been reached on the broad outlines of how such a system would
  24. work.  The idea in its most basic form is that the location and access
  25. component is separate (and external) from the identification (internal
  26. content) of any object.  Having done this, the following scheme has
  27. been developed.
  28.  
  29. Uniform Resource Locators (URLs) will specify a well-known format in
  30. which the various information services interoperate and exchange data
  31. about the location and access methods for a specific resource.  Thus
  32. WAIS and Prospero would be able to parse and understand references to
  33. the the same resource (document, service, etc.) regardless of in which
  34. system the information is embedded and the internal content of that
  35. information.
  36.  
  37. Uniform Resource Serial Numbers (URSNs) on the other hand will be
  38. concerned with the identifying the actual data itself.  There is
  39. currently no way to know if two resources with the same name (e.g.,
  40. documents with the same filename) actually contain the same
  41. information.  Conversely, two documents with the different names may
  42. contain the same information, but in a different format (for example,
  43. ASCII or PostScript).  Ideally we would also like to know how two
  44. objects may be related.  Is one derived from the other?  Is it the
  45. same document with spelling errors corrected?  Is there a way of
  46. uniquely "signing" the object?
  47.  
  48. Finally, Uniform Resource Identifiers (URIs) are comprised of the
  49. union of URLs and URSNs and would uniquely specify any resource on the
  50. network.  Work is now beginning in the Internet Engineering Task Force
  51. (IETF) to describe and define the problem and to try to work out
  52. potential solutions.  A draft document describing the architecture of
  53. the URL system as discussed at the last IETF meeting is currently
  54. being written by Tim-Berners Lee of CERN (timbl@nxoc01.cern.ch) and is
  55. due out in the next few months.  The URSN is an inherently more
  56. complex problem and it is expected that there will be much wailing an
  57. gnashing of teeth before the final form of this is known.
  58.  
  59. In many respects we are re-inventing and reworking much of Library
  60. Sciences in the Internet environment, with one significant difference:
  61. scale.  Although "The Library" deals with amounts of information
  62. several orders of magnitude over what is currently available on the
  63. Internet, they effectively have centralized control over how books are
  64. classified and numbered (e.g., the ISBN designation).  On the
  65. Internet, such tight centralized control would soon become a
  66. bottleneck in the system, and in addition, information cannot always
  67. be easily defined in terms of books, films or tapes (a running process
  68. for example).  Perhaps the decentralized allocation methods of the
  69. Domain Name System could be adapted to the purpose.  Again however,
  70. the problem is that while there may be 10 million machines on the
  71. network 3 years from now, there may be 100 million users and 1 billion
  72. objects; a difference of two orders of magnitude.  A tall order for
  73. any system.  This work has the potential to have a tremendous impact
  74. on how we use the Internet in years to come.  Who knows how it will
  75. turn out?  In any case, there'll be a lot of fun in just getting
  76. there.
  77.  
  78.  
  79. *VP Research & Development for Bunyip Information Services
  80.  
  81.  
  82.  
  83.  
  84.