home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / isoc / pub / isoc_news / 1-4 / n-1-4-040.31.1a < prev    next >
Text File  |  1994-03-26  |  7KB  |  130 lines

  1. Subject: N-1-4--040.31.1
  2.  
  3. Which White Pages Service is Appropriate for My Site?
  4. Michael F. Schwartz, University of Colorado - Boulder
  5. <schwartz@latour.cs.colorado.edu>
  6.  
  7. A problem of increasing concern in the Internet is locating address,
  8. telephone, and electronic mailbox information about network users.  In
  9. this article, I compare several systems that provide this "white pages"
  10. service. I do not consider systems for non-Internet sites, personal
  11. "rolodex" systems, or efforts to coordinate/administer directory service
  12. activities.
  13.  
  14. A simple solution is provided by the WHOIS service, which supports a
  15. centralized database of registered information.  Originally, WHOIS was
  16. run by a single ARPANET Network Information Center (NIC).  Because of
  17. the increasing scale and decentralization of the Internet, there are now
  18. many NICs as well as individual sites running WHOIS servers.
  19.  
  20. Another popular centralized service is CSO (also known as PH, 411, and da)
  21. CSO servers often respond to search requests at the
  22. finger port on machines aliased to the name of a domain.
  23. For example, by fingering "schwartz@colorado.edu", you can locate
  24. information about all users named "schwartz" at University of Colorado.
  25.  
  26. NICs typically populate their directory services with data from
  27. registration requests, such as templates filled out by users.  In
  28. contrast, individual sites typically populate their databases en masse
  29. from primary registration sources, such as a university student
  30. enrollment database.  En masse registrations usually contain more
  31. complete and timely data, but the method raises issues such as
  32. privacy and update control.
  33.  
  34. Neither WHOIS nor CSO supports distributed operation.  In particular,
  35. neither service coordinates format or content across servers, and neither
  36. supports caching or replication.  In contrast, the CCITT and ISO jointly
  37. developed a distributed directory service standard called X.500, which
  38. describes a hierarchical name space with provisions for caching,
  39. authentication, and replication.  Other features of
  40. X.500 are typed, self-describing fields, allowing users to make sophisticated
  41. queries using X.500, and a database that can support complex information
  42. such as bitmap photos of users.
  43.  
  44. While X.500 offers many advantages, problems in the current implementations
  45. have kept X.500 servers from being deployed at more than a few hundred
  46. sites worldwide.  This lack of "reach" has further eroded sites' interest
  47. in installing X.500 software.  The principal problems with the current
  48. implementations are availability, and the level of machine and human
  49. administrative resources required to run a server.  A number of efforts are
  50. under way to improve these problems.  In time, I believe X.500 will become
  51. significantly better and more popular.
  52.  
  53. Netfind provides white pages service by using a number of existing sources
  54. of information.  Because of the nature of
  55. these information sources and the way Netfind cross correlates the
  56. information, Netfind can locate users at over 5,000 sites world wide.
  57. Moreover, because it searches for users on their home workstations, Netfind
  58. can often locate more timely information than the other services
  59. discussed here (which depend on registration databases).  A downside of
  60. this approach is that searches generate more network traffic than the
  61. other services.  However, this traffic is small compared to other
  62. Internet applications, such as remote login, mail/news, and file
  63. transfer.  A second disadvantage of Netfind is that it can only locate
  64. people at directly connected Internet sites (which excludes sites that
  65. insulate their internal networks using "firewall" gateways).
  66.  
  67. The Wide Area Information Servers (WAIS) system
  68. allows users to deploy, search, and retrieve many different types of
  69. information from machines distributed throughout the Internet.  As such,
  70. one use for WAIS can be as a directory service.  Because WAIS documents
  71. are indexed by keyword, the system supports fairly searches, but not as
  72. flexible, as a search system that allows regular expressions.  A downside
  73. is that the indices require approximately as much space as the data being
  74. indexed.
  75.  
  76. As the number of different directory services available in the Internet has
  77. increased, several systems have been developed to provide a uniform user
  78. interface to the information.  The Knowbot(TM) Information Service (KIS)
  79. provides a consistent, structured input/output format for
  80. accessing multiple user directory services.  The Internet Gopher system
  81. provides a less consistent menu-oriented interface, but
  82. provides access to many more information sources (including user
  83. directories and other types of information).
  84.  
  85. Gopher requires the user to
  86. select an individual information source before searching.  In contrast, KIS
  87. sequentially requests information from each of the services it knows about,
  88. and allows users to restrict a search to a subset of the sources.  Human
  89. nature being what it is, most users do not restrict searches.  This
  90. increases search delays and network costs, and in some cases provides users
  91. with a large amount of irrelevant data.  At present, Gopher supports access
  92. to 28 CSO servers, 90 WHOIS servers, Netfind, a WAIS database of USENET
  93. user electronic mailboxes, and X.500.  KIS supports access to 6 campus
  94. directory systems, the DISA NIC's WHOIS service, X.500, and an MCI Mail
  95. directory service.
  96.  
  97. What system should a site choose?  Unfortunately, there is no single,
  98. ideal solution.  X.500 supports the
  99. most sophisticated functionality, but its current implementations have
  100. availability problems and high resource demands, and there are not enough
  101. sites running servers to provide a useful amount of data.  Netfind provides
  102. the largest collection of Internet reachable user data, but supports only
  103. limited data types, and can only locate people at directly connected
  104. Internet sites.
  105.  
  106. Neither Netfind nor X.500 support searches without specifying something
  107. about where the person being sought works.  WHOIS, CSO, and WAIS can
  108. support such searches, but provide no explicit support for data distribution.
  109. These problems can be remedied to a certain extent by registering with a
  110. centralized server (e.g., the WHOIS server for a national network), but this
  111. approach does not scale well.
  112.  
  113. In the longer term, efforts by cooperative organizations, governments,
  114. or commercial service providers will probably improve Internet directory
  115. service offerings.  In the mean time, sites will probably need to choose
  116. a combination of systems to support the needs of their users.
  117.  
  118. For Further Information
  119.  
  120. The DISA NIC's WHOIS service can be accessed by telnet to nic.ddn.mil, by
  121. logging in as "nic".  An ad hoc list of whois servers is available by
  122. anonymous FTP from sipb.mit.edu, in /pub/whois/whois-servers.list.  The CSO
  123. software is available by anonymous FTP from ux1.cso.uiuc.edu, in
  124. pub/qi.tar.Z.  The QUIPU software is available by anonymous FTP from
  125. ftp.psi.com, in wp/.  Netfind can be accessed by telnet to
  126. bruno.cs.colorado.edu, and logging in as "netfind" (the software is also
  127. available).  WAIS is available by anonymous FTP from think.com, in wais/.
  128. KIS can be accessed by doing "telnet nri.reston.va.us 186".  Gopher can be
  129. accessed by telnet to consultant.micro.umn.edu, and logging in as "gopher".
  130.