home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / find / find-minutes-96jun.txt < prev    next >
Text File  |  1996-10-07  |  4KB  |  95 lines

  1. Editor's note:  These minutes have not been edited.
  2.  
  3.  
  4. 0. Agenda review/changes
  5.  
  6. The proposed agenda was accepted without changes. 
  7.  
  8. 1. Why two parallell CIP drafts ?
  9.  
  10. Patrick explained that he and Roland shared the view that Chris 
  11. Weider's draft didn't reflect the consensus of the group reached at the 
  12. LA meeting and also had too much whois++ stuff in there. Therefore a 
  13. second draft was produced by by Jeff Allen and Patrik Faltstrom. The 
  14. intended outcome of this is that these two drafts will be merged into 
  15. one. 
  16.  
  17. 2. Charter of the find group
  18.  
  19. There where some discussion about which papers were going to be 
  20. produced. The consensus was that there should be one document 
  21. specifying the CIP, another one specifying how to use centroids as one 
  22. special case of indexes within the CIP and further for each client - 
  23. server protocol that is goint to use the CIP one paper describing the 
  24. mapping between the data representations and one describing the access 
  25. method. 
  26.  
  27. 3. LDAP/CIP work at Umea University
  28.  
  29. Roland Hedberg presented the work he has been doing to enable a X.500 
  30. DSA to work as an index server and he also presented a WWW-
  31. interface that can use this index server.
  32. The WWW-interface can be reached at
  33. http://macavity.umdc.umu.se/~roland/query2.en.html and the 
  34. indexserver it accesses contains all the information presently accessable 
  35. in the Swedish branch of the X.500 DIT (~50.000 entries). For the time 
  36. being the index only contains names of people. Roland will produce a 
  37. draft describing the objectclass and attributes needed to ackomplish 
  38. this .
  39.  
  40. 4. The new CIP draft
  41.  
  42. Jeff Allen presented the gist of the new draft. The discussion following 
  43. the presentation led up to a couple of unresolved items: 
  44.  
  45. The use of MIME - should/can INDEX-CHANGED be structured as a 
  46. MIME message Aggregation ala CIDR - facilitate query routing. 
  47. Incremental updates - per application domain or general. Security - 
  48. both regarding exporting indexes and data protection. Centroid scaling 
  49. issues - certain datasets only contain unique items which means that 
  50. the resulting index is no smaller than the original dataset. Frontends to 
  51. indexservers might only speak one access protocol - clients speaking 
  52. another access protocol can not pass this server, while climbing the tree 
  53. upwards or downwards, which means that parts of the mesh might be 
  54. unaccessable to the client.
  55.  
  56. 5. Workshop of Distributed Indexing and Searching 
  57.  
  58. Erik Selberg presented some ideas on using query routing within the 
  59. Web indexing sphere which came out of the workshop . It was felt that 
  60. introducing query routing and distributed index servers is a necessary 
  61. step in the development of the Web indexes since the current centric 
  62. approach doesn't scale. More info on the workshop can be found at 
  63. http://www.w3.org/pub/WWW/Search/9605-Indexing-Workshop/ 
  64.  
  65. It was agreed that followup work undertaken by the query routing 
  66. contingent from the Distributed Indexing/Searching Workshop would 
  67. be folded into the FIND working group.
  68.  
  69. 6. The CIP and CCSO
  70.  
  71. Martin Hamilton presented his work on integrating CCSO nameservers 
  72. with the CIP. His conclusion was that it was viable but that there 
  73. remained some items that have to be resolved. There is no standard 
  74. URL format for a CIP referral to a CCSO nameserver. For the time being 
  75. Martin proposed that one could use the gopher one 
  76. (gopher://ccso.server.domain.name:105/2). 
  77.  
  78. Another question is whether the CCSO should the CCSO attribute 
  79. names and types be normalized to a common schema. 
  80.  
  81. 7. Scaling of the CIP
  82.  
  83. Patrik presented some graphs showing the relationship between the 
  84. size of a centroid and the size of the actual datasets both when looking 
  85. a people informations from the phonebook and large document 
  86. collections. Phonebook information revealed the not very astonishing 
  87. fact that phonenumbers are unique which means that the centroid 
  88. increased almost linearly with the growth of the dataset. Removing 
  89. phonenumbers from the centroid gave a much slower growth and it also 
  90. appeared to be asymptotic. When indexing words out of documents the 
  91. curve didn't seem to level off when the dataset grew ( max dataset size 
  92. ~12.000.000 tokens). When applying a stop list weeding out very 
  93. frequent words and very unusual words the curve became asymptotoic, 
  94. reaching 60.000 and levelling off to be leveling of at that value.
  95.