home *** CD-ROM | disk | FTP | other *** search
/ High Voltage Shareware / high1.zip / high1 / DIR2 / CBUFF09.ZIP / DOX.ZIP / NOTES < prev    next >
Text File  |  1993-11-16  |  6KB  |  219 lines

  1.                Release Notes CBUFF 0.9.0
  2.         Anjo Anjewierden (anjo@swi.psy.uva.nl)
  3.                    November 15, 1993
  4.  
  5. Below are the release notes for CBUFF 0.9.  I will have little time
  6. available until the end of the year to develop CBUFF further.  Most of the
  7. utilities have already existed for quite a while and I therefore suggest
  8. that they have entered the status of an "alpha-release".
  9.  
  10. The utilities have been tested extensively under Unix (compiled with GCC
  11. 2.4.5).  I leave the testing on other platforms to you.  I'm also looking
  12. for those who can compile CBUFF on Amiga, Macintosh and MS-DOS (other than
  13. Borland C++).  The public distribution will contain binaries for the Atari
  14. ST.
  15.  
  16. The documentation is nearly complete.
  17.  
  18. New utility:
  19. ============
  20.  
  21. There is a new utility: "cunames".  This utility prints a frequency count
  22. of the players and the source of the games in a database.  The intention of
  23. "cunames" is to spot incorrect player and source names.
  24.  
  25. At the moment "cunames" can generate the following information:
  26.  
  27. -names file
  28.     Names of the players (Black and White).
  29. -place file
  30.         Place where the game was played.
  31. -players file
  32.     Entire players field.
  33. -source file
  34.     Entire source field.
  35.  
  36. The top-10 of applying "cunames" to a large database results in:
  37.  
  38. cunames -names
  39.  
  40. 2466  Tal,M
  41. 1258  Timman,J
  42. 1030  Karpov,An
  43.  824  Kasparov,G
  44.  802  Korchnoi,V
  45.  722  Nunn,J
  46.  684  Portisch,L
  47.  672  Uhlmann,W
  48.  664  Hort,V
  49.  634  Spassky,B
  50.  
  51. cunames -place
  52.  
  53. 5794  corr
  54. 4009  cr
  55. 3718  Moskva
  56. 3718  Budapest
  57. 3558  Bratislava
  58. 3446  BRD tt
  59. 3378  New York
  60. 3341  London
  61. 2903  Duisburg
  62. 2664  Manila
  63.  
  64. cunames -players
  65.  
  66.   74  Kasparov,G-Karpov,An
  67.   74  Karpov,An-Kasparov,G
  68.   42  Neumann,G-Anderssen,A
  69.   42  De la Bourdonnais,Louis-MacDonnell,Alexander
  70.   41  MacDonnell,Alexander-De la Bourdonnais,Louis
  71.   34  Anderssen,A-Neumann,G
  72.   33  Karpov,An-Timman,J
  73.   28  Karpov,An-Korchnoi,V
  74.   27  Timman,J-Karpov,An
  75.   27  Short,N-Timman,J
  76.  
  77. cunames -source
  78.  
  79. 2667  cr
  80. 1302  BRD tt
  81. 1124  Sverige
  82.  781  USSR
  83.  668  London
  84.  659  Hastings
  85.  653  Moskva
  86.  624  corr
  87.  605  Karlsbad
  88.  571  Hamburg GER-chJI U20
  89.  
  90. Many players appear more than once under different names.  Kasparov
  91. appears as:
  92.  
  93.  824  Kasparov,G
  94.   64  Kasparov,Gary
  95.   40  Kasparov,Garry
  96.    6  Kasparov,Garri
  97.    4  Gary Kasparov
  98.    2  Kasparov
  99.  
  100. and Karpov appears as:
  101.  
  102. 1030  Karpov,An
  103.  164  Karpov,Anatoly
  104.  118  Karpov,A
  105.   16  Karpov,Anatoli
  106.    8  Anatoly Karpov
  107.    2  Karpov
  108.  
  109. The total number of player names is 32706 (including duplicates such as
  110. those mentioned above).  The total size of the database is 192649 games,
  111. such that the average per different player is about 11.8 games.  Note
  112. that the total player count would fit within 16 bits, this presents an
  113. opportunity to improve the space efficiency of "cusort" further.
  114.  
  115.  
  116. Player names:
  117. ============
  118.  
  119. In order for "cunames" to work a number of changes have been made to the
  120. way player names are extracted from the "players" field of a game.  If the
  121. players field contains more than one hyphen, it is compared against a list
  122. of known player names that include a hyphen (e.g. "Jan-Hein", "Lars-Bo",
  123. etc.).  If there is a match then the hyphen is replaced by a space and once
  124. again the names of White and Black are extracted.  Finally, the function
  125. "normalisePlayer" is used to remove leading and trailing spaces, brackets
  126. and so forth.  This is implemented as part of "getWhiteGame()" and
  127. "getBlackGame()" and therefore applies to all utilities that use these
  128. functions.
  129.  
  130.  
  131. Place names:
  132. ===========
  133.  
  134. The function "getPlaceGame()" can be used to extract the place from a game.
  135. This function uses a number of heuristics.  The main heuristic is that the
  136. place is the first word of the players field.  There are obviously various
  137. exceptions (e.g. New York, Wijk aan Zee), these are stored in the file
  138. "places.def" and "getPlaceGame()" will load this file.
  139.  
  140.  
  141. Sorting:
  142. =======
  143.  
  144. Thanks to Urban Koistinen the "cusort" utility has been improved.  Urban's
  145. algorithm is (much) more space efficient than my old one was.  I have been
  146. able to sort a 11000 game database under DOS.  "cusort" reports the
  147. amount of memory available, so you can experiment.  The C compiler still
  148. generates a number of "sign-mismatches", I will work this out later.
  149.  
  150.  
  151. CBUFF directory:
  152. ===============
  153.  
  154. In DOS and Unix you can specify a CBUFF directory.  CBUFF will read the
  155. standard files (e.g. "ascii.sym") from this directory if they don't appear
  156. in the current working directory.  The same applies to files specified with
  157. the "-insert" or "-symbols" option.
  158.  
  159. In DOS say (do not forget the trailing "\")
  160.  
  161.    set CBUFFDIR C:\CBUFF\
  162.  
  163. In Unix say (do not forget the trailing "/")
  164.  
  165.    setenv CBUFFDIR "~/CBUFF/"
  166.  
  167. Make sure to copy the relevant files to the directory you mention.
  168.  
  169.  
  170. Bugs fixed:
  171. ==========
  172.  
  173. * "culist" would generate an error message for games for which
  174.   no Result was available.
  175.  
  176. * "culist" could crash on a game with errors.
  177.  
  178. * Memory exhaustion in "cusort" printed properly.
  179.  
  180. * The -append option would remove the last game of a database and make
  181.   it appear that the first game of the appended database appeared twice.
  182.  
  183.  
  184. Enhancements:
  185. ============
  186.  
  187. * "cusort" can handle bigger databases under DOS.  If "cusort" cannot
  188.   obtain the name of White it will use the entire player field instead.
  189.  
  190. * "cuverify" contains additional options to control what aspect of
  191.   a database is being verified (see -help of "cuverify for details).
  192.   Brief summary of new options:
  193.  
  194.   cuverify <db>                   To find errors in header and moves
  195.   cuverify -nomoves <db>        To find errors in header only
  196.   cuverify -noverify -index <db>    To check .cbi file against .cbf
  197.   cuverify -noverify -names <db>    To check names of players, source
  198.  
  199.  
  200. Version management:
  201. ==================
  202.  
  203. The version numbers are now:
  204.  
  205. CBUFF library    0.9.0
  206.  
  207. Utility            Version    DOS limitations (approximately)
  208. ----------------------------------------------------------
  209. cuclean        1.1.0      60000 games / database
  210. culatex        1.1.0       60000 games / database
  211. culist        1.1.0       60000 games / database
  212. cumerge            1.1.0       60000 games / database
  213. cunames        1.0.0       60000 games / database
  214. cupgn        1.1.0       60000 games / database
  215. cusort        1.1.0       13000 games (see Memory available statistics)
  216. custats        1.1.0       60000 games / database
  217. cuverify    1.1.0       60000 games / database
  218.  
  219.