home *** CD-ROM | disk | FTP | other *** search
/ CP/M / CPM_CDROM.iso / lambda / soundpot / p / windex20.lbr / WINDEX.DZC / WINDEX.DOC
Encoding:
Text File  |  1993-10-25  |  8.5 KB  |  187 lines

  1. ;;05-23-85
  2. Eric Gans
  3. French Department UCLA
  4. Los Angeles, CA 90024
  5.                            WINDEX.DOC
  6.                               v2.0
  7.  
  8. Version 2.0 update (05/22/85):
  9.  
  10. A  number  of features have been added at the request  of  users, 
  11. whom I thank for their interest.  WINDEX now:
  12.  
  13. - carries all-caps words into the index unaltered (Paul Foote)
  14. - permits a negative page offset (Simon Heifetz)
  15. - allows  tagging  keys within the text file with ^PP, and
  16. - allows indexing of strings (John-Mark Stensvaag)
  17. - allows indexing of (hard-)hyphenated words
  18. - uses entire free memory (max of about 11000 page references and 
  19. a 17 K NDX file for a 60 K system -- e.g., Kaypro-10)
  20.  
  21. The I/O has been speeded up (again),  a bug or two corrected, and 
  22. tabs  replaced  by  spaces  in the NDX file,  plus  a  few  minor 
  23. changes.
  24.  
  25. Version 1.2 update (4/6/85):
  26. Finds words divided by "soft" hyphens at the end or middle of the 
  27. line; more efficient I/O for long index files.
  28.  
  29. Version 1.1 update (4/3/85):
  30. Fixed bug in v1.0 that forgot to open file to be indexed (!) when 
  31. keywords  entered  from  console.   (Thanks  to  B.  Cardozo  for 
  32. catching this one.)
  33.  
  34.                               *****
  35.  
  36. WINDEX  creates  indexes for  Wordstar files written in  document 
  37. mode.   It  can  be  used to index a manuscript  of  any  length, 
  38. including books of up to 9999 pages, with a maximum of 254 keys.
  39.  
  40. The keywords to be WINDEXed can be entered in three modes:
  41.  
  42. 1. (windex [d:]fn.ft) Direct keyboard entry; you will be prompted 
  43. at the console.  The simplest approach for short indexes.
  44.  
  45. 2.  (windex  [d:]fn.ft *      NB:  * replaces / used in  previous 
  46. versions)   Keywords will be sought in a file fn.KWD on the  same 
  47. drive/user.  In  creating this file,  you need only avoid hyphens 
  48. and  the exotic punctuation marks [\]^_` The character /  may  be 
  49. used  between words to index strings;  it will be treated as  the 
  50. equivalent  of  a  non-break space (^O) in the  file.  All  other 
  51. characters,  including numbers,  periods,  commas,  semicolons or 
  52. blanks,  are permitted as separators: the simplest way is to list 
  53. the words with a CR after each.  Hyphenated words may be  indexed 
  54. (this means that the program will not find indexed words that are 
  55. contained  in hyphenated groups:  Big-Mac will not be found in  a 
  56. search   for   Mac);   no  other  internal   punctuation   (e.g., 
  57. apostrophes)   is  permitted.   First  or  all  letters  may   be 
  58. capitalized and will remain so in the output (the search function 
  59. won't  pay attention to capitalization).  You need not enter  the 
  60. words  in  order;  the program will alphabetize  them.  The  same 
  61. criteria hold true if you prefer to enter your word list from the 
  62. keyboard.
  63.  
  64. 3. (windex [d:]fn.ft #)  Keywords may be tagged in the file to be 
  65. indexed.   This  allows you to create your index as you go  along 
  66. (duplicate entries will be discarded).   ^P (entered as ^PP) must 
  67. precede each keyword.  To index strings, separate words by a non-
  68. break space (^O, entered as ^PO), which keeps the whole string on 
  69. the same line.   To end the index string,  you may enter a second 
  70. ^P,  although any non-alphabetical character except - and ^O will 
  71. suffice. The maximum string length permitted is 29 characters.
  72.  
  73.  
  74. The  output  file  (on  the  same  drive)  will  be  fn.NDX.   An 
  75. approximate  right margin of 65 will be adhered to;  CR's will be 
  76. added  after each line and second and succeeding lines  of  index 
  77. entries  will be tabbed.   This file can be edited with  Wordstar 
  78. and  converted  if you like to document mode (this  doesn't  seem 
  79. appropriate for an index, however).
  80.  
  81. If  you  have  more than 254 keywords,  you  should  divide  them 
  82. alphabetically  into two or more groups.  (ALPHA.COM will do this 
  83. for you.)  You can then combine the indexes later in alphabetical 
  84. order using PIP or Wordstar's ^KR command.
  85.  
  86. The  current  version of WINDEX allocates about 2/3 of  the  free 
  87. memory  to  the page-reference buffer and about 1/3 for  the  NDX 
  88. file.   This allows (on a 60 K Kaypro-10) for about 17 K for  the 
  89. file  and  34 K for the buffer,  or about 11000 references  at  3 
  90. bytes  each.   (This  proportion is based on the fact  that  many 
  91. references are multiple appearances on the same page that do  not 
  92. appear  in  the NDX file.)  This should be enough for any  normal 
  93. use   of   the  program  (110  references/page  in   a   100-page 
  94. manuscript!)   In case you somehow do run out of  memory,  WINDEX 
  95. will  recognize when the CCP is overwritten and do a  Warm  Boot, 
  96. but it doesn't check if you go even further.  But long before you 
  97. get  to  that point,  you should divide your  keyword  list  into 
  98. smaller alphabetical groups and index them separately.   As  long 
  99. as  you keep the different indexes in alphabetical order  (you'll 
  100. also  have  to  change their names if you keep them on  the  same 
  101. disk),  you  can PIP them together with no internal editing  save 
  102. removal of a few headings.
  103.  
  104. Page offset:  
  105.  
  106. You will be prompted for an offset between -255 and 9999 (default 
  107. =  0).   All page numbers will be increased by the  offset.  This 
  108. feature  allows you to index manuscripts that don't start at page 
  109. 1 (say,  chapters in a book).   A negative offset may be used  if 
  110. page 1 is preceded by prefatory material; index entries that come 
  111. before page 1 will be listed as "-#".
  112.  
  113. Hyphens:
  114.  
  115. Wordstar  distinguishes  between hard hyphens  (those  you  enter 
  116. yourself)  and  soft hyphens (entered for  formatting  purposes).  
  117. WINDEX skips over soft hyphens,  since they merely break words at 
  118. the  end  of lines;  hard hyphens are treated as letters  in  the 
  119. keyword and in the file.  This remains true even when they  occur 
  120. at the end of a line;  the difference is that you entered them as 
  121. part of a hyphenated word.
  122.  
  123. String example:  
  124.  
  125. (Console  or KWD file)  The entry:   blurk/zap/zlonk  will search 
  126. the  string "blurk^Ozap^Ozlonk",  which will appear in  print  as 
  127. "blurk  zap  zlonk" (all words on the same line).   To  tag  this 
  128. string  in  your text file,  it should appear on the  screen  as: 
  129. "^Pblurk^Ozap^Ozlonk^P";  the  second  ^P  can be replaced  by  a 
  130. (normal) space.
  131.  
  132. Features:
  133.      - makes  use of a binary tree for maximum search speed  (5-6 
  134. seconds for a 40K file)
  135.      - occupies less than 3K on disk
  136.  
  137. Limitations: 
  138.      - won't    recognize   words   with   internal   punctuation 
  139. other than hyphens (apostrophes, accents, &c.) 
  140.      - only  works  with files saved in document mode  (it  needs 
  141. this  for  its page-count feature)  
  142.      - all  files (fn.ft,  fn.KWD,  fn.NDX) must be on same drive 
  143.  
  144. Warning:  - WINDEX will create a new NDX file each time it is run 
  145. and  delete any previous file of the same name.  You must  rename 
  146. old index files you want to save before rerunning the program.
  147.  
  148. Trick:
  149.      - You  can rename an old NDX file as a KWD file,  since  the 
  150. program  won't notice the numbers following the  entries.  Before 
  151. you  do this,  don't forget to delete the heading within the  NDX 
  152. file.
  153.  
  154. *****************************************************************
  155.  
  156. ALPHA.COM v1.0
  157.  
  158. In  order to facilitate finding keywords in your  files,  I  have 
  159. included  my  word-sorting program ALPHA in this  library.   This 
  160. program  uses  a binary tree to sort all the words in a  file  in 
  161. alphabetical order and gives the number of times (up to 256) each 
  162. is  used (words used more than 255 times will wrap  around;  this 
  163. may  be changed in a future version but isn't very important  for 
  164. our  purposes  here.)   Entering a / after  the  filename  (i.e., 
  165. entering:  alpha fn.ft /) will limit the word list to capitalized 
  166. words.  Many of these will be The or This, but you will also find 
  167. all  the  proper  names in your file.   ALPHA  doesn't  create  a 
  168. separate file,  but you can print it out (use CP/M ^P,  or if you 
  169. have   a  Kaypro,   my  PRINT  or  BIOSP  print-screen  patch  in 
  170. EGKTEN.LBR).  ALPHA allows internal apostrophes, but not hyphens.  
  171. (I didn't allow for apostrophes in WINDEX since when you write an 
  172. index   you  usually  want  to  include  possessives  under   the 
  173. possessor:  if  you are indexing "Smith," you want  instances  of 
  174. "Smith's" to be included, not listed separately.)
  175.  
  176. Note to the user:
  177.  
  178. Version  2.0  contains several enhancements suggested  by  users.  
  179. If  you  can  think of anything else you'd like to  see,  let  me 
  180. know--we aim to please.
  181.  
  182. Possibilities: 
  183.  
  184. - allowing numbers, etc. in index words
  185. - freer string entry options
  186. - ???
  187.