home *** CD-ROM | disk | FTP | other *** search
/ The World of Computer Software / World_Of_Computer_Software-02-387-Vol-3of3.iso / w / wrdfrq11.zip / WORDFREQ.DOC < prev    next >
Text File  |  1992-11-14  |  24KB  |  484 lines

  1.                                WORDFREQ.EXE
  2.                                version 1.1
  3.                             from JB Utilities
  4.                           released as SHAREware
  5. Copyright 1992, Jules Brenner          BRT71EFR.EXE copyright Microsoft, Inc.
  6.                                        SORT.EXE copyright Microsoft., Inc.
  7.  
  8. WORDFREQ, short for Word Frequency, is a text file analyzer that allows any 
  9. writer to check for words he/she may be using too repetitively.  Note: to use 
  10. it, the DOS command file, SORT.EXE MUST be in the PATH and is tested with the 
  11. 5.0 version.  See below for a fuller description of its purpose to the 
  12. writer.
  13.  
  14. Registration fee is a mere $15.  If you find something that doesn't seem to 
  15. work right, or if you wish WORDFREQ did something it doesn't now do, use your 
  16. registration to make requests.  In any case, if you find yourself using WORDFREQ 
  17. regularly, registering is the right thing to do.  Please remember the 
  18. SHAREware concept: you get to TRY it free.  Your trial is the only thing 
  19. that's free, though.  If you like it and use it, the trial is over and your 
  20. obligation (cf., morality, ethics) is to register it, pay the rather modest 
  21. fee and encourage me to improve the program and write others which may be of 
  22. benefit to you.  But... if you truly can't afford the fifteen, at least let 
  23. me know you're out there.  No software police will visit.  
  24.  
  25. Mail fee to: Jules Brenner
  26.              JB Utilities
  27.              P.O. Box 46116
  28.              Los Angeles, CA 90046-0116
  29.  
  30.  
  31.                             ALTERNATE FEE!!!!!!!!
  32.                          ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  33. As an alternate to remitting a fee, you may purchase our book, THE BRENNER
  34. RESTAURANT INDEX, A Computerized Guide to Selected Restaurants in the Greater
  35. Los Angeles Area.  Its cover price is $12.95, plus $1.07 sales tax if you live
  36. in California, plus $1.05 shipping.  The book may be ordered directly from us
  37. and all you have to do is enclose a check or MasterCard/Visa authorization.
  38. With your order, just mention that you wish to have your copy of WORDFREQ.EXE
  39. registered.  As a registered user, you will receive an update as well as 
  40. additional JB Utilities.  By ordering the book, you get three for one: the 
  41. book, more utilities, AND the registration.
  42.  
  43.         And, now, the commercial:
  44.  
  45. Among restaurant books, this one is quite unique.  It's organized in such a 
  46. way that it will help you pick your restaurant according to what 
  47. considerations are important on any given occasion.  In L.A., with its 
  48. massive size, it's common to find yourself in a part of town you don't know 
  49. too well.  Just check the restaurants in the Location section for those in 
  50. that specific area, and you get an immediate summary of the selected 
  51. restaurants there (and, on your way there).  Another section sorts the 
  52. restaurants by cost in case you're on a budget or want to just consider a
  53. certain price range.  If you're in the mood for a particular kind of food, 
  54. check the Cuisine section.  Finally, there's the alphabetical listing.  All
  55. restaurant listings include vital details, including special dishes, hours, 
  56. parking, credit cards, and more.
  57.  
  58. THE BRENNER RESTAURANT INDEX is available in some Los Angeles bookstores, 
  59. so if you live here, you can also ask for it in your local bookstore.  A few 
  60. of the bookstores carrying it at the time of this writing include: Dutton's, 
  61. Samuel French, Book Soup, Big & Tall Bookstore.  It is also being carried at 
  62. some newstands and restaurants.  If you obtain the book from a retail outlet, 
  63. just send us a note that you request registration for WORDFREQ.EXE and include a 
  64. photocopy of your receipt.
  65.  
  66. To see what this book looks like, you can use the technology at hand.  Simply 
  67. download the file RESTINDX.ZIP from a local BBS.  It contains a .GIF image of 
  68. the book.  You can also send a request to us for the file but please send $1 
  69. with the request to cover expenses.
  70.  
  71. While it may appear that this is a book exclusively for Los Angeles residents,
  72. it is perhaps even more valuable for those visiting from other parts of the 
  73. world.  If you're planning a trip to Disneyland (or wherever), you'll want to 
  74. know which are the better restaurants, where to find them and how close they 
  75. are to you.  If you're staying at a hotel, ask the clerk to help you locate 
  76. all the restaurants in the area.  Let your local travel agent help you plan your 
  77. meals ahead of time if he or she knows a bit about the geography of this huge 
  78. county.
  79.  
  80. Special note for BBSers: the file RESTINDX.ZIP is being distributed around 
  81. Los Angeles BBSs.  It contains a .GIF picture of the book.  Look for it.
  82.  
  83. A few scenarios: 
  84.  
  85. 1. You live in Hollywood and need to meet a business associate who has his 
  86. office in Santa Monica.  Neither of you wants to come all the way across 
  87. town.  You check the zip code map (as in the Thomas Guide) and find the area 
  88. that's right in the middle of the two areas.  It's not too far for either of 
  89. you.  You next check out the restaurants that are available and recommended 
  90. in that area and find 3 that you've been wanting to try and one of your 
  91. favorites!  
  92.  
  93. 2. You and your sweetheart are rushing to a screening (or, game, concert, 
  94. etc.). Getting ready took a little longer than you expected and time is 
  95. tight.  You decide to eat en route and know of a great little restaurant.  
  96. You get there and find others had the same idea and there's a long line.  You 
  97. pull The Brenner Restaurant Index out of your glove compartment and find one 
  98. great restaurant two blocks away and another 4 at slightly greater distances 
  99. en route to your goal.
  100.  
  101. 3. You're going to a movie that's hot and you know if you get there merely in 
  102. time for the movie, you might not even get into the parking lot.  You pull 
  103. out The Brenner Restaurant Index and find there's a truly fine restaurant so 
  104. close to the theater that you can park at the theater OR the restaurant and 
  105. walk over.  Getting there at dinner time instead of at screening time 
  106. ensures you an easy place to park--and only once!  (I've done this by dining 
  107. at Chan Dara, one of the great Thai restaurants, when going to the Cinerama 
  108. Dome).
  109.                                  - - - -
  110.  
  111. Note to those using credit cards: Please include the following with your order:
  112. your name (printed) as it appears on the card (include middle initial), the card 
  113. number, the expiration date and your signature.  (See the registration form
  114. included in the WORDFREQ library [zip] file).
  115.  
  116. ------------------------------------------------------------------------------
  117.  
  118.     WORDFREQ.EXE is self-documenting.  Just type 
  119.  
  120.                              WORDFREQ 
  121.  
  122.     on the command line (followed, of course, by a carriage return).
  123.  
  124.         SYNTAX in brief:
  125.  
  126.                 WORDFREQ [textfile] [/n]
  127.  
  128.                 Where the /n switch counts numbers as words.
  129.                 Textfile is, ideally, an ASCII file.
  130.                    (See C below, FILES TO BE PROCESSED).
  131.  
  132.  
  133. ------------------------------------------------------------------------------
  134.  
  135.                            Table of Contents
  136.  
  137.  
  138.                 PREAMBLE ......... ALL ABOVE
  139.  
  140.                 A ................ PURPOSE
  141.  
  142.                 B ................ WORDFREQ WITH NO PARAMETERS
  143.  
  144.                 C ................ FILES TO BE PROCESSED                    
  145.  
  146.                 D ................ MEMORY and WORDFREQ
  147.  
  148.                 E ................ CASE SENSITIVITY
  149.  
  150.                 F ................ WHAT ARE WORDS... TO WORDFREQ?
  151.  
  152.                 G ................ .FRQ: THE ANALYSIS FILE
  153.  
  154.                 H ................ ON THE FLY ANALYSIS
  155.  
  156.                 I ................ Additional notes:                                   
  157.  
  158.                 J ................ Printing this file
  159.  
  160.                 K ................ Updates
  161.  
  162.                 L ................ BUG REPORTS
  163.  
  164.                 M ................ DISTRIBUTION
  165.  
  166.                 N ................ REGISTRATION INFORMATION
  167.  
  168.  
  169. ------------------------------------------------------------------------------
  170.  
  171. A. PURPOSE
  172.  
  173.         If you write to communicate to other people, you are or
  174.         should be concerned with the boring details of grammar, 
  175.         punctuation and style of expression.  To forego these
  176.         considerations is to limit the effectiveness of what you
  177.         write and the quality of your communication.
  178.  
  179.         WORDFREQ offers one method of analysis in the third 
  180.         category: style of expression.  One thing many writers do
  181.         is use a word or a particular group of words with a 
  182.         frequency of which they're not even aware.  The inherent
  183.         problem with this, besides rendering your writing 
  184.         ineffective by being far too repetitive, is not 
  185.         using the vocabulary you have.  The use of a good
  186.         vocabulary is a means to more precisely express your
  187.         thoughts and a bad habit should not impinge on precision
  188.         in language, thought nor expression.
  189.  
  190.         The question is, ARE you using certain words too often?
  191.         To find out, run WORDFREQ on a document you've recently
  192.         written.  The results will amaze (and probably not delight)
  193.         you!
  194.  
  195.  
  196. B. WORDFREQ WITH NO PARAMETERS
  197.  
  198.         Typing              WORDFREQ (cr)
  199.  
  200.         bring up the syntax screen.  At the end of the syntax message
  201.         you are prompted for a file name.  This affords alternative usage,
  202.         the first method by including a filename on the command line,
  203.         the second by invoking the program and then typing the filename.
  204.  
  205.  
  206. C. FILES TO BE PROCESSED                    
  207.  
  208.         WORDFREQ is a text file word-frequency analyzer.  In theory,
  209.         any file in ASCII is a text file.  In practice, all ASCII files
  210.         are not necessary appropriate for word frequency analysis.  A  
  211.         data file in ASCII would be one example.  If the data file had
  212.         nothing more than a series of numbers, WORDFREQ would report
  213.         the frequency of the numbers (with the /n switch only).  Not 
  214.         useful to most of us.
  215.  
  216.         Document files created by a word processor differ from straight
  217.         ASCII files in that they included embedded commands for 
  218.         formatting and other purposes.  Though these kinds of files
  219.         have not been tested as of this writing, it is likely that
  220.         the embedded commands will be seen by WORDFREQ as words and
  221.         will be counted for frequency.  In case of trouble with these
  222.         types of files, go back into your word processor and save the
  223.         files as ASCII (aka, non-document).
  224.  
  225.         Kinds of files that would be totally inappropriate for WORDFREQ
  226.         are executable and other binary files.  Examples of these are
  227.         files with the extensions .COM and .EXE.  The results of an
  228.         analysis of such files would produce nothing more than a lot of
  229.         symbolic garbage.
  230.  
  231.         The kinds of files that are most appropriate for a word 
  232.         frequency analysis are documents of communication.  This would
  233.         include book chapters, letters, reports, files such as this one.
  234.  
  235.  
  236. D. MEMORY and WORDFREQ
  237.  
  238.         Files above a certain size cannot be processed by WORDFREQ.
  239.         The limitation is the string space alloted by the conventions
  240.         of programming languages and of DOS.  This is not the same as 
  241.         RAM.  String space memory is a portion of RAM and is not a 
  242.         reflection of how much RAM your system has.  A system with
  243.         16 megabytes of RAM will run out of string space as soon as
  244.         a system with 1 megabyte.
  245.  
  246.         Another problem of memory are files that are so large they
  247.         can't even be loaded.  This is not fully tested but we expect
  248.         that limit to be in the neighborhood of 120k.
  249.  
  250.         Above around 80k and that size which can't be loaded are
  251.         files which are likely to run out of string space.  When and
  252.         if this occurs, WORDFREQ will display exactly how many lines
  253.         out of the total number of lines have been processed.  In
  254.         this way, you can see how much is missing.  The resulting
  255.         analysis may still be useful, so long as that portion not
  256.         counted is kept in mind.
  257.  
  258.  
  259. E. CASE SENSITIVITY
  260.  
  261.         WORDFREQ is case-sensitive.  A future version is planned to
  262.                  ~~ to make this switchable.
  263.  
  264.         Case sensitivity means that 'The', 'the' and 'THE' are seen
  265.         as unique words.  Keep this in mind when you read the 
  266.         analysis file (6).
  267.  
  268.  
  269. F. WHAT ARE WORDS... TO WORDFREQ?
  270.  
  271.         Words are those strings of characters that appear between
  272.         certain word delimiters.  Examples of delimiters are spaces,
  273.         commas, semi-colons, colons, periods, end-of-lines, question
  274.         marks, and a few others.
  275.  
  276.         In its default mode, numbers are NOT words (unless they are
  277.         attached to characters or are embedded within a string).
  278.  
  279.         The switch /n allows you to tell WORDFREQ to consider numbers
  280.         as words and to count their frequency.
  281.  
  282.         What all this means is that there are a number of characters
  283.         and abbreviations that are not excluded and will therefore
  284.         be considered as unique words.  You might, for instance, use
  285.         the | character to set apart columns, or use single letters
  286.         as symbols and abbreviations.  All of these will be regarded
  287.         as unique words and will be counted for frequency.  You must
  288.         consider the results against the style of the file and your
  289.         preferences and needs when writing it.  Strange occurrences
  290.         might well be fully appropriate to the file under analysis.
  291.  
  292.  
  293. G. .FRQ: THE ANALYSIS FILE
  294.  
  295.         WORDFREQ creates a file which lists all the unique words it has
  296.         found in your file and the frequency of each.  This list is
  297.         sorted with the words of highest frequency first.  The
  298.         analysis file will be named with the name of your text file
  299.         but with the extension .FRQ appended.  It is an ASCII file
  300.         and is readable with any text editor, word processor and/or
  301.         file reading utilities, including the DOS TYPE command.
  302.  
  303.         The successful creation of the .FRQ file is reported on
  304.         screen at the conclusion of the sorting process.  The 
  305.         program then returns to DOS.
  306.  
  307.         The breakdown of words, the original filename and the date
  308.         of analysis is included in the .FRQ file as a header.  The
  309.         header also includes a reminder about words that may appear
  310.         the same but are counted as unique.
  311.  
  312.         IMPORTANT NOTE: Sorting is done by the DOS command file,
  313.         SORT.EXE.  This file must be in your path or on the default
  314.         directory.  If it's not, you will get the error message:
  315.         "Bad Command or File Name" and the process will be incomplete.
  316.         If you need help with the PATH command or the word "default"
  317.         we will be happy to help you if you call or write us.
  318.  
  319.         A word about analysis: there are many words that are going 
  320.         to have a high count in any document.  Articles, pronouns,
  321.         the glue that holds phrases together are all used frequently
  322.         as a matter of course.  These are not the target of a word
  323.         frequency analysis.  Disregard, therefore, high counts of 
  324.         words such as "the", "and", "an", etc.  Pay attention to 
  325.         descriptive words, adjectives, nouns that you use habitually
  326.         and perhaps too frequently.  Frequent analysis will point
  327.         out a bad habit you may not have been aware of and that is
  328.         the purpose of WORDFREQ.
  329.  
  330.         Note also that an analysis of this document will show a
  331.         high count of the words, "frequent", "frequently", "words"
  332.         and "analysis".  You don't even have to run WORDFREQ to 
  333.         know that.  But these words are the subject of the document
  334.         and therefore will naturally be repeated many times.  So,
  335.         expect the subject of your document, as well as words that
  336.         describe the subject, to have a high count and this should
  337.         not be considered a problem of habit.
  338.  
  339.  
  340. H.  ON THE FLY ANALYSIS
  341.  
  342.         While WORDFREQ is reading and analyzing your file, it reports
  343.         its activity and current findings on screen.  It will show
  344.         you the line number being processed as well as the total
  345.         number of lines in the file.  In this way you can judge its
  346.         progress.
  347.  
  348.         Next, it reports the total unique words and the total number
  349.         of words that it's accumulating as it goes along.
  350.  
  351.         Finally, it indicates the average number of words per line.
  352.  
  353.         Analysis can be aborted by pressing the [ESCAPE] key during
  354.         the processing.  This can be a little sticky, however, and
  355.         may require repeated pressing for abort to be effected.
  356.  
  357.         Since WORDFREQ can only handle as many unique words as
  358.         string space memory allows, it will stop its analysis when
  359.         the limit is reached.  The program will not abort here,
  360.         however, and will proceed to report on that portion of the
  361.         file it has managed to read.  The important thing to observe
  362.         in this instance is the number of lines read 'out of' the
  363.         total in the file.  This gives you an fairly exact idea of
  364.         the portion of the file the report applies to.  If it's
  365.         important to have the full file analyzed, it would have to
  366.         be broken into parts.  This is possible with certain 
  367.         utilities that are available as shareware.  It's a 
  368.         cumbersome procedure, but if it's essential there's a way
  369.         to do it.
  370.  
  371.  
  372. ------------------------------------------------------------------------------
  373.  
  374. I. Additional notes:                                   
  375.  
  376. The non-standalone version of WORDFREQ must have BRT71EFR.EXE in the default 
  377. directory or in the path.  This version is best for you if you are running 
  378. more than one program requiring BRT71EFR.EXE since the individual program 
  379. files will be smaller.
  380.  
  381. To make WORDFREQ as useful as possible, it, too, should be on a directory 
  382. that is in your path, such as \UTIL.  If you run it from another drive, best 
  383. results are achieved with the standalone version, which doesn't require the 
  384. presence of BRT71EFR.EXE but which is larger in terms of disk space.
  385.  
  386. WORDFREQ does not contain much in the way of error-checking, beyond what DOS 
  387. might or might not offer.  Where this may be a problem is if you do a 
  388. WORDFREQ on a file in a drive which doesn't exist, where the floppy drive 
  389. door is open, something like that.  Rare, and we leave it to the user to 
  390. avoid such mistakes.  An opened drive door could hang up your computer (a 
  391. warm or cold boot will cure the temporary situation).  More often than not, 
  392. however, you'll be able to insert the disk and close the door and then enter 
  393. an 'R' for Retry.
  394.  
  395. ------------------------------------------------------------------------------
  396.  
  397. J. Printing this file
  398.  
  399. The first thing you may notice if you send this file to your printer, is that
  400. there are no embedded form feeds.  My thinking on this is that your printer
  401. is likely to furnish its own form feed when a certain number of lines are
  402. reached.  Mine does this, but perhaps that's because it's a laser printer.  I
  403. don't know for sure, but maybe dot matrix and impact printers don't do that.
  404. If that's so, then you might want to do your own formatting.  It merely
  405. requires you to place a Control-L character every 60 lines or so.
  406.  
  407. For those whose printers work like mine, not having form feeds built in allows
  408. you to print out with your own utility or application in your own preferred
  409. way.  I never have liked those pesky embedded commands, making an assumption
  410. that didn't fit my life's plan or defaults.  My print utility allows me to
  411. specify font and font size.  I like it that way.  I hope the majority of you,
  412. too, like it that way.  For those who don't, sorry.  Write me a letter.  I'd 
  413. sincerely love hearing from you.
  414.  
  415. ------------------------------------------------------------------------------
  416.  
  417.  
  418. K.      UPDATES:
  419.         ~~~~~~~~
  420.         Version 1.1     Recompiled with PDS BASIC 7.1.
  421.                         The analysis breakdown is now put into the .FRQ
  422.                            (report) file.
  423.                         A note in this file regarding the use of SORT.EXE
  424.                            as an essential file to be in your path or in
  425.                            your default directory.  SORT.EXE is part of
  426.                            DOS and is copyright Microsoft, Inc.
  427.  
  428. ------------------------------------------------------------------------------
  429.  
  430. L. BUG REPORTS:
  431.  
  432.         Users are encouraged to report all bugs to the author.  One of the 
  433.         most common way for bugs to creep into any program is when new
  434.         features are added and all the previous capabilities which were
  435.         working flawlessly are not thoroughly tested.  Since the author 
  436.         uses this utility, even obscure bugs will eventually come to his 
  437.         notice, but in the spirit of partnership, all users are encouraged 
  438.         to report a bug they encounter.  The file, FEEDBACK.DOC, is included 
  439.         with the program to facilitate such reports.  (Of course, feel free 
  440.         to send us the form merely to report good things, too).
  441.  
  442.         In the event of a bug appearing in a commonly used option, we
  443.         advise you go back to the previous version you were using until
  444.         the bug(s) is(are) corrected.
  445.  
  446. ------------------------------------------------------------------------------
  447.  
  448. M. DISTRIBUTION
  449.  
  450. WORDFREQ may be distributed freely so long as no alterations are made to the 
  451. program nor to the archive nor to this documentation.  Shareware distributors 
  452. may charge up to $5 for the WORDFREQ utility without specific permission so 
  453. long as they inform us of their distribution with a copy of the ad or catalog 
  454. in which it is offered.  For any greater charge, distributors must first 
  455. write us to seek permission and to explain the reason for the higher charge.
  456.  
  457. ------------------------------------------------------------------------------
  458.  
  459. N. REGISTRATION INFORMATION
  460.  
  461. Registration fee to the end user is a mere $15.  (See above for alternate). A 
  462. standalone version is available on request when registering.  Go ahead.  Make 
  463. my day.  Encourage me to write more by registering.  If you find yourself 
  464. using WORDFREQ regularly, it's the right thing to do.  Registered users will 
  465. receive at least 1 update when available as well as notifications (or copies) 
  466. of other JB utilities.  
  467.  
  468.     This program may not be used in a business, corporation, organization,
  469.     government or agency environment without a negotiated site license.
  470.  
  471. Suggestions, bug reports, etc. appreciated and encouraged -- even by non-
  472. registered users.  Yes, if you say, for instance, "hey, if you'd only add
  473. [this capability or that capability], I'd pay your filthy fee!", we'd
  474. probably add it just to part you from your fifteen. So, don't be shy.  We'll 
  475. even listen to a hard luck story.  Heck, if you're only using 1/3 of 
  476. WORDFREQ's capabilities, we'll accept $5.  You be the judge and executioner.  
  477. ("Ouch, that rope is rough!"). 
  478.  
  479. ~~~~~ Mail fee or excuses to JBUTILS, P.O. Box 46116, Los Angeles, CA 
  480. 90046-0116. Messages may be addressed to me on Prodigy.  ID# FTSN96A.
  481.  
  482.                                                 -- J.B., for JBUTILS
  483.  
  484.