home *** CD-ROM | disk | FTP | other *** search
/ Media Depot 5 / mediadepotvolume51993.iso / FILES / 07 / SCRABL37.ZIP / MUSINGS.TXT < prev    next >
Encoding:
Text File  |  1996-01-02  |  4.4 KB  |  112 lines

  1.                                 MUSINGS
  2.    Concerning relative vowel and consonant frequencies in the OSPD3, and 
  3.        conclusions that may be drawn about rack balance therefrom.
  4. ============================================================================
  5.  
  6. This is not a formal research piece. It is easy enough to compile statistics 
  7. on letter frequencies in the OSPD3 using the computer, but drawing useful 
  8. conclusions from these statistics is another matter altogether. With that 
  9. disclaimer out of the way, let us begin.
  10.  
  11. Let us call the proportion of vowels to total letters in a given word list, 
  12. expressed as a percent, V%. For all the words in the OSPD3, V% = 38.56, that 
  13. is, vowels make up 38.56% of all the letters in all the words in the OSPD3. 
  14. Similarly, V% for the 1254 words newly added to the OSPD3 is 45.32. The words 
  15. added to the OSPD3 have a rather higher proportion of vowels to consonants 
  16. than does the typical run of words already present there.
  17.  
  18. Taking V% for a supplementary list of 133,282 words longer than eight 
  19. letters, we get 41.73. A tentative conclusion is that lists of very short 
  20. words and very long words have a higher V% than lists of intermediate length 
  21. words. This can be tested.
  22.  
  23. Calculating V% for the OSPD3 according to words of given length, we get the 
  24. following figures:
  25.  
  26. 2-letter words:  53.57
  27. 3-letter words:  41.99
  28. 4-letter words:  38.92
  29. 5-letter words:  38.66
  30. 6-letter words:  39.14
  31. 7-letter words:  38.75
  32. 8-letter words:  38.91
  33. 9-letter words:  37.30
  34. 10-letter words: 38.82
  35. 11-and above letter words: too few words in OSPD3 to analyze meaningfully.
  36.  
  37. It appears that V% does indeed settle down to a figure in the range of 38 - 
  38. 39 for 4 to 10 letter words. What does this mean in terms of rack balance and 
  39. playing strategy in a real world Scrabble (tm) game?
  40.  
  41. It would appear that a balanced rack (7-letters) should have about 3 vowels 
  42. and 4 consonants (43%, the closest approach to a V% of 38-39). Of course this 
  43. is scant consolation if you have a "balanced" rack of VWXZUUU. The trick is 
  44. having the *right* consonants and vowels, and less critically the relative 
  45. proportion.
  46.  
  47. =============================================================================
  48.  
  49. Words in the English language, and OSPD, are "random"* in the sense defined 
  50. by the mathematician John Casti. This means that words cannot be reliably 
  51. constructed by a formula or algorithm. For example, given the set of 
  52. consonants, C{ b, c, d, f, g, h ... } and the set of vowels, V{ a, e, i, o, 
  53. u, y }, try to find a method of creating English words, say by taking 3 from 
  54. set C and 2 from set V. This approximates the V% found above. Most of the 
  55. "words" formed by trial and error by this 3-to-2 rule will form strings of 
  56. letters not found in any English language dictionary, nor in the OSPD3, 
  57. non-words in other words.
  58.  
  59. Casti defines a "random" number as a real number whose shortest representa-
  60. tion is itself. By the same token, I would say a "random"* word is likewise 
  61. one whose simplest representation is itself. Therefore, =all= the words in 
  62. the English language, and the OSPD, are "random". There is no mathematical 
  63. formula for constructing words in any spoken / written language. This gives 
  64. natural human languages their richness, complexity, diversity, and unpre- 
  65. dictability.   Ain't language wonderful, hon! 
  66.  
  67. footnote:
  68. --------
  69. *You could also make a case that words are "chaotic" rather than "random", 
  70. that is, falling into a pattern, but not one that is predictable or 
  71. computable.
  72.  
  73. ============================================================================
  74. Addendum: A couple of interesting "imbalanced" vowel / consonant word lists.
  75.          By increasing length, champion "imbalanced" words:
  76.  
  77. HIGH-CONSONANT LIST             
  78. crwth
  79. crwths
  80. tsktsks
  81. borschts
  82. strengths
  83. throttling
  84. abstractest
  85. backdropping
  86. scratchbrush (not in OSPD3)
  87.  
  88. HIGH-VOWEL LIST
  89. aalii
  90. yautia
  91. ouguiya
  92. aboideau
  93. zoogloeae
  94. homoiousia (not in OSPD3)
  95. squeegeeing
  96. housesitting
  97.  
  98. ▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄
  99.  
  100. Scrabble and OSPD are trademarks of the Milton Bradley Co., Inc.
  101.  
  102.  
  103. The above musings are the product of the demented mind of the author of the 
  104. SCRABLST and WORDY packages.
  105.  
  106. M\Cooper
  107. 3425 Chestnut Ridge Rd.
  108. Grantsville, MD 21536-9801
  109. --------------------------
  110. e-mail: thegrendel@aol.com
  111. or thegrendel@gcc.cc.md.us
  112.