home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #23 / NN_1992_23.iso / spool / sci / crypt / 3828 < prev    next >
Encoding:
Internet Message Format  |  1992-10-16  |  1.7 KB

  1. Xref: sparky sci.crypt:3828 alt.security:4582
  2. Newsgroups: sci.crypt,alt.security
  3. Path: sparky!uunet!infonode!ingr!b30news!craig!craig
  4. From: craig@jido.b30.ingr.com (Craig Presson)
  5. Subject: Re: Letter Frequency
  6. In-Reply-To: ian@pharaoh.cyborg.bt.co.uk's message of 15 Oct 92 15:32:21 GMT
  7. Message-ID: <1992Oct16.175533.16731@b30.ingr.com>
  8. Sender: usenet@b30.ingr.com (Usenet Feed)
  9. Reply-To: craig@jido.b30.ingr.com
  10. Organization: Intergraph Corporation, Huntsville, Alabama
  11. References: <1big1qINNrnq@matt.ksu.ksu.edu> <6989@pharaoh.cyborg.bt.co.uk>
  12. Date: Fri, 16 Oct 1992 17:55:33 GMT
  13. Lines: 53
  14.  
  15.    holland@matt.ksu.ksu.edu (Rich Holland) writes:
  16.  
  17.    >I'm in dire need of a letter frequency chart for the English language.  I
  18.    >remember as a kid reading books on basic cryptanalysis and seeing these
  19.    >charts of the most frequently used letter (like "E" is most often used,
  20.    >then "S" or "R" or something, etc).  I don't remember the order, but now
  21.    >I need it.  Anyone got a copy of a table of something like this online?
  22.  
  23.    >If not, got a source where I can go look it up quick?
  24.  
  25. The frequency distribution that you get varies somewhat depending on
  26. your source of text. Here is the table from Appendix C of Sinkov:
  27.  
  28. (#'s per 1000 letters)
  29.  
  30. E 130 T 93 N 78 R 77 I 74 O 74 A 73 S 63 D 44 H 35 L 35 C 30 F 28
  31.  
  32. P 27 U 27 M 25 Y 19 G 16 W 16 V 13 B 9 X 5 K 3 Q 3 J 2 Z 1
  33.  
  34.  
  35. You get something a bit different if you just run a frequency test
  36. on the dictionary (maybe I have an odd dictionary, too):
  37.  
  38. $ freq < /usr/dict/words | sort +1 -nr | pg
  39. E 36119
  40. A 30747
  41. I 26179
  42. R 23702
  43. O 22767
  44. T 22545
  45. N 22412
  46. S 22094
  47. L 17688
  48. C 17458
  49. D 13054
  50. U 10767
  51. M 9780
  52. B 9231
  53. P 8539
  54. H 7922
  55. G 7817
  56. Y 5766
  57. F 3946
  58. V 3285
  59. K 3046
  60. W 2603
  61. Z 1041
  62. X 862
  63. Q 627
  64. J 626
  65.  
  66.  
  67. -- Craig
  68.