home *** CD-ROM | disk | FTP | other *** search
/ ProfitPress Mega CDROM2 …eeware (MSDOS)(1992)(Eng) / ProfitPress-MegaCDROM2.B6I / TEXT / INFO / WORDS1.ZIP / READ.ME next >
Encoding:
Text File  |  1991-09-06  |  1.4 KB  |  40 lines

  1.                                                    Dallas, TX
  2.                                                    6-Sep-91
  3.  
  4. This is a list of over 100,000 English words transcribed
  5. orthographically. I obtained it from The Interociter bulletin
  6. board in Dallas (214/258-1832). The original read.me file said
  7. that the list came from Public Brand Software.
  8.  
  9. The original list contained 146,440 words, but I discovered that
  10. there were thousands of duplicate words. I resorted the list and
  11. removed the duplicates using the Unix utility uniq. The total
  12. number of words is now 109,582. I have repackaged the list into
  13. four files (the original was five):
  14.  
  15.      File         Bytes    Words   Range
  16.      ---------    ------   -----   -----
  17.      words1.lst   315376   29839   A-D
  18.      words2.lst   242484   23101   E-K
  19.      words3.lst   325716   30439   L-R
  20.      words4.lst   270759   26203   S-Z
  21.                   ----------------
  22.      Total       1154335  109582
  23.  
  24. This word list includes inflected forms, such as plural nouns and
  25. the -s, -ed and -ing forms of verbs. Thus the number of lexical stems
  26. represented in the list is considerably smaller than the total
  27. number of words.
  28.  
  29. Evan Antworth
  30. Academic Computing Department
  31. Summer Institute of Linguistics
  32. 7500 W. Camp Wisdom Road
  33. Dallas, TX  75236
  34. U.S.A.
  35.  
  36. Internet: evan@sil.org
  37. UUCP:     ...!uunet!convex!txsil!evan
  38. phone:    214/709-2418
  39. fax:      214/709-3387
  40.