home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 5 Edit / 05-Edit.zip / isp31b3.zip / ispell / deutsch / README < prev    next >
Text File  |  1995-07-10  |  4KB  |  117 lines

  1. Dieses Verzeichnis enth"alt deutsche Wortlisten, vorbereitet f"ur die
  2. Version 3 des Programms ispell.
  3.  
  4. Zusammengestellt von
  5.  
  6. Heinz Knutzen                    email: hk@informatik.uni-kiel.d400.de
  7. Institut fuer Informatik, Universitaet Kiel        Tel: +49-431-560426
  8. Preusserstr. 1-9, D-24105 Kiel, Germany            Fax: +49-431-566143
  9.  
  10.  
  11. Die Wortlisten basieren auf Dateien von Martin Schulz, die man z.B. in 
  12. /ftp.th-darmstadt.de:/pub/dicts/ispell/dictionaries/deutsch.tar.gz
  13. finden kann.
  14.  
  15. Im wesentlichen habe ich fehlerhafte Worte entfernt. Zus"atzlich habe
  16. ich einige neue Worte hinzugef"ugt und bei vielen Worten weitere
  17. Beugungsformen erg"anzt.
  18.  
  19. Die Aufteilung der Worte in verschiedene Dateien habe ich weiter
  20. vorangetrieben. Damit kann man sich leichter ein KLEINES individuelles
  21. W"orterbuch zusammenstellen. Aus den Wortlisten generiere ich ein
  22. ispell Hash-File mit einer Gr"o"se von ca. 1 MByte im Gegensatz zu
  23. ca. 2 MByte gro"sen Hash-Files mit den originalen Wortlisten von
  24. Martin Schulz.
  25.  
  26. In der Affix-Datei deutsch.aff, die von ispell verwendet wird, um
  27. "ahnliche Worte von einer gemeinsamen Wurzel ableiten zu k"onnen, habe
  28. ich einige Fehler behoben und Verbesserungen vorgenommen.
  29.  
  30. Wesentliche "Anderungen habe ich in der Datei Changes dokumentiert.
  31.  
  32. Es folgt eine Beschreibung der einzelnen Dateien und der Kriterien,
  33. nach denen ich die Aufteilung der Worte vorgenommen habe.
  34.  
  35. gross.txt       Gro"s geschriebene Worte, hoffentlich nur noch Substantive.
  36. verben.txt      Verbformen, keine Befehlsformen
  37. adjektive.txt   Adjektive
  38. klein           Zahlworte, F"urworte, ...
  39. imperat         gebr"auchliche Befehlsformen
  40. abkuerz         gebr"auchliche Abk"urzungen
  41. vornamen        gebr"auchliche Vornamen
  42. geographie.txt  gebr"auchliche geographische Begriffe
  43. latein          Lateinische Redewendungen (et cetera)
  44. informatik      Fachbegriffe aus dem Bereich der Datenverarbeitung
  45. infoabk         Gebr"auchliche Abk"urzungen aus dem DV Bereich
  46. elektronik      Fachbegriffe und Abk"urzungen aus dem Bereich Elektronik
  47. orgabk          Abk"urzungen als Bezeichnung von Organisationen 
  48. marken          Namen von Firmen und Produkten
  49. abkuerz2        weitere Abk"urzungen
  50. geogra2         weitere geographische Begriffe
  51. vornam2         weitere Vornamen
  52. seltenes        wirklich seltene Worte
  53. technik         teilweise merkw"urdige technische Begriffe 
  54. compeng         Computerenglisch, insbesondere deutsch-englische Mischw"orter
  55. namen           Nachnamen bekannter Personen, G"otter, Sagengestalten, ...
  56. zusammen        zusammengesetzte (Fach)Begriffe, die ich nicht verwenden werde.
  57.  
  58. Die Dateien gross, verben, adjektive, klein, imperat und abk"urz
  59. dienen als Grundlage f"ur ein W"orterbuch, das evtl. mit Fachbegriffen
  60. angereichert werden mu"s.
  61. Ich habe viele zusammengesetzte Begriffe nach zusammen.txt
  62. ausgelagert, da mir ein kleines W"orterbuch wichtiger ist als ein
  63. allumfassendes. Bei Bedarf sollte man eine weitere Aufteilung in
  64. Teil-W"orterb"ucher z.B. f"ur die Bereiche Medizin, Wirtschaft, Recht
  65. vornehmen. 
  66.  
  67.  
  68. Installation:
  69.  
  70. Ich empfehle, folgende Worte in ein W"orterbuch aufzunehmen:
  71. worte           immer
  72. verben          immer
  73. adjektive       immer
  74. klein           immer
  75. geographie      eher ja
  76. vornamen        eher ja
  77. abkuerz         eher ja
  78. imperat         eher ja
  79. latein          eher ja
  80. informatik      bei Bedarf
  81. infoabk         bei Bedarf
  82. elektronik      bei Bedarf
  83. orgabk          bei Bedarf
  84. marken          bei Bedarf
  85. alphabeta       bei Bedarf
  86. roemisch        bei Bedarf
  87. zusammen        f"ur ein gro"ses W"orterbuch
  88. technik         eher nicht
  89. compeng         eher nicht
  90. geogra2         eher nicht
  91. vornam2         eher nicht
  92. namen           eher nicht
  93. abkuerz2        nicht
  94. seltenes        nicht
  95.  
  96.  
  97. Kombinieren Sie die ausgew"ahlten Dateien mit 'cat' zu einer Datei
  98. und sortieren Sie die mit 'sort -f'. Z.B.
  99.  
  100. cat {worte,verben,adjektive,klein,geographie,vornamen,abkuerz,imperat,latein,informatik,infoabk}.txt|sort -u>all.words
  101.  
  102. Mit
  103.         
  104. buildhash all.words deutsch.aff deutsch.hash
  105.  
  106. erstellen Sie das deutsche Lexikon.
  107.  
  108. Verwenden Sie das beiliegende deutsch.aff, da es sich von dem deutsch.aff in
  109. der ispell Distribution unterscheidet!
  110.  
  111. F"ur ispell sind keine besonderen Parameter notwendig.
  112. Der Defaultwert #define MASKBITS 32 ist ausreichend.
  113.  
  114. Nach der Installation von deutsch.aff und deutsch.hash an
  115. geeigneter Stelle (LIBDIR in local.h bzw. config.h)
  116. ruft ispell -d deutsch das deutsche Wo"rterbuch auf.
  117.