home *** CD-ROM | disk | FTP | other *** search
/ Monster Media 1993 #2 / Image.iso / wp / dospel37.zip / SPEL_371.ZIP / READ-NL.DOC < prev    next >
Text File  |  1993-02-06  |  36KB  |  870 lines

  1. Nieuw Nieuw Nieuw
  2.  
  3. Update service !!!!!!
  4.  
  5. Veel mensen kunnen moeilijk aan DOSPELL komen. Ik wil hieraan op de volgende
  6. manier tegemoet komen:
  7.  
  8. Stuur naar mijn adres een geformatteerde flop, 3½ of 5¼ inch inclusief een
  9. aan je jezelf geadresseerde en gefrankeerde envelop. Dus met postzegels.
  10. Als ik tijd heb (meestal) en niet een maand weg ben (vaak) geen andere
  11. bezigheden heb (komt ook voor) en nog op het zelfde adres woon (Wie weet ?) en
  12. mijn vriendin ze niet weggooid, dan kan je na een maand je eigen envelop met
  13. de nieuwste versie dan DOSPELL in je brievenbus vinden. Het is ook mogelijk
  14. dat je de flop nooit meer terug ziet !
  15.  
  16.  
  17. DOSPELL III Documentatie file, September 1992. NL uitvoering. Lees de
  18. voorwaarden in README.DOC
  19.  
  20.  
  21.  
  22.  
  23.  
  24. DOSPELL wordt in twee versies uitgebracht:
  25.  
  26. Versie I   (1.09) Voor computers zonder harddisk. Maximum capaciteit
  27.                   woordenboek 18.000 woorden.
  28.        III (3.xx) Voor computers met harddisk. Maximum capaciteit
  29.                   woordenboek 400.000 woorden.
  30.  
  31.  
  32.  
  33.  
  34. Inleiding
  35. ---------
  36.  
  37. Het programma DOSPELL kan een Nederlandse en Engelse spelling kontrole
  38. uitvoeren op Extendend-ASCII files en in de resident mode op de scherm inhoud.
  39. Hierdoor kan DOSPELL als een aanvullende spelling kontrole gebruikt worden
  40. bij diverse programma's als de editters Qedit en Ted maar ook bij
  41. tekstverwerkers als Wordstar. In de resident mode werkt DOSPELL in principe
  42. bij elk programma, welke niet in de grafische mode werkt. DOSPELL werkt met de
  43. bekende video kaarten als MDA HGC CGA EGA VGA. Er dient wel voldoende geheugen
  44. ruimte beschikbaar te zijn. In de resident mode gebruikt DOSPELL circa 
  45. 120 Kbyte geheugen. Voor andere programma's blijft er dan circa 500 Kbyte aan
  46. geheugen over. (640 K machine)
  47.  
  48. In het Nederlandstalige woordenboek is meestal zowel de oude als de nieuwe
  49. spelling aanwezig. Aan de nieuwe spelling wordt de voorkeur gegeven.
  50. Voorbeeld: Kontrole/controle. Deze c/k spelling is gebaseerd op de Nederlandse
  51. Norm NEN 5050 "Woordenlijst voor bedrijf en techniek" van 1980.
  52.  
  53. In het Engelstalige woordenboek wordt in principe de UK spelling aangehouden.
  54. Woorden zoals Analyser worden met een S geschreven i.p.v het Amerikaanse
  55. Analyzer. Er is ook een specifiek Amerikaans woordenboek.
  56.  
  57. Dospell herkent het verschil tussen hoofdletters en kleine letters en kent
  58. de speciale karakters zoals ë, ä, ï,...... en ÿ. Woorden als nederland,
  59. coordineren worden als fout herkend. Als suggestie worden Nederland en
  60. coördineren voorgesteld. Wil je geen verschil zien tussen een o en ö  (alt 148)
  61. lees dan hoofdstuk 2.2.
  62.  
  63.  
  64. De Nederlandse woordenlijst is afgeleid van 1) Nos Hobbyscoop beeldkranten.
  65.                                             2) Nederlands net news 1 t/m 19
  66.                                             4) Diverse Nederlandse doc files.
  67.  
  68.  
  69. Iedereen wordt uitgenodigd om commentaar/aanvullingen op te sturen naar
  70. onderstaand adres. Wil je meehelpen om DOSPELL uit te breiden, lees dan
  71. hoofdstuk 2 van deze documentatie. Aanvullingen op het woordenboek van
  72. 10, 20, 100 of meer woorden zijn zeer welkom. Stuur je PERS_DIC op !!
  73.  
  74. Met dank aan de NOS Hobbyscoop voor de gebruikte Nederlandse Beeldkranten.
  75.  
  76.  
  77.      J.A.M. Kleijn
  78.      Geldersestraat 66
  79.      3011 MP Rotterdam.
  80.  
  81.  
  82.  
  83.  
  84. Inhoud:         0   Beknopt commando overzicht.
  85.                 1   Gebruik.
  86.                 1.1 Spelling check ASCII files.
  87.                 1.2 Resident gebruik in combinatie met andere programma's.
  88.                 1.3 Omschakelen tussen Nederlands en Engelse woorden boek.
  89.                 2   Aanvullende informatie.
  90.                 2.1 Versie woordenboek.
  91.                 2.2 Woordenboek maken.
  92.                 2.3 Technische info.
  93.  
  94.  
  95.  
  96. -----------------------------------------------------------------------------
  97.                 0   Beknopt commando overzicht.
  98. -----------------------------------------------------------------------------
  99.  
  100.  
  101.  
  102.    FUNCTIE          |  KOMMANDO  |    FUNCTIONELE TOETSEN
  103. --------------------|------------|---------------------------------------------
  104. Resident mode:      |  SPEL r    |    ALT-1 = Test scherm inhoud.
  105.                     |            |    ALT-2 = Geef suggesties voor woord
  106.                     |            |            waar cursor staat. Laad na
  107.                     |            |            een keuze het woord in
  108.                     |            |            keyboard buffer.
  109.                     |            |    ALT-0 = Laad woord op plaats van
  110.                     |            |            cursor in woordenboek.
  111.                     |            |
  112.                     |            |    I = Ignore/negeer.
  113.                     |            |    M = More/meer, laat meer zien.
  114. --------------------|------------|---------------------------------------------
  115. Spelling verbeteren | SPEL FILE  |    A = Add/laad woord in woordenboek.
  116. van ASCII file:     |            |    I = Ignore/negeer.
  117.                     |            |    M = More/meer, laat meer zien.
  118.                     |            |    E = Enter, handmatig verbetering.
  119. --------------------|------------|---------------------------------------------
  120. Command line info   |  SPEL  ?   |
  121.                     |            |
  122.  
  123.  
  124. Opmerking: Het te gebruiken woordenboek kan door middel een parameter
  125.            meegeven worden. Bijvoorbeeld: SPEL R UK of SPEL FILE SNEW UK.
  126.  
  127. -----------------------------------------------------------------------------
  128.                 1   Gebruik.
  129. -----------------------------------------------------------------------------
  130.  
  131.  
  132. DOSPELL kan op twee manieren gebruikt worden:
  133.  
  134.             1) Het op spelling testen en automatisch verbeteren van standaard
  135.                ASCII files.
  136.             2) Het testen van de beeld inhoud op spelling in elk willekeurig
  137.                programma zoals een spreadsheet, editter, tekstverwerker of
  138.                database. De woorden kunnen automatisch aangepast worden.
  139.  
  140.  
  141.  
  142. "Voorbereiding"
  143.  
  144. Als DOSPELL aangeroepen wordt vanuit een andere directory dan moet als
  145. eerste het path naar de woordenboeken aangegeven zijn. Als DOSPELL in de
  146. directory C:\TEXT\DOSPELL is geplaatst tik dan in: SET DOSPELL=C:\TEXT\DOSPELL
  147. Hierdoor is het path voor DOSPELL vastgelegd. Het handigste is natuurlijk
  148. om dit kommando in de autoexec.bat file op te nemen.
  149.  
  150.  
  151.  
  152.  
  153. -----------------------------------------------------------------------------
  154.                 1.1 Spelling check ASCII files.
  155. -----------------------------------------------------------------------------
  156.  
  157.  
  158.  
  159. Gebruik voor deze optie het menu of enter direct in DOS:
  160.  
  161.  
  162.      SPEL FILENAAM                        (Resultaat komt in file SNEW)
  163. of   SPEL FILENAAM NIEUWE-FILENAAM
  164. of   SPEL FILENAAM NIEUWE-FILENAAM UK     (Gebruik Engels woordenboek)
  165.  
  166.  
  167. Als DOSPELL het woord niet vindt, zal er een klein window komen waarin
  168. eventuele suggesties gegeven worden. Dit window geeft de volgende
  169. mogelijkheden:
  170.  
  171.  
  172.           1,2,3,4,... = Plaats voorstel 1,2,3,4... in de tekst.
  173.                     M = More, display volgende voorstellen.
  174.                     I = Ignore, negeer woord door hele tekst, ga door wijzig
  175.                         niets.
  176.                     E = Enter handmatig nieuw woord;
  177.                     A = Add, voeg woord aan woordenboek PERS_DIC toe.
  178.                  rest = Ignore, negeer woord alleen deze keer.
  179.  
  180.  
  181.  
  182.  
  183. DOSPELL maakt voor het bepalen van de voorstellen gebruik van twee algoritmen:
  184.  
  185.  
  186. 1) Bij woorden die een lengte hebben van kleiner of gelijk aan vijf stelt
  187.    hij woorden voor die maximaal 1 letter afwijken. Voor de volgende fouten
  188.    doet hij het goede voorstel:
  189.  
  190.         Xauto auXto autXo autoX   { AXuto      niet  }
  191.         auo aut                   { uto ato    niet }
  192.         Xuto  auXo autX           { aXto       niet }
  193.  
  194. De uitzonderingen zijn nieuw voor versie II van DOSPELL en vanwege de nieuwe
  195. indexering niet geimplementeerd (lastig)
  196.  
  197.  
  198. 2) Bij woorden met een lengte groter dan vijf kijkt DOSPELL naar de eerste drie
  199.    klinkers en de daarop volgende letter. Dit is bijzonder effectief voor
  200.    spelfouten door te veel of te weinig letters. Voorbeelden:
  201.  
  202.    Woord             Sound-alike
  203.    ------------      -----------
  204.  
  205.    onmiddellijk   ==>  onidel
  206.    onmidelijk     ==>  onidel
  207.    automatisch    ==>  auomat
  208.    automatish     ==>  auomat
  209.    automatiseren  ==>  auomat
  210.    vergeten       ==>  ereten
  211.    perpeten       ==>  ereten
  212.    contract       ==>  onac
  213.    kontract       ==>  onac
  214.  
  215.  
  216.  
  217. De gebruikte Pascal routines zijn in hoofdstuk 2.2 technische info toegevoegd.
  218.  
  219.  
  220.  
  221. -----------------------------------------------------------------------------
  222.           1.1 Resident gebruik in combinatie met andere programma's.
  223. -----------------------------------------------------------------------------
  224.  
  225. Gebruik
  226. -------
  227.  
  228. DOSPELL kan via het menu of direct resident gemaakt worden. Voor dit laatste
  229. enter in DOS:
  230.  
  231.                 SPEL r
  232.    of           SPEL R            (geeft toets-klik bij elke toets aanslag)
  233.    of           SPEL R KLEURNR    (Geef attentie kleur aan. Zie tabel)
  234.    of           SPEL R KLEURNR KEY1 KEY2 KEY3
  235.    of           SPEL R KLEURNR KEY1 KEY2 KEY3 UK  (Gebruik Engels woordenboek)
  236.    or           SPEL R COLORNR KEY1 KEY2 KEY3 DES1 DES2 DES3 UK.
  237.    of           SPEL R UK
  238.  
  239.   DES1 betekent beschrijving hotkey1. Bijvoorbeeld F1 of ALT-1.
  240.  
  241. Het woorden boek wordt geladen en DOSPELL nestelt zich resident in het
  242. geheugen. Dit Kost ongeveer 118 Kbyte. Start hierna een ander programma op.
  243. Bijvoorbeeld een spreadsheet of editter. Via de toets combinatie ALT en 1 of
  244. ALT ! wordt DOSPELL actief en gaat de scherm inhoud op spelling controleren.
  245. Woorden die DOSPELL niet kent worden extra fel of high-lighted weergeven.
  246. Verbeter de woorden en gebruik eventueel weer de Alt 1 combinatie.
  247.  
  248. Via de toets combinatie ALT 2 of ALT @ geeft DOSPELL voorstellen voor het woord
  249. op de plaats van de cursor. Deze verschijnen in een window boven in het beeld.
  250. Een voorstel kan dan door het intikken van het aangegeven cijfer  automatisch
  251. in de tekst ingevoerd worden. DOSPELL plaatst hiervoor het voorstel in het PC
  252. keyboard buffer. De editter/tekstverwerker zal het woord uit het keyboard
  253. buffer overnemen en plaatsen op de plaats van de cursor. Het oude woord wordt
  254. opgeschoven. (indien insert van editter/tekstverwerker aanstaat)
  255. Met behulp van delete kan dan het oude woord worden. Het is daarom handig om
  256. de cursor als eerste precies op de eerste letter van het door alt-2 te testen
  257. woord te plaatsen. Door beperkingen van het PC keyboard buffer is de maximum
  258. woord lengte beperkt tot 15 letters. Langere woorden (max 38) worden
  259. afgebroken. Deze kunnen handmatig aangevuld worden.
  260.  
  261. * Als het deel van het woord links van de cursor goed gespeld is, dan
  262.   zal dit gedeelte niet naar het keyboardbuffer worden toe gezonden.
  263.  
  264.   Voorbeeld:         COMPUTTER
  265.                           -
  266.                           ^
  267.                           |
  268.                           | Cursor
  269.  
  270.         Bij selectie van het woord COMPUTER zal alleen "ter" naar het
  271.         keyboard geschreven worden. Resulterende in COMPUTERTTER.
  272.  
  273. Alleen de optie M = More werkt in de resident mode. Indien niet alle
  274. voorstellen in het window passen kan na het indrukken van de letter M de
  275. volgende voorstellen bekeken worden.
  276.  
  277. Via de toets combinatie ALT-0 of ALT-) kunnen onbekende woorden aan het
  278. persoonlijke woordenboek PERS_DIC toegevoegd worden. Hierbij wordt het
  279. oorspronkelijke path aangehouden waarin DOSPELL in de resident mode is
  280. opgestart.
  281.  
  282.  
  283. Attentie kleur bij resident gebruik.
  284. ------------------------------------
  285.  
  286. Als DOSPELL een woord niet in zijn woordenboek kan vinden, wordt het woord
  287. "default" extra fel op het scherm weergegeven. (high-lighted text) Het
  288. programma zet hiervoor bit 3 van de desbetreffende text attribuut. Dit komt
  289. overeen met het getal 8.
  290.  
  291. Via het menu maar ook direct tijdens een commandlijn start kan een andere kleur
  292. opgegeven worden. Het is wel verstandig nog ongebruikte bits te gebruiken om
  293. te voorkomen dat de normale kleuren ook veranderd worden. Op een blauwe
  294. achtergrond dus niet bit 4 gebruiken. Zie hiervoor de navolgende text attribuut
  295. tabel:
  296.  
  297.  
  298.  
  299.  
  300.                   Bit
  301.  
  302.             7 6 5 4 3 2 1 0
  303.             ---------------
  304.             1 . . . . . . .   Knipperende tekst.
  305.             . 1 . . . . . .   Rode component achtergrond.
  306.             . . 1 . . . . .   Groene component achtergrond.
  307.             . . . 1 . . . .   Blauwe component achtergrond.
  308.             . . . . 1 . . .   Intensiteit tekst.
  309.             . . . . . 1 . .   Rode component tekst.
  310.             . . . . . . 1 .   Groene component tekst.
  311.             . . . . . . . 1   Blauwe component tekst.
  312.  
  313.  
  314.  
  315.  
  316. Bijvoorbeeld:  2 tot de macht 6 = 64 geeft een rode achtergrond.
  317.                2     ,,       7 = 128 geeft knipperende woorden.
  318.  
  319.  
  320. Deze kunnen via de instructie:  SPEL r 64   of SPEL r 128 geladen
  321. worden.
  322.  
  323. Na resident geladen te zijn, kan DOSPELL niet zondermeer verwijderd worden.
  324. Alleen door resetten van de computer, of door utilities zoals mark en release
  325. van Turbopower kan DOSPELL uit het geheugen verwijderd worden. Het testen van
  326. het type videokaart gebeurt eenmalig tijdens het laden.
  327.  
  328.  
  329. Actieve toetsen
  330. -------------
  331.  
  332. Default toetsen voor de resident mode zijn alt-1, alt-2 en alt-0. Deze kunnen
  333. aangepast worden door in de commandlijn nieuwe scan-codes mee te geven:
  334.  
  335.  
  336.           SPEL R [color] [KEY1] [KEY2] [KEY0] [Taal]
  337.  
  338.  
  339. KEY1 komt i.p.v. alt-1, key2 voor alt-2, key0 voor alt-0. De scan codes
  340. van het keyboard kunnen kunnen met het bijgeleverde programma readkey bepaald
  341. worden. Alleen de scan-codes die als karakter kode een nul geven (decimaal kode)
  342. kunnen gebruikt worden.
  343.  
  344.  
  345. Voorbeeld:  SPEL R 8 59 60 68
  346.  
  347.  
  348. Hiermee worden alt-1, alt-2 en alt-0 vervangen door de functie toetsen
  349. F1, F2 en F10. Color 8 is gelijk aan de default color.
  350.  
  351. -----------------------------------------------------------------------------
  352.                 1.3 Omschakelen tussen Nederlands en Engelse woorden boek.
  353. -----------------------------------------------------------------------------
  354.  
  355.  
  356.  
  357. Via het menu is het mogelijk om om te schakelen tussen de verschillende
  358. talen. De "default" is het NL of Nederlandse woordenboek. Via het programma
  359. INSTALL.EXE is de "default" op een ander taal/woordenboek te zetten. De
  360. woordenboeken bestaan uit vier files. Bijvoorbeeld het Nederlandse woordenboek:
  361.  
  362.                       MAIN_DIC.NL
  363.                       MAIN_IND.NL
  364.                       RAM_DIC.NL
  365.                       PERS_DIC.NL
  366.  
  367. Via de extensie wordt de taal aangegeven.
  368.  
  369.  
  370.  
  371. Hiernaast kan in de commandolijn direct de taal meegegeven worden.
  372.  
  373.  
  374. Voorbeelden resident mode:  SPEL R 8 59 60 68 UK
  375.                             SPEL R 8 UK
  376.                             SPEL R UK
  377.  
  378. Voorbeeld ASCII mode:       SPEL FILE SNEW UK
  379.  
  380.  
  381.  
  382.  
  383. -----------------------------------------------------------------------------
  384.                 2   Aanvullende informatie.
  385. -----------------------------------------------------------------------------
  386.  
  387.  
  388. Een goed woordenboek maken kost tijd. Een gevarieerde inbreng van andere
  389. mensen helpt. Wil je meehelpen om voor DOSPELL grotere woordenboeken te
  390. maken, gebruik dan de add optie van DOSPELL.EXE op de tekstfiles in je bezit.
  391. Test e.v.t het resultaat ( PERS_DIC ) met een tekstverwerker en zend het
  392. resultaat met vermelding naam oorspronkelijke tekstfile of soort tekst naar:
  393.  
  394.  
  395.      Han kleijn
  396.      Geldersestraat 66
  397.      3011 MP Rotterdam
  398.      Nederland.
  399.  
  400.  
  401.  
  402.  
  403.  
  404.  
  405. -----------------------------------------------------------------------------
  406.                 2.1 Versie woordenboek.
  407. -----------------------------------------------------------------------------
  408.  
  409. Vanaf versie 3.70, bevat de indexfile MAIN_IND een type nummer. De
  410. indeling van het woordenboek is veranderd. Hierdoor worden compatibiliteits
  411. problemen voorkomen.
  412.  
  413. Indien het programma een fout melding geeft:
  414.  
  415. Not type 2  MAIN_IND file,  ==>   1) Gebruik nieuwer woordenboek.
  416.                               of  2) Export dictionary naar E-ASCII, sorteer
  417.                                      met SORTBIG.BAT en SPEL-S tot minstens
  418.                                      level 3 maar beter tot 30. Maak van de
  419.                                      gesorteerde file met het behulp van het
  420.                                      nieuwe SPEL.EXE programma een nieuw
  421.                                      woordenboek.
  422.  
  423.   (Note in type 2 worden de niet ASCII letters anders ingedeeld.)
  424.  
  425.  
  426.  
  427.  
  428. -----------------------------------------------------------------------------
  429.                 2.2 Woordenboek maken.
  430. -----------------------------------------------------------------------------
  431.  
  432. Het woordenboek van DOSPELL bestaat maximaal uit drie delen. Het
  433. hoofdwoordenboek MAIN_DIC met index file MAIN_IND, het woordenboek
  434. RAM_DIC met de meest voorkomende woorden en als laatste een standaard ASCII
  435. file genaamd PERS_DIC. Deze bevat de persoonlijk toegevoegde woorden.
  436.  
  437. RAM_DIC, MAIN_IND EN PERS_DIC  worden bij het opstarten in het
  438. geheugen geladen.
  439.  
  440. Als DOSPELL een woord test, dan zoekt hij als eerste in het in geheugen
  441. geladen RAM_DIC. Hierin bevinden zich circa 2000 van de meest voorkomende
  442. woorden. Vindt hij het woord niet, dan gaat hij verder zoeken in PERS_DIC en
  443. MAIN_DIC. Is het woord nog niet gevonden dan wordt een voorstel gedaan uit
  444. MAIN_DIC met behulp van zogenaamde sound alike routines. Zie 2-2.
  445.  
  446. Na het toevoegen van woorden via de add of alt-0 optie, komen de woorden
  447. in PERS_DIC terecht. Deze kan maximaal circa 17 Kbyte groot worden. Met het
  448. bijgeleverde RAM_DIC van 15 Kbyte deelt hij namelijk het 32 Kbyte Ram
  449. geheugen.
  450.  
  451.  
  452. Als PERS_DIC erg groot wordt, zal dit de snelheid het programma verlagen.
  453. Is het buffer helemaal vol dan wordt er een waarschuwing gegeven. PERS_DIC
  454. kan bij MAIN_DIC worden toegevoegd. Dit kan het beste met de AM optie
  455. of optie 1 in het "Dictionary Maintenance" menu.
  456.  
  457. Met deze optie kan een ongesorteerde ASCII file toegevoegd worden aan het
  458. MAIN_DIC. Het is wel zaak dat de toe te voegen ASCII file gecontroleerd
  459. is op de spelling. Na het toevoegen of "adden" is het MAIN_DIC definitief
  460. gewijzigd. Via deze optie kunnen files van maximaal 32 Kbyte - (size DO-RAM)
  461. toegevoegd worden. Eventueel kan het in gedeeltes door de file te splitsen.
  462. De routine is bijzonder tolerant. De lengte van de regels in de toe te voegen
  463. file mogen maximaal 255 characters lang zijn en de woorden mogen door mekaar
  464. staan. Er moet alleen een return of een spatie tussen de woorden staan. Tijdens
  465. het toevoegen worden woorden die al in MAIN_DIC staan genegeerd.
  466. Doubleringen zijn hierdoor niet mogelijk.
  467.  
  468.  
  469.  
  470. Hiernaast bestaat er nog de oudere methode via SPEL-S. Gebruik deze
  471. alleen bij grote files. D.w.z groter dan 20 K byte. Het toevoegen gaat als
  472. volgt:
  473.  
  474. Schrijf MAIN_DIC naar een standaard ASCII file. (zie Menu) Voeg daarna
  475. PERS_DIC toe aan deze file met behulp van een tekst verwerker of het COPY
  476. commando. Het DO-MAIN woordenboek is dan niet meer gesorteerd en dient met
  477. het sorteer programma SPEL-S gesorteerd te worden tot minimaal 3 letters diep
  478. maar liever tot 30 diep of meer. Dit kost er veel tijd (Uren) * en gaat het
  479. beste in een ram disk, zoals te kreëren met de standaard DOS file VDISK.SYS.
  480. De woorden komen precies in alfabetische volgorde. Het sorteren tot 30 of meer
  481. heeft het voordeel dat het woordenboek later door DOSPELL tot 40 % gepakt kan
  482. worden. Via het menu kan het ASCII eindresultaat weer omgevormd worden tot een
  483. compact en geïndexeerd woordenboek.
  484.  
  485.  
  486. Voorbeeld maken ram disk:   In config.sys   DEVICE=\DOS\VDISK.SYS 480
  487.  
  488.  
  489. Dit geeft een ram disk van 480 Kbyte en de drive letter wordt D: (als de
  490. laatste drive C: is) Na het maken van de ram disk blijft er erg weinig ruimte
  491. over voor andere programma's. Houdt eventueel een bootable floppy bij de hand
  492. om de computer weer op te starten. Start de ram disk e.v.t op vanaf een DOS
  493. floppy. Het sorteren gebruikt tot 2.5 maal de ASCII file size aan ruimte. Deze
  494. kan optimaal benut worden door vanuit de ram disk de te sorteren ASCII file op
  495. de harddisk aan te roepen.
  496.  
  497.  
  498. Voorbeeld:       Vanuit D: drive      D:\>c:spel-s c:ned 35
  499.  
  500.  
  501. Als het woordenboek te groot wordt voor de ram disk, gebruik dan de optie
  502. van SPEL-S om alleen de buffers op de ram disk te plaatsen. Bij een ram disk
  503. van 480 kbyte kunnen dan op een AT meer dan 40.000 woorden in een uur
  504. gesorteerd worden. Is de lijst nog steeds te groot, gebruik dan een batch
  505. file zoals de bijgevoegde SORTBIG.BAT.
  506.  
  507. * Een disk cache zoals SMARTDRV.EXE van windows 3.1 geeft een zeer grote
  508. performance verbetering.
  509.  
  510. Het RAM_DIC hoeft in principe niet veranderd te worden. Wil men toch
  511. (andere taal) een nieuw PERS_DIC maken, dan kan het beste gestart worden met
  512. het programma LEARN.EXE. Dit programma verzamelt woorden van tekstfiles en
  513. houdt tevens de frequentie van voorkomen bij. Hierdoor zullen in het begin van
  514. de "eindresultaat file" de meest voorkomende woorden vooraan staan, zoals:
  515.  
  516.  
  517. DE HET EEN  ...
  518.  
  519.  
  520. Als er nog geen PERS_DIC bestaat, gaat het als volgt:
  521.  
  522. Zorg dat je eerste een zo groot mogelijk aantal gevarieerde (Nederlands-
  523. talige ) ASCII file(s) heb. Enige honderden Kbytes om enige duizenden
  524. woorden te verzamelen. Zet alle files in een directory, bijvoorbeeld
  525. \NEDER. Start het programma als volgt op:
  526.  
  527.  
  528.      LEARN \NEDER\*.*
  529.  
  530.  
  531. De woorden zullen verzameld worden in de file LEARN.LLL. Dit kan enige uren
  532. duren. Hierna kan het resultaat met een tekstverwerker gecontroleerd worden.
  533. Bewaar de LEARN.LLL file. Zodra LEARN.EXE weer opgestart wordt, zal deze
  534. LEARN.LLL weer geladen worden. Om snelheid te winnen kan het verstandig zijn
  535. het verzamelen van woorden in een aantal stappen te doen. Doordat de woorden
  536. na elke stap in LEARN.LLL gesorteerd worden, zullen de navolgende files
  537. sneller verwerkt worden.
  538.  
  539.  
  540. Als alle woorden voldoen aan de (Nederlandse) spelling kunnen ze gebruikt
  541. worden in DOSPELL. Maak uit LEARN.LLL een nieuwe file met circa 2000 van de
  542. meest voorkomende woorden en bouw via het menu in DOSPELL van deze file een
  543. een nieuwe RAM_DIC.
  544.  
  545. Belangrijk: De hoofdletter informatie gaat verloren in RAM_DIC en
  546.             PERS_DIC. Verwijder daarvoor alle woorden met hoofdletters zoals
  547.             landen namen en eigen namen uit RAM_DIC.
  548.  
  549. (Note: Het programma kan iets sneller gemaakt worden, door woorden waarvan de
  550.        eerste drie letters zeer veel voorkomen, zoals "VER" => VERZAMELEN,
  551.        VERZOEKEN toe te voegen aan de ram disk. DOSPELL heeft voor deze woorden
  552.        de langste (DISK) zoek tijd.)
  553.  
  554.  
  555.  
  556.  
  557. -----------------------------------------------------------------------------
  558.                 2.3 Technische info.
  559. -----------------------------------------------------------------------------
  560.  
  561.  
  562. De file RAM_DIC bevat de index van 26 posities die aangeeft waar woorden
  563. beginnen met letter A, B,..... en alle woorden in ASCII. De woorden worden
  564. vooraf gegaan door de lengte. De file bevat geen harde enter.
  565.  
  566. De file MAIN_DIC begint als eerste met een veld van 100 bytes voor niet
  567. essentiële info en bevat daarna een lijst met de woorden op alfabetische
  568. volgorde. Doordat de woorden alfabetisch gesorteerd zijn is er een compressie
  569. methode mogelijk die bijzonder effectief is tot 37 % van de oorspronkelijke
  570. file lengte. Deze compressie methode is er op gebaseerd dat opeenvolgende
  571. woorden er op mekaar lijken. Bijvoorbeeld: COMPUTER EN COMPUTERS. Wordt het
  572. woord computer vastgelegd dan kan daarna computers vastgelegd worden door 7S.
  573. Dit betekend 7 letters van het voorgaande woord plus S.
  574.  
  575.  
  576. Voorbeeld:     AANBAKT AANBAKTE AANBAKTEN AANBEDEN ==> AANBAKT6E7N4EDEN
  577.  
  578.  
  579. De hoofdletter informatie wordt in een byte achter het woord opgeslagen. In
  580. geval character 169 betekend dat de eerste letter een hoofdletter was. Een
  581. character 170 betekend alle letters hoofdletter.
  582.  
  583.  
  584. Dospell kan momenteel een MAIN_DIC file aan van 64 Kbyte * 32, ongeveer
  585. 2 Mbyte. Dat zijn meer dan 400.000 woorden. Als dit niet genoeg is, stuur dan
  586. een berichtje, dan pas ik het aan voor het dubbele.
  587.  
  588.  
  589.  
  590. Opbouw output LEARN.EXE:
  591.  
  592.                      130045                  <= totale onderzochte populatie.
  593.                     ----------
  594.                     10022 DE                 <= "DE" 10022 keer gevonden.
  595.                      3765 IS                 <= "IS" 3765 keer gevonden.
  596.                      3217 VAN
  597.                      3214 HET
  598.                      2801 EN
  599.                      2657 EEN
  600.                      2194 OP
  601.                      1797 MEI
  602.                     ..... ...
  603.  
  604.  
  605.  
  606. Draag er zorg voor, dat na het op spelling testen/wijzigen van LEARN.LLL dat
  607. alle woorden op plaats 7 of verder in de regels beginnen !.
  608.  
  609.  
  610.  
  611.  
  612. Automatisch woord correctie in resident mode:
  613.  
  614.  
  615. DOSPELL laad de woorden in het zogenaamde key board buffer van de bios.
  616. Dit is normaal geplaatst vanaf adres $0040:001E met een lengte van 15+1
  617. "words". DOSPELL zet als eerste de buffer start pointer = $0040:001A naar
  618. het begin van het buffer, schrijft de woorden weg en plaatst de eind
  619. pointer= $0040:001C op de eind positie van het buffer.
  620.  
  621. Dospell reageert op twee keyboard interrupts, int $16, AH = $0 en int $16,
  622. AH = $10.
  623.  
  624.  
  625.  
  626. Resident controle:
  627.  
  628. DOSPELL kontroleert via interrupt 11h of DOSPELL al reeds in het geheugen
  629. geladen is. Via het geven van een interrupt 11h en register CX=$0059
  630. (CX wordt normaal niet gebruikt) wordt gecontroleerd of interrupt 11h
  631. reeds is omgeleid.
  632.  
  633.  
  634.  
  635. Hoofdletters:
  636.  
  637. Is de eerste letter van een woord een hoofdletter, dan neemt DOSPELL dit
  638. over in de correctie. Is ook de laatste letter een hoofdletter, dan wordt het
  639. gehele woord met hoofdletters gecorrigeerd.
  640.  
  641. Bij de spelling kontrole wordt rekening gehouden met hoofdletters van landen
  642. namen en personen. B.v. voor het woord rotterdam wordt als korrekte spelling
  643. Rotterdam aangeven. Als echter nieuwe woorden aangeleerd worden via de add
  644. optie dan gaat de hoofdletter informatie verloren. Hier is voor gekozen daar
  645. het moeilijk is aan te geven of het nieuwe woord de hoofdletter heeft van het
  646. begin van de zin of door de schrijfwijze. Wordt het woord Rommeldam aan
  647. geleerd dan wordt de spelling met en zonder hoofdletter geaccepteerd.
  648.  
  649. Om deze redenen zijn in versie III alle woorden met hoofdletters zoals
  650. Europa, Nederland (circa 30) uit het RAM_DIC woordenboek verwijderd.
  651. Dit om fouten via het RAM_DIC woordenboek te voorkomen.
  652.  
  653.  
  654. Letter y,ij en ÿ:
  655.  
  656.  
  657. Dospell maakt onderscheid tussen twee schrijfwijzen:  1) ij, IJ of ÿ
  658.                                                       2) y en Y
  659.  
  660.  
  661.  
  662. Speciale characters:
  663.  
  664. Sinds versie III worden de speciale letters als ö herkend. Wil je dat niet, dan
  665. kan je het woordenboek ombouwen via de export functie van DOSPELL.
  666. In commandlijn commando's:
  667.  
  668. DOSPELL eM temp        { e in kleine letter, M hoofdletter om in standaard-ASCII te exporteren}
  669. DOSPELL CM temp        { Maak opnieuw woordenboek van temp}
  670. DEL temp
  671.  
  672. Haal eventueel ook de characters uit RAM_DIC weg.
  673.  
  674.  
  675. Woorden die beginnen met een speciaal character worden geplaatst onder de "x".
  676.  
  677. DOSPELL maakt van gebruik van de volgende tabellen om ongewenste characters
  678. weg te filteren en woorden in te delen:
  679.  
  680.      letter2                      : array[0..255] of char=(
  681. #96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,
  682. #96,#96,#96,#96,#96,#96,#96,#96,#96,#96,'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x',
  683. 'x','x','x','x','x','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y',
  684. 'z','x','x','x','x','x',#96,'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w',
  685. 'x','y','z','x','x','x','x','x','x','u','e','a','a','a','a','x','e','e','e','i','i','i','a','a','e','a','a','o','o','o',
  686. 'u','u','y','o','u','x','x','x','x','x','a','i','o','u','n','n','x','x','x',#96,#96,'x','x','x','x','x','x','x','x','x',
  687. 'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x',
  688. 'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','b','x','x','x','x','x','x','x','x','x','x','x','x','x','x',
  689. 'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x',#96);
  690.  
  691.      letter                         : array[0..255] of char=(
  692. '*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
  693. '*','*','*','*','*','*','*','*','*',#39,'*','*','*','*','*','-','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
  694. '<','*','>','*','*','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y',
  695. 'z','*','*','*','*','*','*','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w',
  696. 'x','y','z','*','*','*','*','*','ç','ü','é','â','ä','à','å','ç','ê','ë','è','ï','î','ì','ä','å','é','æ','æ','ô','ö','ò',
  697. 'û','ù','ÿ','ö','ü','ç','£','¥','₧','ƒ','á','í','ó','ú','ñ','ñ','ª','º','¿','*','*','½','¼','¡','*','*','*','*','*','*',
  698. '*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
  699. '*','*','*','*','*','*','*','*','*','*','*','*','*','*','α','ß','Γ','π','Σ','σ','µ','τ','Φ','Θ','Ω','δ','∞','φ','ε','∩',
  700. '*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*');
  701.  
  702. Deze laatste tabel kan met INSTALL.EXE uitgebreid worden.
  703.  
  704.  
  705.  
  706. ASCII file:
  707.  
  708. Hieronder wordt verstaan een file met een harde enter of carriage return
  709. (Karakter 13) en line feed (Karakter 10). Een regel mag 254 karakters 1)
  710. lang zijn, maar bij een lengte van 160 of meer zal de inverse weergave van
  711. DOSPELL niet meer correct werken.
  712.  
  713.       1) Versie 3.70 en later kunnen een regellengte van 255 of langer aan.
  714.  
  715.  
  716.  
  717. De gebruikte klank of sound alike routines:
  718.  
  719. FUNCTION KLANK(zoek:string):string;  {zoek downcase}
  720.  {bepaald klank, d.w.z. klinkers plus volgend letter}
  721.  {voorbeeld automaten wordt    auomat}
  722.  {          mogelijkheid wordt ogelij}
  723.  {          vernederen         ereder}
  724.  {          verwijderen        erijer}
  725.  {          kado               ado***}
  726.  {          kados              ados**}
  727.  {          salade             aladen}
  728.  {          salades            aladen}
  729. const
  730.      soundt     : array[39..166] of char=(
  731. '*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
  732. '*','*','*','*','*','a','*','*','*','e','*','*','*','i','*','*','*','*','*','o','*','*','*','*','*','u','*','*','*','y',
  733. '*','*','*','*','*','*','*','a','*','*','*','e','*','*','*','i','*','*','*','*','*','o','*','*','*','*','*','u','*','*',
  734. '*','y','*','*','*','*','*','*','*','u','e','a','a','a','a','*','e','e','e','i','i','i','a','a','e','*','*','o','o','o',
  735. 'u','u','y','o','u','*','*','*','*','*','a','i','o','u','n','n','*');
  736.  
  737. {Neem alleen de letters A,E,I,O,U en Y mee en vervang ë en ÿ... door E, Y...}
  738.  
  739. var
  740.    l,m   : byte;
  741.    w     : char;
  742.  
  743. begin { MADE FOR SPEEEEEED ! }
  744.   l:=1;
  745.   m:=1;
  746.   klank:='******';
  747.   zoek[0]:=succ(zoek[0]);{snelle manier voor zoek:=zoek+'*'}
  748.   zoek[ord(zoek[0])]:='*'; {DUMMY}
  749.   repeat
  750.     w:=soundt[ord(zoek[L])];
  751.     if w<>'*' then
  752.     begin
  753.       klank[m]:=w;
  754.       inc(l);
  755.       klank[m+1]:=zoek[L];
  756.       inc(m,2);
  757.       if m>6 then
  758.       begin
  759.         if ((zoek[L]='*') or (zoek[L]='s')) then
  760.         klank[6]:='n';
  761.         {maak standaard meervoud bij lange lengten}
  762.         exit;
  763.       end;
  764.     end;
  765.     inc(L);
  766.   until L>length(zoek);
  767. end;
  768.  
  769. FUNCTION BIJNAGELIJK(ZOEK:string;ref:string):boolean;{ref=referentie, zoek is het gevonden woord}
  770. var i,eq : byte;
  771.     tussen : string[39];             {voorbeeld ref:=some} {bijna gelijk voor zoek:=..}
  772.  
  773. begin
  774.  ref[1]:=letter2[ord(ref[1])];  {downcase ref voor geval bv Indië}
  775.  if length(zoek)<length(ref) then     {som,soe,sme,ome}
  776.  begin
  777.    zoek[length(zoek)+1]:=' ';
  778.    i:=0;
  779.    repeat
  780.      inc(i)
  781.    until ((zoek[i]<>ref[i]) or (i>length(zoek)));
  782.    delete(ref,i,1);
  783.    if zoek=ref then
  784.    bijnagelijk:=true
  785.    else bijnagelijk:=false;
  786.    exit;
  787.  end
  788.  else
  789.  if length(zoek)>length(ref) then    {*some,s*ome,so*me,.....}
  790.  begin
  791.    ref[length(ref)+1]:=' ';
  792.    i:=0;
  793.    repeat
  794.      inc(i)
  795.    until ((zoek[i]<>ref[i]) or (i>length(ref)));
  796.    delete(zoek,i,1);
  797.    if zoek=ref then bijnagelijk:=true else bijnagelijk:=false;
  798.    exit;
  799.  end
  800.  else
  801.  begin {lengte equal}     {Xome,sXme,soXe,somX}
  802.    eq:=0;
  803.    for i:=1 to length(zoek) do if zoek[i]=ref[i] then inc(eq);
  804.    if eq>=length(ref)-1 then bijnagelijk:=true else bijnagelijk:=false;
  805.    exit;
  806.  end;
  807. end;
  808.  
  809.  
  810. (Note: De soundex routines van Turbo Power zijn getest, maar bleken niet
  811.        selectief genoeg.)
  812.  
  813.  
  814.  
  815. Als laatste nog iets over de statistische verdeling van woorden:
  816.  
  817. Een populatie van 530000 Nederlandse woorden vertoond de volgende verdeling:
  818.  
  819.  
  820.               X woorden  |      Y
  821.               ---------------------
  822.               1          |      6 %    (Het woord DE)
  823.               5          |     19 %
  824.               10         |     27 %
  825.               50         |     45 %
  826.               100        |     53 %
  827.               1000       |     79 %
  828.               5000       |     96 %
  829.               10000      |     98 %
  830.               18761      |    100 %
  831.  
  832.  
  833.   X is een verzameling van de meest voorkomende woorden uit de populatie.
  834.   Y is het percentage van de populatie van 530000 onderzochte woorden die
  835.   in de verzameling X voorkomen.
  836.  
  837.  
  838. einde
  839.  
  840. Andere programma's
  841.  
  842. Naast Dospell worden er ook andere programma's uitgegeven. De navolgende
  843. lijst van programma's wordt uitgeven als de DO utilities versie DO-92.
  844. Ook dit programma kan vrij doorgegeven worden maar bij langdurig gebruik
  845. wordt een donatie aan de maker gewaardeerd.
  846.  
  847.  The DO utilities contain now:
  848.  
  849. - DO.EXE      version 6.5             First/general program.
  850. - DOE.EXE     version 2.1             DO Executor, with a tree window/menu.
  851. - DOMOVE.EXE  version 1.2             Moves files with disk full check.
  852. - DOCOPY.EXE  version 2.11            Copies + backup only new files.
  853. - DOF.EXE     version 1.7             DO Find utility for LZH,ARC,PAK,ZIP
  854.                                       and ZOO archives and standard files.
  855. - DC.EXE      version 1.0             DO Change directory.
  856. - NO-VGA.COM  version 2.0             Eliminates VGA features of multimode
  857.                                       video adapters.
  858. - DOTEXT.EXE  version 1.0             DO Textmode adjust program.
  859. - DOTIMER.EXE version 1.1             Program to determine elapsed runtime.
  860. - DOCALC.EXE  version 2.4             Scientific calculator.
  861. - DOCALC.DOC                          Dutch doc file for DOCALC.
  862. - DOC.EXE     version 1.13            Scientific calculator. (command line)
  863. - DOCOLOR.EXE version 2.0             Extra for adjusting colors
  864. - DOPASS.EXE  version 1.01            Password protection for the PC.
  865. - DOLOG       version 1.0             Time/date file log utility
  866. - DOM-10.COM  version 1.0             Conversion between ZIP ARC PAK LZH.
  867. - DOCATCH.EXE version 1.0             Catch text from screen.
  868. - DODOS.EXE   version 1.1             Executes DOS instruction with every file
  869.                                       from selected file list.
  870.