home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Monster Media 1993 #2
/
Image.iso
/
wp
/
dospel37.zip
/
SPEL_371.ZIP
/
READ-NL.DOC
< prev
next >
Wrap
Text File
|
1993-02-06
|
36KB
|
870 lines
Nieuw Nieuw Nieuw
Update service !!!!!!
Veel mensen kunnen moeilijk aan DOSPELL komen. Ik wil hieraan op de volgende
manier tegemoet komen:
Stuur naar mijn adres een geformatteerde flop, 3½ of 5¼ inch inclusief een
aan je jezelf geadresseerde en gefrankeerde envelop. Dus met postzegels.
Als ik tijd heb (meestal) en niet een maand weg ben (vaak) geen andere
bezigheden heb (komt ook voor) en nog op het zelfde adres woon (Wie weet ?) en
mijn vriendin ze niet weggooid, dan kan je na een maand je eigen envelop met
de nieuwste versie dan DOSPELL in je brievenbus vinden. Het is ook mogelijk
dat je de flop nooit meer terug ziet !
DOSPELL III Documentatie file, September 1992. NL uitvoering. Lees de
voorwaarden in README.DOC
DOSPELL wordt in twee versies uitgebracht:
Versie I (1.09) Voor computers zonder harddisk. Maximum capaciteit
woordenboek 18.000 woorden.
III (3.xx) Voor computers met harddisk. Maximum capaciteit
woordenboek 400.000 woorden.
Inleiding
---------
Het programma DOSPELL kan een Nederlandse en Engelse spelling kontrole
uitvoeren op Extendend-ASCII files en in de resident mode op de scherm inhoud.
Hierdoor kan DOSPELL als een aanvullende spelling kontrole gebruikt worden
bij diverse programma's als de editters Qedit en Ted maar ook bij
tekstverwerkers als Wordstar. In de resident mode werkt DOSPELL in principe
bij elk programma, welke niet in de grafische mode werkt. DOSPELL werkt met de
bekende video kaarten als MDA HGC CGA EGA VGA. Er dient wel voldoende geheugen
ruimte beschikbaar te zijn. In de resident mode gebruikt DOSPELL circa
120 Kbyte geheugen. Voor andere programma's blijft er dan circa 500 Kbyte aan
geheugen over. (640 K machine)
In het Nederlandstalige woordenboek is meestal zowel de oude als de nieuwe
spelling aanwezig. Aan de nieuwe spelling wordt de voorkeur gegeven.
Voorbeeld: Kontrole/controle. Deze c/k spelling is gebaseerd op de Nederlandse
Norm NEN 5050 "Woordenlijst voor bedrijf en techniek" van 1980.
In het Engelstalige woordenboek wordt in principe de UK spelling aangehouden.
Woorden zoals Analyser worden met een S geschreven i.p.v het Amerikaanse
Analyzer. Er is ook een specifiek Amerikaans woordenboek.
Dospell herkent het verschil tussen hoofdletters en kleine letters en kent
de speciale karakters zoals ë, ä, ï,...... en ÿ. Woorden als nederland,
coordineren worden als fout herkend. Als suggestie worden Nederland en
coördineren voorgesteld. Wil je geen verschil zien tussen een o en ö (alt 148)
lees dan hoofdstuk 2.2.
De Nederlandse woordenlijst is afgeleid van 1) Nos Hobbyscoop beeldkranten.
2) Nederlands net news 1 t/m 19
4) Diverse Nederlandse doc files.
Iedereen wordt uitgenodigd om commentaar/aanvullingen op te sturen naar
onderstaand adres. Wil je meehelpen om DOSPELL uit te breiden, lees dan
hoofdstuk 2 van deze documentatie. Aanvullingen op het woordenboek van
10, 20, 100 of meer woorden zijn zeer welkom. Stuur je PERS_DIC op !!
Met dank aan de NOS Hobbyscoop voor de gebruikte Nederlandse Beeldkranten.
J.A.M. Kleijn
Geldersestraat 66
3011 MP Rotterdam.
Inhoud: 0 Beknopt commando overzicht.
1 Gebruik.
1.1 Spelling check ASCII files.
1.2 Resident gebruik in combinatie met andere programma's.
1.3 Omschakelen tussen Nederlands en Engelse woorden boek.
2 Aanvullende informatie.
2.1 Versie woordenboek.
2.2 Woordenboek maken.
2.3 Technische info.
-----------------------------------------------------------------------------
0 Beknopt commando overzicht.
-----------------------------------------------------------------------------
FUNCTIE | KOMMANDO | FUNCTIONELE TOETSEN
--------------------|------------|---------------------------------------------
Resident mode: | SPEL r | ALT-1 = Test scherm inhoud.
| | ALT-2 = Geef suggesties voor woord
| | waar cursor staat. Laad na
| | een keuze het woord in
| | keyboard buffer.
| | ALT-0 = Laad woord op plaats van
| | cursor in woordenboek.
| |
| | I = Ignore/negeer.
| | M = More/meer, laat meer zien.
--------------------|------------|---------------------------------------------
Spelling verbeteren | SPEL FILE | A = Add/laad woord in woordenboek.
van ASCII file: | | I = Ignore/negeer.
| | M = More/meer, laat meer zien.
| | E = Enter, handmatig verbetering.
--------------------|------------|---------------------------------------------
Command line info | SPEL ? |
| |
Opmerking: Het te gebruiken woordenboek kan door middel een parameter
meegeven worden. Bijvoorbeeld: SPEL R UK of SPEL FILE SNEW UK.
-----------------------------------------------------------------------------
1 Gebruik.
-----------------------------------------------------------------------------
DOSPELL kan op twee manieren gebruikt worden:
1) Het op spelling testen en automatisch verbeteren van standaard
ASCII files.
2) Het testen van de beeld inhoud op spelling in elk willekeurig
programma zoals een spreadsheet, editter, tekstverwerker of
database. De woorden kunnen automatisch aangepast worden.
"Voorbereiding"
Als DOSPELL aangeroepen wordt vanuit een andere directory dan moet als
eerste het path naar de woordenboeken aangegeven zijn. Als DOSPELL in de
directory C:\TEXT\DOSPELL is geplaatst tik dan in: SET DOSPELL=C:\TEXT\DOSPELL
Hierdoor is het path voor DOSPELL vastgelegd. Het handigste is natuurlijk
om dit kommando in de autoexec.bat file op te nemen.
-----------------------------------------------------------------------------
1.1 Spelling check ASCII files.
-----------------------------------------------------------------------------
Gebruik voor deze optie het menu of enter direct in DOS:
SPEL FILENAAM (Resultaat komt in file SNEW)
of SPEL FILENAAM NIEUWE-FILENAAM
of SPEL FILENAAM NIEUWE-FILENAAM UK (Gebruik Engels woordenboek)
Als DOSPELL het woord niet vindt, zal er een klein window komen waarin
eventuele suggesties gegeven worden. Dit window geeft de volgende
mogelijkheden:
1,2,3,4,... = Plaats voorstel 1,2,3,4... in de tekst.
M = More, display volgende voorstellen.
I = Ignore, negeer woord door hele tekst, ga door wijzig
niets.
E = Enter handmatig nieuw woord;
A = Add, voeg woord aan woordenboek PERS_DIC toe.
rest = Ignore, negeer woord alleen deze keer.
DOSPELL maakt voor het bepalen van de voorstellen gebruik van twee algoritmen:
1) Bij woorden die een lengte hebben van kleiner of gelijk aan vijf stelt
hij woorden voor die maximaal 1 letter afwijken. Voor de volgende fouten
doet hij het goede voorstel:
Xauto auXto autXo autoX { AXuto niet }
auo aut { uto ato niet }
Xuto auXo autX { aXto niet }
De uitzonderingen zijn nieuw voor versie II van DOSPELL en vanwege de nieuwe
indexering niet geimplementeerd (lastig)
2) Bij woorden met een lengte groter dan vijf kijkt DOSPELL naar de eerste drie
klinkers en de daarop volgende letter. Dit is bijzonder effectief voor
spelfouten door te veel of te weinig letters. Voorbeelden:
Woord Sound-alike
------------ -----------
onmiddellijk ==> onidel
onmidelijk ==> onidel
automatisch ==> auomat
automatish ==> auomat
automatiseren ==> auomat
vergeten ==> ereten
perpeten ==> ereten
contract ==> onac
kontract ==> onac
De gebruikte Pascal routines zijn in hoofdstuk 2.2 technische info toegevoegd.
-----------------------------------------------------------------------------
1.1 Resident gebruik in combinatie met andere programma's.
-----------------------------------------------------------------------------
Gebruik
-------
DOSPELL kan via het menu of direct resident gemaakt worden. Voor dit laatste
enter in DOS:
SPEL r
of SPEL R (geeft toets-klik bij elke toets aanslag)
of SPEL R KLEURNR (Geef attentie kleur aan. Zie tabel)
of SPEL R KLEURNR KEY1 KEY2 KEY3
of SPEL R KLEURNR KEY1 KEY2 KEY3 UK (Gebruik Engels woordenboek)
or SPEL R COLORNR KEY1 KEY2 KEY3 DES1 DES2 DES3 UK.
of SPEL R UK
DES1 betekent beschrijving hotkey1. Bijvoorbeeld F1 of ALT-1.
Het woorden boek wordt geladen en DOSPELL nestelt zich resident in het
geheugen. Dit Kost ongeveer 118 Kbyte. Start hierna een ander programma op.
Bijvoorbeeld een spreadsheet of editter. Via de toets combinatie ALT en 1 of
ALT ! wordt DOSPELL actief en gaat de scherm inhoud op spelling controleren.
Woorden die DOSPELL niet kent worden extra fel of high-lighted weergeven.
Verbeter de woorden en gebruik eventueel weer de Alt 1 combinatie.
Via de toets combinatie ALT 2 of ALT @ geeft DOSPELL voorstellen voor het woord
op de plaats van de cursor. Deze verschijnen in een window boven in het beeld.
Een voorstel kan dan door het intikken van het aangegeven cijfer automatisch
in de tekst ingevoerd worden. DOSPELL plaatst hiervoor het voorstel in het PC
keyboard buffer. De editter/tekstverwerker zal het woord uit het keyboard
buffer overnemen en plaatsen op de plaats van de cursor. Het oude woord wordt
opgeschoven. (indien insert van editter/tekstverwerker aanstaat)
Met behulp van delete kan dan het oude woord worden. Het is daarom handig om
de cursor als eerste precies op de eerste letter van het door alt-2 te testen
woord te plaatsen. Door beperkingen van het PC keyboard buffer is de maximum
woord lengte beperkt tot 15 letters. Langere woorden (max 38) worden
afgebroken. Deze kunnen handmatig aangevuld worden.
* Als het deel van het woord links van de cursor goed gespeld is, dan
zal dit gedeelte niet naar het keyboardbuffer worden toe gezonden.
Voorbeeld: COMPUTTER
-
^
|
| Cursor
Bij selectie van het woord COMPUTER zal alleen "ter" naar het
keyboard geschreven worden. Resulterende in COMPUTERTTER.
Alleen de optie M = More werkt in de resident mode. Indien niet alle
voorstellen in het window passen kan na het indrukken van de letter M de
volgende voorstellen bekeken worden.
Via de toets combinatie ALT-0 of ALT-) kunnen onbekende woorden aan het
persoonlijke woordenboek PERS_DIC toegevoegd worden. Hierbij wordt het
oorspronkelijke path aangehouden waarin DOSPELL in de resident mode is
opgestart.
Attentie kleur bij resident gebruik.
------------------------------------
Als DOSPELL een woord niet in zijn woordenboek kan vinden, wordt het woord
"default" extra fel op het scherm weergegeven. (high-lighted text) Het
programma zet hiervoor bit 3 van de desbetreffende text attribuut. Dit komt
overeen met het getal 8.
Via het menu maar ook direct tijdens een commandlijn start kan een andere kleur
opgegeven worden. Het is wel verstandig nog ongebruikte bits te gebruiken om
te voorkomen dat de normale kleuren ook veranderd worden. Op een blauwe
achtergrond dus niet bit 4 gebruiken. Zie hiervoor de navolgende text attribuut
tabel:
Bit
7 6 5 4 3 2 1 0
---------------
1 . . . . . . . Knipperende tekst.
. 1 . . . . . . Rode component achtergrond.
. . 1 . . . . . Groene component achtergrond.
. . . 1 . . . . Blauwe component achtergrond.
. . . . 1 . . . Intensiteit tekst.
. . . . . 1 . . Rode component tekst.
. . . . . . 1 . Groene component tekst.
. . . . . . . 1 Blauwe component tekst.
Bijvoorbeeld: 2 tot de macht 6 = 64 geeft een rode achtergrond.
2 ,, 7 = 128 geeft knipperende woorden.
Deze kunnen via de instructie: SPEL r 64 of SPEL r 128 geladen
worden.
Na resident geladen te zijn, kan DOSPELL niet zondermeer verwijderd worden.
Alleen door resetten van de computer, of door utilities zoals mark en release
van Turbopower kan DOSPELL uit het geheugen verwijderd worden. Het testen van
het type videokaart gebeurt eenmalig tijdens het laden.
Actieve toetsen
-------------
Default toetsen voor de resident mode zijn alt-1, alt-2 en alt-0. Deze kunnen
aangepast worden door in de commandlijn nieuwe scan-codes mee te geven:
SPEL R [color] [KEY1] [KEY2] [KEY0] [Taal]
KEY1 komt i.p.v. alt-1, key2 voor alt-2, key0 voor alt-0. De scan codes
van het keyboard kunnen kunnen met het bijgeleverde programma readkey bepaald
worden. Alleen de scan-codes die als karakter kode een nul geven (decimaal kode)
kunnen gebruikt worden.
Voorbeeld: SPEL R 8 59 60 68
Hiermee worden alt-1, alt-2 en alt-0 vervangen door de functie toetsen
F1, F2 en F10. Color 8 is gelijk aan de default color.
-----------------------------------------------------------------------------
1.3 Omschakelen tussen Nederlands en Engelse woorden boek.
-----------------------------------------------------------------------------
Via het menu is het mogelijk om om te schakelen tussen de verschillende
talen. De "default" is het NL of Nederlandse woordenboek. Via het programma
INSTALL.EXE is de "default" op een ander taal/woordenboek te zetten. De
woordenboeken bestaan uit vier files. Bijvoorbeeld het Nederlandse woordenboek:
MAIN_DIC.NL
MAIN_IND.NL
RAM_DIC.NL
PERS_DIC.NL
Via de extensie wordt de taal aangegeven.
Hiernaast kan in de commandolijn direct de taal meegegeven worden.
Voorbeelden resident mode: SPEL R 8 59 60 68 UK
SPEL R 8 UK
SPEL R UK
Voorbeeld ASCII mode: SPEL FILE SNEW UK
-----------------------------------------------------------------------------
2 Aanvullende informatie.
-----------------------------------------------------------------------------
Een goed woordenboek maken kost tijd. Een gevarieerde inbreng van andere
mensen helpt. Wil je meehelpen om voor DOSPELL grotere woordenboeken te
maken, gebruik dan de add optie van DOSPELL.EXE op de tekstfiles in je bezit.
Test e.v.t het resultaat ( PERS_DIC ) met een tekstverwerker en zend het
resultaat met vermelding naam oorspronkelijke tekstfile of soort tekst naar:
Han kleijn
Geldersestraat 66
3011 MP Rotterdam
Nederland.
-----------------------------------------------------------------------------
2.1 Versie woordenboek.
-----------------------------------------------------------------------------
Vanaf versie 3.70, bevat de indexfile MAIN_IND een type nummer. De
indeling van het woordenboek is veranderd. Hierdoor worden compatibiliteits
problemen voorkomen.
Indien het programma een fout melding geeft:
Not type 2 MAIN_IND file, ==> 1) Gebruik nieuwer woordenboek.
of 2) Export dictionary naar E-ASCII, sorteer
met SORTBIG.BAT en SPEL-S tot minstens
level 3 maar beter tot 30. Maak van de
gesorteerde file met het behulp van het
nieuwe SPEL.EXE programma een nieuw
woordenboek.
(Note in type 2 worden de niet ASCII letters anders ingedeeld.)
-----------------------------------------------------------------------------
2.2 Woordenboek maken.
-----------------------------------------------------------------------------
Het woordenboek van DOSPELL bestaat maximaal uit drie delen. Het
hoofdwoordenboek MAIN_DIC met index file MAIN_IND, het woordenboek
RAM_DIC met de meest voorkomende woorden en als laatste een standaard ASCII
file genaamd PERS_DIC. Deze bevat de persoonlijk toegevoegde woorden.
RAM_DIC, MAIN_IND EN PERS_DIC worden bij het opstarten in het
geheugen geladen.
Als DOSPELL een woord test, dan zoekt hij als eerste in het in geheugen
geladen RAM_DIC. Hierin bevinden zich circa 2000 van de meest voorkomende
woorden. Vindt hij het woord niet, dan gaat hij verder zoeken in PERS_DIC en
MAIN_DIC. Is het woord nog niet gevonden dan wordt een voorstel gedaan uit
MAIN_DIC met behulp van zogenaamde sound alike routines. Zie 2-2.
Na het toevoegen van woorden via de add of alt-0 optie, komen de woorden
in PERS_DIC terecht. Deze kan maximaal circa 17 Kbyte groot worden. Met het
bijgeleverde RAM_DIC van 15 Kbyte deelt hij namelijk het 32 Kbyte Ram
geheugen.
Als PERS_DIC erg groot wordt, zal dit de snelheid het programma verlagen.
Is het buffer helemaal vol dan wordt er een waarschuwing gegeven. PERS_DIC
kan bij MAIN_DIC worden toegevoegd. Dit kan het beste met de AM optie
of optie 1 in het "Dictionary Maintenance" menu.
Met deze optie kan een ongesorteerde ASCII file toegevoegd worden aan het
MAIN_DIC. Het is wel zaak dat de toe te voegen ASCII file gecontroleerd
is op de spelling. Na het toevoegen of "adden" is het MAIN_DIC definitief
gewijzigd. Via deze optie kunnen files van maximaal 32 Kbyte - (size DO-RAM)
toegevoegd worden. Eventueel kan het in gedeeltes door de file te splitsen.
De routine is bijzonder tolerant. De lengte van de regels in de toe te voegen
file mogen maximaal 255 characters lang zijn en de woorden mogen door mekaar
staan. Er moet alleen een return of een spatie tussen de woorden staan. Tijdens
het toevoegen worden woorden die al in MAIN_DIC staan genegeerd.
Doubleringen zijn hierdoor niet mogelijk.
Hiernaast bestaat er nog de oudere methode via SPEL-S. Gebruik deze
alleen bij grote files. D.w.z groter dan 20 K byte. Het toevoegen gaat als
volgt:
Schrijf MAIN_DIC naar een standaard ASCII file. (zie Menu) Voeg daarna
PERS_DIC toe aan deze file met behulp van een tekst verwerker of het COPY
commando. Het DO-MAIN woordenboek is dan niet meer gesorteerd en dient met
het sorteer programma SPEL-S gesorteerd te worden tot minimaal 3 letters diep
maar liever tot 30 diep of meer. Dit kost er veel tijd (Uren) * en gaat het
beste in een ram disk, zoals te kreëren met de standaard DOS file VDISK.SYS.
De woorden komen precies in alfabetische volgorde. Het sorteren tot 30 of meer
heeft het voordeel dat het woordenboek later door DOSPELL tot 40 % gepakt kan
worden. Via het menu kan het ASCII eindresultaat weer omgevormd worden tot een
compact en geïndexeerd woordenboek.
Voorbeeld maken ram disk: In config.sys DEVICE=\DOS\VDISK.SYS 480
Dit geeft een ram disk van 480 Kbyte en de drive letter wordt D: (als de
laatste drive C: is) Na het maken van de ram disk blijft er erg weinig ruimte
over voor andere programma's. Houdt eventueel een bootable floppy bij de hand
om de computer weer op te starten. Start de ram disk e.v.t op vanaf een DOS
floppy. Het sorteren gebruikt tot 2.5 maal de ASCII file size aan ruimte. Deze
kan optimaal benut worden door vanuit de ram disk de te sorteren ASCII file op
de harddisk aan te roepen.
Voorbeeld: Vanuit D: drive D:\>c:spel-s c:ned 35
Als het woordenboek te groot wordt voor de ram disk, gebruik dan de optie
van SPEL-S om alleen de buffers op de ram disk te plaatsen. Bij een ram disk
van 480 kbyte kunnen dan op een AT meer dan 40.000 woorden in een uur
gesorteerd worden. Is de lijst nog steeds te groot, gebruik dan een batch
file zoals de bijgevoegde SORTBIG.BAT.
* Een disk cache zoals SMARTDRV.EXE van windows 3.1 geeft een zeer grote
performance verbetering.
Het RAM_DIC hoeft in principe niet veranderd te worden. Wil men toch
(andere taal) een nieuw PERS_DIC maken, dan kan het beste gestart worden met
het programma LEARN.EXE. Dit programma verzamelt woorden van tekstfiles en
houdt tevens de frequentie van voorkomen bij. Hierdoor zullen in het begin van
de "eindresultaat file" de meest voorkomende woorden vooraan staan, zoals:
DE HET EEN ...
Als er nog geen PERS_DIC bestaat, gaat het als volgt:
Zorg dat je eerste een zo groot mogelijk aantal gevarieerde (Nederlands-
talige ) ASCII file(s) heb. Enige honderden Kbytes om enige duizenden
woorden te verzamelen. Zet alle files in een directory, bijvoorbeeld
\NEDER. Start het programma als volgt op:
LEARN \NEDER\*.*
De woorden zullen verzameld worden in de file LEARN.LLL. Dit kan enige uren
duren. Hierna kan het resultaat met een tekstverwerker gecontroleerd worden.
Bewaar de LEARN.LLL file. Zodra LEARN.EXE weer opgestart wordt, zal deze
LEARN.LLL weer geladen worden. Om snelheid te winnen kan het verstandig zijn
het verzamelen van woorden in een aantal stappen te doen. Doordat de woorden
na elke stap in LEARN.LLL gesorteerd worden, zullen de navolgende files
sneller verwerkt worden.
Als alle woorden voldoen aan de (Nederlandse) spelling kunnen ze gebruikt
worden in DOSPELL. Maak uit LEARN.LLL een nieuwe file met circa 2000 van de
meest voorkomende woorden en bouw via het menu in DOSPELL van deze file een
een nieuwe RAM_DIC.
Belangrijk: De hoofdletter informatie gaat verloren in RAM_DIC en
PERS_DIC. Verwijder daarvoor alle woorden met hoofdletters zoals
landen namen en eigen namen uit RAM_DIC.
(Note: Het programma kan iets sneller gemaakt worden, door woorden waarvan de
eerste drie letters zeer veel voorkomen, zoals "VER" => VERZAMELEN,
VERZOEKEN toe te voegen aan de ram disk. DOSPELL heeft voor deze woorden
de langste (DISK) zoek tijd.)
-----------------------------------------------------------------------------
2.3 Technische info.
-----------------------------------------------------------------------------
De file RAM_DIC bevat de index van 26 posities die aangeeft waar woorden
beginnen met letter A, B,..... en alle woorden in ASCII. De woorden worden
vooraf gegaan door de lengte. De file bevat geen harde enter.
De file MAIN_DIC begint als eerste met een veld van 100 bytes voor niet
essentiële info en bevat daarna een lijst met de woorden op alfabetische
volgorde. Doordat de woorden alfabetisch gesorteerd zijn is er een compressie
methode mogelijk die bijzonder effectief is tot 37 % van de oorspronkelijke
file lengte. Deze compressie methode is er op gebaseerd dat opeenvolgende
woorden er op mekaar lijken. Bijvoorbeeld: COMPUTER EN COMPUTERS. Wordt het
woord computer vastgelegd dan kan daarna computers vastgelegd worden door 7S.
Dit betekend 7 letters van het voorgaande woord plus S.
Voorbeeld: AANBAKT AANBAKTE AANBAKTEN AANBEDEN ==> AANBAKT6E7N4EDEN
De hoofdletter informatie wordt in een byte achter het woord opgeslagen. In
geval character 169 betekend dat de eerste letter een hoofdletter was. Een
character 170 betekend alle letters hoofdletter.
Dospell kan momenteel een MAIN_DIC file aan van 64 Kbyte * 32, ongeveer
2 Mbyte. Dat zijn meer dan 400.000 woorden. Als dit niet genoeg is, stuur dan
een berichtje, dan pas ik het aan voor het dubbele.
Opbouw output LEARN.EXE:
130045 <= totale onderzochte populatie.
----------
10022 DE <= "DE" 10022 keer gevonden.
3765 IS <= "IS" 3765 keer gevonden.
3217 VAN
3214 HET
2801 EN
2657 EEN
2194 OP
1797 MEI
..... ...
Draag er zorg voor, dat na het op spelling testen/wijzigen van LEARN.LLL dat
alle woorden op plaats 7 of verder in de regels beginnen !.
Automatisch woord correctie in resident mode:
DOSPELL laad de woorden in het zogenaamde key board buffer van de bios.
Dit is normaal geplaatst vanaf adres $0040:001E met een lengte van 15+1
"words". DOSPELL zet als eerste de buffer start pointer = $0040:001A naar
het begin van het buffer, schrijft de woorden weg en plaatst de eind
pointer= $0040:001C op de eind positie van het buffer.
Dospell reageert op twee keyboard interrupts, int $16, AH = $0 en int $16,
AH = $10.
Resident controle:
DOSPELL kontroleert via interrupt 11h of DOSPELL al reeds in het geheugen
geladen is. Via het geven van een interrupt 11h en register CX=$0059
(CX wordt normaal niet gebruikt) wordt gecontroleerd of interrupt 11h
reeds is omgeleid.
Hoofdletters:
Is de eerste letter van een woord een hoofdletter, dan neemt DOSPELL dit
over in de correctie. Is ook de laatste letter een hoofdletter, dan wordt het
gehele woord met hoofdletters gecorrigeerd.
Bij de spelling kontrole wordt rekening gehouden met hoofdletters van landen
namen en personen. B.v. voor het woord rotterdam wordt als korrekte spelling
Rotterdam aangeven. Als echter nieuwe woorden aangeleerd worden via de add
optie dan gaat de hoofdletter informatie verloren. Hier is voor gekozen daar
het moeilijk is aan te geven of het nieuwe woord de hoofdletter heeft van het
begin van de zin of door de schrijfwijze. Wordt het woord Rommeldam aan
geleerd dan wordt de spelling met en zonder hoofdletter geaccepteerd.
Om deze redenen zijn in versie III alle woorden met hoofdletters zoals
Europa, Nederland (circa 30) uit het RAM_DIC woordenboek verwijderd.
Dit om fouten via het RAM_DIC woordenboek te voorkomen.
Letter y,ij en ÿ:
Dospell maakt onderscheid tussen twee schrijfwijzen: 1) ij, IJ of ÿ
2) y en Y
Speciale characters:
Sinds versie III worden de speciale letters als ö herkend. Wil je dat niet, dan
kan je het woordenboek ombouwen via de export functie van DOSPELL.
In commandlijn commando's:
DOSPELL eM temp { e in kleine letter, M hoofdletter om in standaard-ASCII te exporteren}
DOSPELL CM temp { Maak opnieuw woordenboek van temp}
DEL temp
Haal eventueel ook de characters uit RAM_DIC weg.
Woorden die beginnen met een speciaal character worden geplaatst onder de "x".
DOSPELL maakt van gebruik van de volgende tabellen om ongewenste characters
weg te filteren en woorden in te delen:
letter2 : array[0..255] of char=(
#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,
#96,#96,#96,#96,#96,#96,#96,#96,#96,#96,'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x',
'x','x','x','x','x','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y',
'z','x','x','x','x','x',#96,'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w',
'x','y','z','x','x','x','x','x','x','u','e','a','a','a','a','x','e','e','e','i','i','i','a','a','e','a','a','o','o','o',
'u','u','y','o','u','x','x','x','x','x','a','i','o','u','n','n','x','x','x',#96,#96,'x','x','x','x','x','x','x','x','x',
'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','x',
'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x','b','x','x','x','x','x','x','x','x','x','x','x','x','x','x',
'x','x','x','x','x','x','x','x','x','x','x','x','x','x','x',#96);
letter : array[0..255] of char=(
'*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
'*','*','*','*','*','*','*','*','*',#39,'*','*','*','*','*','-','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
'<','*','>','*','*','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y',
'z','*','*','*','*','*','*','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w',
'x','y','z','*','*','*','*','*','ç','ü','é','â','ä','à','å','ç','ê','ë','è','ï','î','ì','ä','å','é','æ','æ','ô','ö','ò',
'û','ù','ÿ','ö','ü','ç','£','¥','₧','ƒ','á','í','ó','ú','ñ','ñ','ª','º','¿','*','*','½','¼','¡','*','*','*','*','*','*',
'*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
'*','*','*','*','*','*','*','*','*','*','*','*','*','*','α','ß','Γ','π','Σ','σ','µ','τ','Φ','Θ','Ω','δ','∞','φ','ε','∩',
'*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*');
Deze laatste tabel kan met INSTALL.EXE uitgebreid worden.
ASCII file:
Hieronder wordt verstaan een file met een harde enter of carriage return
(Karakter 13) en line feed (Karakter 10). Een regel mag 254 karakters 1)
lang zijn, maar bij een lengte van 160 of meer zal de inverse weergave van
DOSPELL niet meer correct werken.
1) Versie 3.70 en later kunnen een regellengte van 255 of langer aan.
De gebruikte klank of sound alike routines:
FUNCTION KLANK(zoek:string):string; {zoek downcase}
{bepaald klank, d.w.z. klinkers plus volgend letter}
{voorbeeld automaten wordt auomat}
{ mogelijkheid wordt ogelij}
{ vernederen ereder}
{ verwijderen erijer}
{ kado ado***}
{ kados ados**}
{ salade aladen}
{ salades aladen}
const
soundt : array[39..166] of char=(
'*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*','*',
'*','*','*','*','*','a','*','*','*','e','*','*','*','i','*','*','*','*','*','o','*','*','*','*','*','u','*','*','*','y',
'*','*','*','*','*','*','*','a','*','*','*','e','*','*','*','i','*','*','*','*','*','o','*','*','*','*','*','u','*','*',
'*','y','*','*','*','*','*','*','*','u','e','a','a','a','a','*','e','e','e','i','i','i','a','a','e','*','*','o','o','o',
'u','u','y','o','u','*','*','*','*','*','a','i','o','u','n','n','*');
{Neem alleen de letters A,E,I,O,U en Y mee en vervang ë en ÿ... door E, Y...}
var
l,m : byte;
w : char;
begin { MADE FOR SPEEEEEED ! }
l:=1;
m:=1;
klank:='******';
zoek[0]:=succ(zoek[0]);{snelle manier voor zoek:=zoek+'*'}
zoek[ord(zoek[0])]:='*'; {DUMMY}
repeat
w:=soundt[ord(zoek[L])];
if w<>'*' then
begin
klank[m]:=w;
inc(l);
klank[m+1]:=zoek[L];
inc(m,2);
if m>6 then
begin
if ((zoek[L]='*') or (zoek[L]='s')) then
klank[6]:='n';
{maak standaard meervoud bij lange lengten}
exit;
end;
end;
inc(L);
until L>length(zoek);
end;
FUNCTION BIJNAGELIJK(ZOEK:string;ref:string):boolean;{ref=referentie, zoek is het gevonden woord}
var i,eq : byte;
tussen : string[39]; {voorbeeld ref:=some} {bijna gelijk voor zoek:=..}
begin
ref[1]:=letter2[ord(ref[1])]; {downcase ref voor geval bv Indië}
if length(zoek)<length(ref) then {som,soe,sme,ome}
begin
zoek[length(zoek)+1]:=' ';
i:=0;
repeat
inc(i)
until ((zoek[i]<>ref[i]) or (i>length(zoek)));
delete(ref,i,1);
if zoek=ref then
bijnagelijk:=true
else bijnagelijk:=false;
exit;
end
else
if length(zoek)>length(ref) then {*some,s*ome,so*me,.....}
begin
ref[length(ref)+1]:=' ';
i:=0;
repeat
inc(i)
until ((zoek[i]<>ref[i]) or (i>length(ref)));
delete(zoek,i,1);
if zoek=ref then bijnagelijk:=true else bijnagelijk:=false;
exit;
end
else
begin {lengte equal} {Xome,sXme,soXe,somX}
eq:=0;
for i:=1 to length(zoek) do if zoek[i]=ref[i] then inc(eq);
if eq>=length(ref)-1 then bijnagelijk:=true else bijnagelijk:=false;
exit;
end;
end;
(Note: De soundex routines van Turbo Power zijn getest, maar bleken niet
selectief genoeg.)
Als laatste nog iets over de statistische verdeling van woorden:
Een populatie van 530000 Nederlandse woorden vertoond de volgende verdeling:
X woorden | Y
---------------------
1 | 6 % (Het woord DE)
5 | 19 %
10 | 27 %
50 | 45 %
100 | 53 %
1000 | 79 %
5000 | 96 %
10000 | 98 %
18761 | 100 %
X is een verzameling van de meest voorkomende woorden uit de populatie.
Y is het percentage van de populatie van 530000 onderzochte woorden die
in de verzameling X voorkomen.
einde
Andere programma's
Naast Dospell worden er ook andere programma's uitgegeven. De navolgende
lijst van programma's wordt uitgeven als de DO utilities versie DO-92.
Ook dit programma kan vrij doorgegeven worden maar bij langdurig gebruik
wordt een donatie aan de maker gewaardeerd.
The DO utilities contain now:
- DO.EXE version 6.5 First/general program.
- DOE.EXE version 2.1 DO Executor, with a tree window/menu.
- DOMOVE.EXE version 1.2 Moves files with disk full check.
- DOCOPY.EXE version 2.11 Copies + backup only new files.
- DOF.EXE version 1.7 DO Find utility for LZH,ARC,PAK,ZIP
and ZOO archives and standard files.
- DC.EXE version 1.0 DO Change directory.
- NO-VGA.COM version 2.0 Eliminates VGA features of multimode
video adapters.
- DOTEXT.EXE version 1.0 DO Textmode adjust program.
- DOTIMER.EXE version 1.1 Program to determine elapsed runtime.
- DOCALC.EXE version 2.4 Scientific calculator.
- DOCALC.DOC Dutch doc file for DOCALC.
- DOC.EXE version 1.13 Scientific calculator. (command line)
- DOCOLOR.EXE version 2.0 Extra for adjusting colors
- DOPASS.EXE version 1.01 Password protection for the PC.
- DOLOG version 1.0 Time/date file log utility
- DOM-10.COM version 1.0 Conversion between ZIP ARC PAK LZH.
- DOCATCH.EXE version 1.0 Catch text from screen.
- DODOS.EXE version 1.1 Executes DOS instruction with every file
from selected file list.