home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Vectronix 2
/
VECTRONIX2.iso
/
FILES_01
/
OCR_13B.LZH
/
OCR.13B
/
HELP
/
1STGUIDE
/
TIPS
< prev
next >
Wrap
Text File
|
1994-07-27
|
4KB
|
64 lines
Tips & Tricks
=============
Man sollte immer darauf achten, daß man beim Scannen die gleichen
Scanner-Einstellungen benutzt, mit der auch die Zeichensatz-Datenbank
aufgebaut wurde. Werden andere Einstellungen benutzt kann es
passieren, daß die Zeichen dicker oder dünner ausfallen; das Programm
wird dann Probleme haben, die Zeichen zu erkennen. Falls die
Scan-Vorlagen allerdings sehr unterschiedliche Qualität haben, kann
es dennoch nötig sein, andere Scanner-Einstellungen zu benutzen.
Für jeden unterschiedlichen Zeichensatztyp und für jede Größe sollte
man eine eigene Zeichensatz-Datenbank aufbauen. Dadurch bleiben die
Datenbänke klein. Eine durch viele Zeichensatztypen aufgeblähte
Datenbank verlangsamt den Erkennungsvorgang deutlich. Es ist in
machen Fällen aber trotzdem nicht zu vermeiden, daß man mehrere
Zeichensatztypen in einer Datenbank halten muß (z.B. wenn man oft
Texte bearbeitet, die normale UND kursive Schrift enthalten). Damit
man später noch weiß, welche Zeichensatz-Datei für welche Vorlage
(und Scannereinstellung) geeignet ist, sollte man die Kommentarfelder
in 'Optionen'/'▌Font▌FONT▌' immer gewissenhaft ausfüllen.
Die Scannergebnisse sollten sauber und gleichmäßig sein. Kontrast und
Helligkeit so einstellen, daß mehrere Zeichen nicht zusammenwachsen
aber in den Zeichen selbst keine Lücken entstehen. Zusammengewachsene
Zeichen sind meist unproblematischer als Lücken in den Zeichen
selbst, daher im Zweifelsfall den Scanner etwas dunkler stellen.
Je niedriger die Scannerauflösung, desto weniger Platz benötigen die
Zeichen in der Datenbank. Allerdings besteht bei niedrigen
Scannerauflösungen die Gefahr, daß mehrere Zeichen zusammenwachsen,
daher wird die Erkennung unsicherer. Man muß etwas experimentieren um
die ideale Auflösung zu finden. Wenn der eigene Scanner nur niedrige
Auflösungen zuläßt (z.B. max. 200 dpi), muß man etwas mehr Arbeit und
Geduld investieren um brauchbare Ergebnisse zu erzielen. Man sollte,
bis die Zeichensatzdatenbank relativ komplett ist, mit einer
▌Übereinstimmung▌TERKENN▌ von ca. 90% arbeiten. Es sollten dabei einzelne
Zeichen durchaus mehrfach in der Datenbank aufgenommen werden
(besonders Problemkinder wie 'e' und 'c', 'b' und 'h' oder andere).
Erst wenn alle wichtigen Buchstaben in der Datenbank vorhanden sind,
sollte man die ▌Übereinstimmung▌TERKENN▌ auf niedrigere Werte (75%-85%)
einstellen, damit OCR nicht mehr so oft nachfragt.
Den Grad der ▌Übereinstimmung▌TERKENN▌ beim Vergleich der Zeichen kann man bei
hohen Scannerauflösungen (ab 300 DPI) bzw. guten Scannergebnissen
niedrig einstellen (meistens genügt 75%). Sollten bei der Erkennung
bestimmter Zeichen immer wieder falsch bestimmt werden, sollte man
den Grad der ▌Übereinstimmung▌TERKENN▌ etwas erhöhen. Bei hohem Grad, fragt das
Programm etwas öfter nach.
Möchte man in den Dialogboxen Buchstaben eingeben, die nicht auf der
Tastatur vorhanden sind, benötigt man entweder TOS 2.06/3.06 oder
höher oder MultiTOS (man kann den ASCII-Code, bei gedrückt gehaltener
ALTERNATE-Taste, über den Ziffernblock eingeben) oder Let'em Fly von
Oliver Scheel (Nach betätigen von SHIFT-INSERT erhält man eine
Übersicht über alle möglichen Zeichen) oder COMPOSE von Pascal
Fellerich.
Besitzt man keine Festplatte, sollte man die ▌Klemmbrett▌CLIPBRD▌-Unterstützung
ausschalten (siehe 'Optionen'/'▌Allgemein▌ALLGEM▌').
Auch wenn das Programm ab Version 1.2 (leicht) schräg eingescannte
Vorlagen akzeptiert, sollte man darauf achten, die Vorlagen möglichst
gerade einzuscannen.