Vectronix 2

home *** CD-ROM | disk | FTP | other *** search

/ Vectronix 2 / VECTRONIX2.iso / FILES_01 / OCR_13B.LZH / OCR.13B / HELP / 1STGUIDE / TIPS < prev next >

Wrap

Text File | 1994-07-27 | 4KB | 64 lines

Tips & Tricks ============= Man sollte immer darauf achten, daß man beim Scannen die gleichen Scanner-Einstellungen benutzt, mit der auch die Zeichensatz-Datenbank aufgebaut wurde. Werden andere Einstellungen benutzt kann es passieren, daß die Zeichen dicker oder dünner ausfallen; das Programm wird dann Probleme haben, die Zeichen zu erkennen. Falls die Scan-Vorlagen allerdings sehr unterschiedliche Qualität haben, kann es dennoch nötig sein, andere Scanner-Einstellungen zu benutzen. Für jeden unterschiedlichen Zeichensatztyp und für jede Größe sollte man eine eigene Zeichensatz-Datenbank aufbauen. Dadurch bleiben die Datenbänke klein. Eine durch viele Zeichensatztypen aufgeblähte Datenbank verlangsamt den Erkennungsvorgang deutlich. Es ist in machen Fällen aber trotzdem nicht zu vermeiden, daß man mehrere Zeichensatztypen in einer Datenbank halten muß (z.B. wenn man oft Texte bearbeitet, die normale UND kursive Schrift enthalten). Damit man später noch weiß, welche Zeichensatz-Datei für welche Vorlage (und Scannereinstellung) geeignet ist, sollte man die Kommentarfelder in 'Optionen'/'▌Font▌FONT▌' immer gewissenhaft ausfüllen. Die Scannergebnisse sollten sauber und gleichmäßig sein. Kontrast und Helligkeit so einstellen, daß mehrere Zeichen nicht zusammenwachsen aber in den Zeichen selbst keine Lücken entstehen. Zusammengewachsene Zeichen sind meist unproblematischer als Lücken in den Zeichen selbst, daher im Zweifelsfall den Scanner etwas dunkler stellen. Je niedriger die Scannerauflösung, desto weniger Platz benötigen die Zeichen in der Datenbank. Allerdings besteht bei niedrigen Scannerauflösungen die Gefahr, daß mehrere Zeichen zusammenwachsen, daher wird die Erkennung unsicherer. Man muß etwas experimentieren um die ideale Auflösung zu finden. Wenn der eigene Scanner nur niedrige Auflösungen zuläßt (z.B. max. 200 dpi), muß man etwas mehr Arbeit und Geduld investieren um brauchbare Ergebnisse zu erzielen. Man sollte, bis die Zeichensatzdatenbank relativ komplett ist, mit einer ▌Übereinstimmung▌TERKENN▌ von ca. 90% arbeiten. Es sollten dabei einzelne Zeichen durchaus mehrfach in der Datenbank aufgenommen werden (besonders Problemkinder wie 'e' und 'c', 'b' und 'h' oder andere). Erst wenn alle wichtigen Buchstaben in der Datenbank vorhanden sind, sollte man die ▌Übereinstimmung▌TERKENN▌ auf niedrigere Werte (75%-85%) einstellen, damit OCR nicht mehr so oft nachfragt. Den Grad der ▌Übereinstimmung▌TERKENN▌ beim Vergleich der Zeichen kann man bei hohen Scannerauflösungen (ab 300 DPI) bzw. guten Scannergebnissen niedrig einstellen (meistens genügt 75%). Sollten bei der Erkennung bestimmter Zeichen immer wieder falsch bestimmt werden, sollte man den Grad der ▌Übereinstimmung▌TERKENN▌ etwas erhöhen. Bei hohem Grad, fragt das Programm etwas öfter nach. Möchte man in den Dialogboxen Buchstaben eingeben, die nicht auf der Tastatur vorhanden sind, benötigt man entweder TOS 2.06/3.06 oder höher oder MultiTOS (man kann den ASCII-Code, bei gedrückt gehaltener ALTERNATE-Taste, über den Ziffernblock eingeben) oder Let'em Fly von Oliver Scheel (Nach betätigen von SHIFT-INSERT erhält man eine Übersicht über alle möglichen Zeichen) oder COMPOSE von Pascal Fellerich. Besitzt man keine Festplatte, sollte man die ▌Klemmbrett▌CLIPBRD▌-Unterstützung ausschalten (siehe 'Optionen'/'▌Allgemein▌ALLGEM▌'). Auch wenn das Programm ab Version 1.2 (leicht) schräg eingescannte Vorlagen akzeptiert, sollte man darauf achten, die Vorlagen möglichst gerade einzuscannen.