home *** CD-ROM | disk | FTP | other *** search
/ Vectronix 2 / VECTRONIX2.iso / FILES_07 / OCR_13B.ZIP / OCR.13B / DOCS / OCR.DOC < prev    next >
Text File  |  1994-09-20  |  53KB  |  1,112 lines

  1. OCR V1.3 (August 1994)
  2.  
  3.     ein Texterkennungs-Programm für  ATARI ST/STE/TT/Falcon
  4.     von Alexander Clauss, Stresemannstr. 44, D-64297 Darmstadt
  5.  
  6.  
  7.  
  8. Dieses  Programm  ist  FREEWARE.  Es  darf  kostenlos  kopiert  und benutzt
  9. werden.  Eine  Verbreitung  über  Mailboxen,  FTP-Server  und PD-Serien ist
  10. erlaubt.   Eine   Verbreitung  auf  CD-ROMs  und  auf  Cover-Disketten  von
  11. Zeitschriften  ist  NUR  mit  meiner schriftlichen Genehmigung erlaubt. Das
  12. Programm  muß  immer  komplett weitergegeben werden (siehe LIESMICH Datei).
  13. Das Verändern des Programms und der Anleitung ist nicht gestattet.
  14.  
  15. Wenn  Ihnen  das  Programm  gefällt und Sie es regelmäßig benutzen, sollten
  16. Sie  dem  Autor  eine  (freiwillige)  Spende (ca. 20-30 DM) zukommen lassen
  17. oder  mir  zumindest eine Postkarte oder eine Nachricht per email schicken,
  18. damit ich weiß, ob überhaupt Interesse an diesem Programm besteht.
  19.  
  20.  
  21. Neue  Versionen  gibt  es  direkt vom Autor (bitte Diskette und ausreichend
  22. frankierten Rückumschlag schicken), über FTP-Server oder Mailboxen.
  23.  
  24. z.B.:  ftp.uni-kl.de (/pub/atari/misc) oder
  25.        ftp.isbiel.ch (atari/diverses)  oder
  26.        in vielen Mailboxen des Mausnetzes.
  27.  
  28. Wer  eine  Email-Adresse  hat und sie mir mitteilt, bekommt eine Nachricht,
  29. wenn  es  eine neue Version von OCR gibt. Wer keine email-Adresse hat, kann
  30. mir   auch  einen  frankierten  Rückumschlag  (bzw.  eine  an  sich  selbst
  31. adressierte   Postkarte)   schicken.   Diejenigen   werden  dann  per  Post
  32. benachrichtigt.
  33.  
  34. Für  Benutzer  in  England  gibt  es  noch eine andere Möglichkeit, um neue
  35. Programmversionen  (Updates)  zu  erhalten.  Nähere Informationen stehen in
  36. der englischen Anleitung (OCR_E.DOC).
  37.  
  38.  
  39. WICHTIG:
  40. Ich   bin   natürlich   auch  an  Fehlermeldungen  und/oder  Verbesserungs-
  41. vorschlägen  interessiert.  Bei  Fehlermeldungen  bitte  immer  Rechnertyp,
  42. TOS-Version,  Autoordner-Programme  und  Accessories angeben. Wenn möglich,
  43. bitte genau beschreiben, wie man den Fehler reproduzieren kann.
  44.  
  45. Konstruktive   Kritik   und   Vorschläge   für  zukünftige  Versionen  sind
  46. ausdrücklich erwünscht!!!
  47.  
  48. WICHTIG:
  49. Ich  bitte,  bei  Anfragen  per  Post  immer  auch  einen  frankierten  und
  50. adressierten   Rückumschlag  beizulegen  wenn  Sie  eine  Antwort  von  mir
  51. erwarten.
  52.  
  53.  
  54. Meine Adresse
  55. -------------
  56.   Alexander Clauss
  57.   Stresemannstraße 44
  58.   D-64297 Darmstadt
  59.  
  60. email: aclauss@rbg.informatik.th-darmstadt.de
  61.  
  62. (Wer  mich  über  die email-Adresse nicht (oder nicht mehr) erreichen kann,
  63. sollte es über die Post-Anschrift versuchen!)
  64.  
  65.  
  66. Bankverbindung
  67. --------------
  68.   Sparkasse Darmstadt
  69.       BLZ: 508 501 50
  70.   Kontonr: 0115032143
  71.  
  72. Geben Sie bitte auf der Überweisung Ihre Adresse und als Verwendungs-
  73. zweck 'OCR'+Versionsnummer an.
  74.  
  75.  
  76.  
  77.  
  78. System-Voraussetzungen
  79. ======================
  80. Dieses  Programm  läuft  auf  allen  ATARI  ST/STE/TT/Falcon  Computern. Es
  81. funktioniert  in  jeder  Grafikauflösung mit mindestens 496x200 Punkten und
  82. beliebiger  Farbtiefe.  500  KBytes Speicher reichen aus, allerdings können
  83. dann  keine  größeren  Bilder  eingeladen werden. Zum vernünftigen Arbeiten
  84. sollten  daher  mind. 2 MByte - besser noch mehr - Speicher vorhanden sein.
  85. Einen (Handy-)Scanner benötigt man natürlich auch.
  86.  
  87.  
  88.  
  89.  
  90. Kurze Übersicht
  91. ===============
  92. Das   Programm  kann  Texte  in  eingescannten  Bildern  erkennen  und  als
  93. ASCII-Texte   speichern,   die   dann  mit  einem  Editor  bzw.  mit  einer
  94. Textverarbeitung weiterverarbeitet werden können.
  95.  
  96. Für schwer erkennbare Zeichen können Korrekturregeln definiert werden.
  97.  
  98. Für   verschiedene   Schrifttypen   können   eigene  Zeichensatz-Datenbänke
  99. angelegt werden.
  100.  
  101. Für  Bilder  aus  Zeichenprogrammen  (die  Texte wurden mit dem System- bzw
  102. einem  GDOS-Zeichensatz  geschrieben)  besitzt das Programm einen separaten
  103. Modus in dem besonders wenig Rechenzeit verbraucht wird.
  104.  
  105.  
  106.  
  107. Erklärung der Programmfunktionen
  108. ================================
  109. Die  Menüfunktionen  können  fast  alle  auch  mit  der  Tastatur ausgelöst
  110. werden.   Die   entsprechenden  Tastaturkommados  werden  im  Folgenden  in
  111. Klammern angegeben.
  112.  
  113.  
  114. Programmstart
  115. =============
  116. Werden  beim  Programmstart  Dateinamen  in der Kommandozeile übergeben, so
  117. werden  diese  Dateien  automatisch  geladen. Dies gilt für Dateien mit der
  118. Extension   .IMG   (Bilder),   .LIB   (Zeichensatz-Datenbänke)   und   .KOR
  119. (Korrekturregeln)).   Es   können  mehrere  Dateien  in  der  Kommandozeile
  120. angegeben  werden,  allerdings  wird  von  jedem  Dateityp (Bild, Datenbank
  121. etc.) immer nur die letzte angegebene geladen.
  122.  
  123.  
  124. Dialoge
  125. =======
  126. Alle Dialoge des Programms  können in Fenster verlegt werden,  damit sie in
  127. einer Multitasking-Umgebung die Ausgabe anderer Programme nicht blockieren.
  128.  
  129. Die Dialoge können auch mit der Tastatur bedient werden. Der OK-Button kann
  130. mit RETURN oder ENTER  und der 'Abbruch'-Button mit UNDO ausgewählt werden.
  131. In allen Buttons,  die mit  der Tastatur ausgewählt werden können,  ist ein 
  132. Buchstabe des Textes unterstrichen.  Diese Buttons werden ausgewählt,  wenn
  133. man diesen  unterstrichenen  Buchstaben  zusammen  mit der  ALTERNATE-Taste 
  134. drückt.
  135.  
  136. Hat ein Dialog  EDIT-Felder (Felder zur Texteingabe)  kann man durch  Druck 
  137. auf  die  INSERT-Taste eine  Box aufrufen,  in der  man mit  der Maus  alle 
  138. Zeichen des ATARI Zeichensatzes auswählen kann (auch die, die nicht auf der 
  139. Tastatur vorhanden sind).
  140.  
  141. Dialoge  kann man verschieben, indem man auf den Hintergrund klickt und mit
  142. gedrückt   gehaltener  Maustaste  die  neue  Position  festlegt.  Hält  man
  143. zusätzlich  noch eine SHIFT-Taste gedrückt, wird der Dialog unsichtbar (nur
  144. der  Rahmen  ist  sichtbar),  um  'hinter'  den  Dialog zu sehen zu können.
  145. Fenster-Dialoge  können,  wie  bei  Fenstern  üblich,  mit dem  Titelbalken
  146. verschoben werden.
  147.  
  148.  
  149. Fenster
  150. =======
  151. Folgende Tastatureingaben beziehen sich auf die Fenster:
  152.   CTRL-U   Oberstes Fenster schließen.
  153.   CTRL-*   Das oberste Fenster  wird auf die volle Größe gebracht, wenn  es
  154.            schon  diese Größe hat,  wird  es auf  die  ursprüngliche  Größe
  155.            gebracht.
  156.   CTRL-W   Wechselt  das aktive  Fenster.  (Das untere Programmfenster wird
  157.            zum obersten und umgekehrt)
  158.  
  159.   Cursortasten   Verschiebt den Fensterinhalt in die entsprechende Richtung
  160.                  zeilenweise.
  161.   SHIFT-Cursor   Verschiebt den Fensterinhalt seitenweise.
  162.  
  163. Positioniert  man  die Maus über das oberste Fenster, kann man mit gedrückt
  164. gehaltener  rechter(!)  Maustaste den Fensterinhalt verschieben (drückt man
  165. zusätzlich eine SHIFT-Taste, wird schneller gescrollt).
  166.  
  167.  
  168. Bild-Fenster
  169. ------------
  170. Hier  wird  das  eingeladene  bzw.  eingescannte  Bild  angezeigt. Da diese
  171. Bilder  oft  sehr  groß sind, kann man das Bild verkleinert anzeigen lassen
  172. (siehe Bildgröße).
  173. Man  kann einen Block in diesem Fenster markieren, indem man mit gedrückter
  174. Maustaste  eine  Box  aufzieht. Wenn der Block nicht ganz korrekt definiert
  175. wurde,  kann man diesen auch nachträglich ändern. Man positioniert die Maus
  176. über  eine  der  acht kleinen Boxen auf der Blockmarkierung; jetzt kann man
  177. mit gedrückter Maustaste die Blockgrenzen ändern.
  178.  
  179. Blöcke  kann  man  löschen;  dies ist wichtig um Linien, Bilder oder andere
  180. Bereiche zu eliminieren, die nicht als Text erkannt werden können.
  181.  
  182. Wenn  ein  Block  markiert  wurde, wird bei der Erkennung nur der markierte
  183. Bereich  betrachtet;  dies  ist  notwendig,  wenn  man  mehrspaltige  Texte
  184. bearbeiten will (Jede Spalte muß einzel markiert und erkannt werden).
  185.  
  186.  
  187. Text-Fenster
  188. ------------
  189. Hier wird der erkannte Text ausgegeben.
  190.  
  191. Auch  in  diesem  Fenster  kann  man  einen Block markieren. Mit gedrückter
  192. Maustaste  überfährt  man  mit  der  Maus,  den  gewünschten  Bereich. Alle
  193. markierten  Text-Zeilen  werden  invertiert  ausgegeben.  Hält man eine der
  194. SHIFT-Tasten  gedrückt,  bevor  man, wie oben erklärt, den Block definiert,
  195. wird  ein  eventuell schon markierter Block bis zur Mausposition vergrößert
  196. bzw. verkleinert.
  197.  
  198. Text-Blöcke  kann  man  löschen und/oder ins Klemmbrett kopieren, auf diese
  199. Weise  ist  eine  einfache  Übernahme des Textes zu anderen Programmen (die
  200. das Klemmbrett unterstützen) möglich.
  201.  
  202.  
  203.  
  204. OCR-Menü
  205. ========
  206.  
  207. Programminfo
  208. ------------
  209. Informationen über das Programm.
  210.  
  211.  
  212.  
  213. Datei-Menü
  214. ==========
  215.  
  216. Bild laden  (CTRL-O)
  217. --------------------
  218. Läd  ein  Bild  im IMG-Format (nur monochrom). Falls sich schon ein Bild im
  219. Speicher  befindet,  das verändert wurde, erscheint ein Warnhinweis und man
  220. hat dann folgende Möglichkeiten:
  221.  
  222.   Speichern:  Bevor  das  neue  Bild  geladen  wird,  wird  das  alte  Bild
  223.               gespeichert.
  224.   Laden:      Das neue  Bild wird geladen  (die Änderungen des alten Bildes
  225.               gehen verloren).
  226.   Abbruch:    Die ganze Aktion wird abgebrochen.
  227.  
  228. Bild speichern (SHIFT-CTRL-S)
  229. -----------------------------
  230. Speichert das im Speicher befindliche Bild im IMG-Format.
  231.  
  232. Bild scannen (CTRL-R)
  233. ---------------------
  234. Hiermit  kann  man  einen  Text einscannen. Dazu muß aber ein GDPS-Scanner-
  235. treiber  installiert  sein.  Sind  mehrere  GDPS-Scannertreiber installiert
  236. kann  man  sich  einen  bestimmten  Treiber  auswählen. Da das Programm nur
  237. monochrome  Bilder  verarbeitet,  sollte  man den Scanner auch entsprechend
  238. einstellen.
  239. Wenn  man unter MultiTOS mit Speicherschutz arbeitet, muß man eventuell die
  240. Speicherschutzflags  im  Header  des  GDPS-Treiber-Accessories  auf  GLOBAL
  241. setzen,  da sowohl OCR  als auch der  GDPS-Treiber auf Speicherbereiche des
  242. jeweils  anderen  Programms  zugreifen  müssen. OCR sorgt selbst dafür, daß
  243. Speicherbereiche,  auf  die  der  GDPS-Treiber  zugreifen  muß, fuer diesen
  244. beschreibbar  sind.  Die entsprechenden Flags im Header von OCR müssen also
  245. nicht verändert werden.
  246.  
  247. ASCII speichern (ALT-S)
  248. -----------------------
  249. Der  erkannte  Text  wird  im ASCII-Format gespeichert. Gibt man eine schon
  250. existierende  Datei  an,  kann  man  den Text and diese Datei anhängen oder
  251. diese  Datei  überschreiben  (dann  geht der ursprüngliche Inhalt der Datei
  252. verloren).
  253.  
  254. ASCII löschen
  255. -------------
  256. Der  erkannte  Text  wird  gelöscht.  Falls der Text noch nicht gespeichert
  257. wurde, fragt das Programm sicherheitshalber noch einmal nach:
  258.  
  259.   Speichern: Bevor der Text gelöscht wird, wird er gespeichert.
  260.   Löschen:   Der Text wird gelöscht.
  261.   Abbruch:   Die ganze Aktion wird abgebrochen.
  262.  
  263.  
  264. Font laden (ALT-R)
  265. ------------------
  266. Eine  Zeichensatz-Datenbank  wird  geladen.  Falls  sich  im  Speicher eine
  267. Zeichensatz-Datenbank  befindet, die noch nicht gespeichert wurde, gibt das
  268. Programm eine Warnung aus; man hat jetzt folgende Möglichkeiten:
  269.  
  270.   Speichern:  Die alte  Zeichensatz-Datenbank  wird  gespeichert  bevor die
  271.               neue geladen wird.
  272.   Laden:      Die Zeichensatz-Datenbank wird geladen.
  273.   Abbruch:    Die ganze Aktion wird abgebrochen.
  274.  
  275. Font speichern (ALT-W)
  276. ----------------------
  277. Die Zeichensatz-Datenbank wird gespeichert.
  278.  
  279. Font löschen
  280. ------------
  281. Die  Zeichensatz-Datenbank  wird  gelöscht. Falls die Zeichensatz-Datenbank
  282. noch  nicht  gespeichert  wurde,  gibt  es  eine  Warnung  und  wieder  die
  283. Möglichkeit   die   Datenbank   vorher   zu   Speichern,  bzw.  die  Aktion
  284. abzubrechen.  Wenn man eine neue Datenbank anlegen möchte, muß man die alte
  285. vorher aus dem Speicher entfernen.
  286.  
  287. Programmende (CTRL-Q)
  288. ---------------------
  289. Hier  kann  man  das Programm verlassen. Wenn irgendwelche Daten noch nicht
  290. gespeichert  wurden,  hat  man  jetzt  noch  die  Möglichkeit dazu, denn es
  291. erscheint wieder ein entsprechener Warnhinweis.
  292.  
  293.  
  294.  
  295. Bearbeiten-Menü
  296. ===============
  297. Das  Klemmbrett  ist  ein Verzeichnis auf der Festplatte/Diskette (meistens
  298. C:\CLIPBRD).   Programme,  die  das  Klemmbrett  unterstützen,  können  auf
  299. einfache  Weise  Daten  austauschen.  Der  Benutzer  benutzt die Funktionen
  300. 'kopieren'  oder  'ausschneiden'  um (markierte) Daten in das Klemmbrett zu
  301. übertragen.  Möchte man die Daten im Klemmbrett wieder verwenden (dabei ist
  302. es  egal,  ob  dies  aus  dem  gleichen Programm heraus geschieht, oder von
  303. einem anderen Programm) benutzt man die Funktion 'einfügen'.
  304.  
  305. Wie  sieht  das  z.B.  in  der  Praxis  aus: Aus einem Programm 'SCANN.PRG'
  306. (Programmname  erfunden)  wird  ein  Artikel einer Zeitschrift eingescannt.
  307. Mit  dem  Menüpunkt 'kopieren' wird diese Grafik in das Klemmbrett kopiert.
  308. Jetzt  wechselt  man  zum Programm 'OCR.PRG'; hier benutzt man die Funktion
  309. 'einfügen'  um  die  Grafik  aus dem Klemmbrett zu laden. Jetzt wandelt man
  310. mit  Hilfe  von 'OCR.PRG' die Grafik in einen Text um, und 'kopiert' ihn in
  311. das  Klemmbrett.  Nun  wechselt  man zu einer Textverarbeitung und läd dort
  312. den Text aus dem Klemmbrett mit 'einfügen'.
  313.  
  314. Vorteil  des  Klemmbretts:  Der  Benutzer  muß  sich  also keine Dateinamen
  315. aussuchen  um  die Zwischendateien zu speichern um sie im nächsten Programm
  316. wieder zu laden.
  317.  
  318.  
  319. Alles markieren (CTRL-A)
  320. ------------------------
  321. Das  komplette Bild wird als Block markiert, wenn das Bild-Fenster zuoberst
  322. liegt. Wenn das ASCII-Fenster oben liegt wird der komplette Text markiert.
  323.  
  324. Blockmarken löschen (SHIFT-CTRL-A)
  325. ----------------------------------
  326. Löscht  die  Blockmarken  im  Bild-Fenster,  falls  es  oben liegt; bzw. im
  327. ASCII-Fenster, falls dieses oben liegt.
  328.  
  329. Kopieren (CTRL-C)
  330. -----------------
  331. Kopiert den markierten Block des obersten Fensters in das Klemmbrett
  332.  
  333. Diese  Funktion ist nur dann anwählbar, wenn man in 'Parameter'/'Allgemein'
  334. die Klemmbrett-Unterstützung eingeschaltet hat.
  335.  
  336. Ausschneiden (CTRL-X)
  337. ---------------------
  338. Der  markierte  Bereich  des  obersten  Fensters  wird  in  das  Klemmbrett
  339. kopiert. Im Fenster wird dieser Bereich danach gelöscht.
  340.  
  341. Diese  Funktion  kopiert den markierten Bereich nur dann in das Klemmbrett,
  342. wenn    man   in   'Parameter'/'Allgemein'   die   Klemmbrett-Unterstützung
  343. eingeschaltet hat. Gelöscht wird der Bereich aber auf jeden Fall.
  344.  
  345. Einfügen (CTRL-V)
  346. -----------------
  347. Wenn sich im Klemmbrett ein IMG-Bild befindet wird dieses geladen.
  348.  
  349. Diese  Funktion ist nur dann anwählbar, wenn man in 'Parameter'/'Allgemein'
  350. die Klemmbrett-Unterstützung eingeschaltet hat.
  351.  
  352. Block löschen (DELETE)
  353. ----------------------
  354. Ein  markierter  Block kann mit der DELETE-Taste gelöscht werden. Der Block
  355. wird dabei nicht in das Klemmbrett kopiert.
  356.  
  357.  
  358. Bildgröße (CTRL-0,1,2,3,4)
  359. --------------------------
  360. Hier  kann man das Bild verkleinert anzeigen lassen, damit man eine bessere
  361. Übersicht  erhält.  Unter  MultiTOS  oder  auf dem Falcon ist die Bildgröße
  362. auch durch ein Submenü einstellbar, sonst erscheint eine Dialogbox.
  363.  
  364. Folgende Größen sind möglich:
  365.    100% (CTRL-0):  Original Größe
  366.     50% (CTRL-1):  Breite und Höhe des Bildes haben nur noch
  367.                    die halbe Länge (1:2).
  368.     25% (CTRL-2):  1:4
  369.   12.5% (CTRL-3):  1:8
  370.   6.25% (CTRL-4):  1:16
  371.  
  372.  
  373. Bild ausrichten (ALT-M,N,V,H)
  374. -----------------------------
  375. Vor  allem  bei  der Benutzung von Handyscannern kann es vorkommen, daß man
  376. Texte  um  90 Grad gedreht einscannen muss, weil der Text zu breit ist. Mit
  377. diesen  Funktionen  kann  das  Bild wieder richtig ausgerichtet werden. Auf
  378. dem  Falcon  und  unter  MultiTOS können diese Funktionen durch ein Submenü
  379. ausgewählt werden, sonst in einer Dialogbox.
  380.  
  381. Drehen +90 Grad (ALT-M):
  382.      Dreht  das  Bild  in  mathematisch positiver Richtung um 90 Grad (also
  383.      gegen den Uhr- zeigersinn).
  384.  
  385. Drehen -90 Grad (ALT-N):
  386.      Dreht das Bild im Uhrzeigersinn.
  387.  
  388. Horizontal spiegeln (ALT-H):
  389.      Falls  man den Handyscanner in die 'falsche' Richtung bewegt, liegt es
  390.      gespiegelt im Speicher.
  391.  
  392. Vertikal spiegeln (ALT-V):
  393.      siehe 'Horizontal spiegeln'.
  394.  
  395.  
  396.  
  397. Textfenster öffnen (CTRL-T)
  398. ---------------------------
  399. Öffnet das Textfenster.
  400.  
  401.  
  402. Text erkennen (F1)
  403. ------------------
  404. Startet  die  Texterkennung. Wenn ein Block markiert wurde, wird nur dieser
  405. Blockinhalt  zur  Texterkennung benutzt; ist kein Block definiert, wird das
  406. komplette  Bild  zur  Texterkennung  verwendet.  Bilder  und  Linien  müßen
  407. eventuell  vorher  gelöscht  werden,  damit  das  Programm  Textzeilen bzw.
  408. einzelne Buchstaben erkennen kann.
  409.  
  410. WICHTIG:
  411. Bitte  achten  Sie  darauf,  daß die richtige Zeichensatz-Datenbank geladen
  412. wurde.  Wenn  noch  keine  passende Datenbank vorhanden ist, sollte man mit
  413. 'Font   löschen'   die   eventuell  im  Speicher  befindliche  löschen  (In
  414. 'Parameter'/'Font'  sollte  man  jetzt  unbedingt  die  relevanten Scanner-
  415. einstellungen  ins  Kommentarfeld  eintragen. Auch an die Leerzeichenbreite
  416. sollte man denken).
  417.  
  418. Das  Programm sucht zunächst nach der ersten Zeile. Als Zeile wird erkannt,
  419. was  durch mindestens eine leere (weiße) Linie oben und unten umgrenzt wird
  420. und  mindestens  5  Pixel  hoch ist (Ich nehme an, daß niemand auf die Idee
  421. kommt,  solch  kleine  Buchstaben  (<5 Pixel Höhe) erkennen zu wollen). Auf
  422. diese   Weise   kann   das   Programm   unter  Umständen  Unterstreichungen
  423. automatisch  ignorieren  (wenn sich Unterlängen einiger Buchstaben aber auf
  424. gleicher  Höhe  wie  die  Unterstreichung befinden, funktioniert dies nicht
  425. mehr;  in diesem Fall muß man die Unterstreichung löschen (Block löschen)).
  426. Nach  dem  das  Programm  eine  Zeile  gefunden  hat, werden die Buchstaben
  427. dieser  Zeile  separiert  und  mit den Buchstaben der Zeichensatz-Datenbank
  428. vergleichen.  Das Zeichen aus der Datenbank, das die größte Ähnlichkeit mit
  429. dem  zu erkennenden Zeichen hat, wird in den Text eingefügt. Findet sich in
  430. der  Datenbank  kein  Zeichen,  das eine ausreichende Ähnlichkeit hat, wird
  431. bei  eingeschaltetem  Lernmodus  (siehe  Parameter)  der  Benutzer nach dem
  432. Zeichen  befragt,  bei  ausgeschaltetem  Lernmodus  wird ein, vom Benutzter
  433. bestimmbares,  Ersatzzeichen  in  den  Text  eingefügt.  Sowohl die Art des
  434. Vergleichs  zwischen  den  Zeichen,  als auch der Grad der Übereinstimmung,
  435. der  mindestens  nötig ist um ein Zeichen als 'erkannt' zu betrachten, läßt
  436. sich einstellen (siehe Parameter).
  437.  
  438. Bei  eingeschaltetem Lernmodus, fragt das Programm in einer Dialogbox nach,
  439. wenn  es  ein Zeichen nicht mit ausreichender Sicherheit erkennen kann (Die
  440. Dialogbox     kann     wahlweise     auch   ausgeschaltet   werden   (siehe
  441. 'Texterkennen'-Parameter).  Das Zeichen wird in der Dialogbox angezeigt und
  442. ausserdem  im  Bildfenster markiert. In der Dialogbox gibt man das (die) zu
  443. diesem  Zeichen  passende(n)  ASCII-Zeichen  ein.  Man kann hier bis zu elf
  444. ASCII-Zeichen  eingeben,  da  es  vorkommen  kann, daß Zeichen beim Scannen
  445. zusammenwachsen     (Das   Programm   kann   sie   dann   nicht   trennen).
  446. Zusammengewachsene  Zeichen  (Ligaturen)  können durchaus auch schon in der
  447. Vorlage  vorkommen,  dies  wird gerne bei bestimmten Zeichenfolgen gemacht.
  448. In  der  Dialogbox  kann man außerdem angeben, ob das zu erkennende Zeichen
  449. in  die  Zeichensatz-Datenbank aufgenommen, und ob das ASCII-Zeichen in den
  450. Text  eingefügt  werden  soll.  Diese  beiden  Einstellungen  sind  normal-
  451. erweise  eingeschaltet.  Wenn  man aber weiß, daß das zu erkennende Zeichen
  452. so  nicht  (oder  nie)  mehr  vorkommen  wird (weil es beispielsweise durch
  453. Fehler  beim  Scannen,  oder  eine schlechte Scan-Vorlage verunstaltet ist)
  454. kann   man   verhindern,  daß  das  Zeichen  in  der  Zeichensatz-Datenbank
  455. gespeichert  wird.  Verläßt  man  die  Dialogbox  mit  'OK'  wird  mit  der
  456. Texterkennung  fortgefahren,  'Abbruch'  bricht  die  Texterkennung ab. Man
  457. kann  die  Texterkennung auch dann abbrechen, wenn das Programm nicht wegen
  458. unbekannten Zeichen nachfragt (siehe nächster Punkt).
  459.  
  460. Erkennung fortsetzen (F2)
  461. -------------------------
  462. Wenn   man   während   eines   Erkennungsvorganges  irgendwelche  Parameter
  463. korrigieren  will,  kann man die Erkennung abbrechen, die Parameter ändern,
  464. und  die  Erkennung  wieder  fortsetzen.  Die  Erkennung muß also nicht von
  465. vorne  gestartet  werden.  Das  Fortsetzen klappt aber nur, solange man das
  466. Bild     nicht     verändert    (drehen/spiegeln/Block   ausschneiden/Block
  467. löschen/Bild  laden)  und  die Bildblockmarkierung nicht ändert. Das Ändern
  468. der Bildgröße ist natürlich erlaubt.
  469.  
  470. Texterkennung abbrechen (ESC)
  471. -----------------------------
  472. Hiermit  kann  man die Texterkennung abbrechen. Da das Programm aber nur am
  473. Ende  jeder Zeile auf Tastendrücke bzw. auf eine Menüauswahl reagiert, kann
  474. es durchaus einige Sekunden dauern bis die Texterkennung abgebrochen wird.
  475.  
  476.  
  477.  
  478.  
  479. Optionen
  480. ========
  481.  
  482. Hilfe
  483. -----
  484. Hilfstexte können hier  angezeigt werden, aber nur wenn  1ST-Guide oder ST-
  485. Guide installiert ist.
  486.  
  487.  
  488. Texterkennung (ALT-O)
  489. ---------------------
  490. Diese Einstellungen beeinflussen die Texterkennung.
  491.  
  492. Lernmodus:
  493.      Wird  ein  Zeichen  nicht  mit genügend hoher Übereinstimmung erkannt,
  494.      wird   der   Benutzer   bei  eingeschaltetem  Lernmodus  befragt,  bei
  495.      ausgeschaltetem Lernmodus wird ein Ersatzzeichen in den Text eingefügt
  496.  
  497. Übereinstimmung:
  498.      Hier  gibt  man  an,  wie groß die Übereinstimmung beim Vergleich sein
  499.      muß, um ein Zeichen als 'erkannt' zu betrachten.
  500.  
  501. Akustisches Signal:
  502.      Wenn  die  Zeichensatz-Datenbank  ziemlich  vollständig  ist, wird das
  503.      Programm  sehr  selten (wenn überhaupt) nach einem Zeichen fragen. Man
  504.      kann  das  Programm  daher  alleine  rechnen lassen; wenn dieser Knopf
  505.      angewählt  ist, macht das Programm mit einem PING aufmerksam, wenn die
  506.      Erkennung  beendet  ist  oder  das  Programm nach einem Zeichen fragt.
  507.      (Dieser  Ton kann auch mit dem Kontrollfeld abgeschaltet werden! D.h.:
  508.      Wenn  man ihn im Kontrollfeld abgeschaltet hat, wird man niemals einen
  509.      Ton hören!)
  510.  
  511. Nachfrage immer mit Dialogbox:
  512.      Ist  dieser  Button  angewählt,  fragt  das  Programm  immer mit einer
  513.      Dialogbox  nach  unbekannten  Zeichen. In dieser Dialogbox muß man das
  514.      Zeichen   identifizieren   (falls   mehrere   Zeichen   zusammenhängen
  515.      (Ligaturen),  kann man auch entsprechen viele ASCII-Zeichen eingeben).
  516.      In  der  Dialogbox  kann man ausserdem angeben, ob das Zeichen auch in
  517.      die   Datenbank   bzw.   in  den  Text  übernommen  werden  soll.  Das
  518.      Identifizieren  der  Zeichen  kann  beschleunigt  werden, wenn man die
  519.      Dialogbox   nicht   benutzt.   Das  Programm  markiert  dann  nur  das
  520.      entsprechende   Zeichen   in  den  Fenstern.  Man  kann  das  gesuchte
  521.      ASCII-Zeichen  einfach  über  die  Tastatur  eingeben. Auf diese Weise
  522.      können  aber  keine  Ligaturen identifiziert werden. Um auch Ligaturen
  523.      bearbeiten   zu  können,  kann  man  jederzeit  durch  Druck  auf  die
  524.      Leertaste die oben beschriebene Dialogbox aufrufen.
  525.  
  526. Aufnahme in Datenbank,in Text einfügen:
  527.      Diese  beiden  Buttons  entsprechen den Buttons im dem Dialog, mit dem
  528.      das  Programm  nach  unbekannten  Zeichen fragt. Hier kann man angeben
  529.      wie  die  Buttons  in  Nachfrage-Dialog  voreingestellt werden sollen.
  530.      Hier  kann  man sich eine geeignete Voreinstellungen wählen, sodaß man
  531.      während  des Erkennungsvorganges möglichst wenige Einstellungen ändern
  532.      muß.
  533.      Wenn  die  Zeichensatz-Datenbank  schon (fast) komplett ist, fragt das
  534.      Programm  meist  nach  Buchstaben  die  durch  Scanfehler verunstaltet
  535.      wurden   (diese   Buchstaben   sollen  dann  nicht  in  die  Datenbank
  536.      aufgenommen  werden), daher ist es günstig die 'Aufnahme in Datenbank'
  537.      auszuschalten.  Wurde  eine  Datenbank  neu angelegt, ist es günstiger
  538.      'Aufnahme in Datenbank' einzuschalten.
  539.  
  540. Filter für vereinzelte Punkte:
  541.      Ist  diese  Option  eingeschaltet,  werden  vereinzelte  Pixel  in den
  542.      Zeichen  herausgefiltert.  Bei  einer Scannerauflösung von nur 200 dpi
  543.      sollte  man  diese Option ausschalten, bei hoeheren Scannerauflösungen
  544.      kann   aber  bei  eingeschaltetem  Filter  die  Erkennungsrate  erhöht
  545.      werden.  Sind  die gescannten Bilder sauber (keine vereinzelten Pixel)
  546.      kann man diese Option ausschalten um Rechenzeit zu sparen.
  547.  
  548. Vergleich der Zeichen:
  549.      Das  Programm  vergleicht  die  Zeichen des Bildes mit den Zeichen der
  550.      Zeichensatz-Datenbank.  Zum  Vergleich  wird das zu erkennende Zeichen
  551.      wie eine Schablone über die Zeichen der Datenbank gelegt.
  552.  
  553.      genau:
  554.           Diese  Einstellung  verbraucht  die  meiste  Rechenzeit,  da beim
  555.           Vergleich  der Zeichen die Unterschiede unterschiedlich gewichtet
  556.           werden.  Dadurch  wird  aber  die  höchste  Genauigkeit  und  die
  557.           höchste Trefferquote erreicht.
  558.  
  559.      mittel:
  560.           Bei  dieser  Einstellung  wird  die  Gewichtung  der Unterschiede
  561.           nicht  durchgeführt.  Dadurch spart man Rechenzeit. Bei kleineren
  562.           Scannerauflösungen  kann  es  dann  passieren,  daß  das Programm
  563.           bestimmte  Zeichen  verwechselt.  Bei höheren Auflösungen (ab 300
  564.           DPI)   dürfte   es  aber  wenig  Probleme  geben,  so  daß  diese
  565.           Einstellung  durchaus  eine  Alternative  zur 'genau'-Einstellung
  566.           darstellt.
  567.  
  568.      schnell:
  569.           Wie   in   'mittel',   aber   ein   wenig   schneller  und  etwas
  570.           fehleranfälliger.
  571.  
  572. Qualität des Bildes:
  573.      Stammt   das  Bild  aus  einem  Scanner,  sollte  man  hier  unbedingt
  574.      'Scanner'  auswählen.  Kleine  Unterschiede  zwischen den Zeichen, die
  575.      durch   das   Scannen   entstehen,   werden   in   dieser  Einstellung
  576.      herausgefiltert  (Filter).  Hat  man  aber ein Bild aus einem Zeichen-
  577.      programm,  werden die darin vorkommenden Texte (Systemzeichensatz oder
  578.      GDOS-Zeichensätze)  sehr wahrscheinlich ohne jegliche Störung sein (im
  579.      Gegensatz  zu  eingescannten Texten, die normalerweise immer Störungen
  580.      [z.B.unsaubere   Ränder]   enthalten).   In  diesem  Fall  sollte  man
  581.      'präzise'  einstellen.  Dann  werden  ALLE  Unterschiede  zwischen den
  582.      Zeichen  beachtet.  Wenn  diese  Zeichensätze  sehr klein sind, müssen
  583.      tatsächlich  ALLE  Unterschiede  beachtet  werden  (die oben genannten
  584.      Filter  lassen sonst eventuell nicht mehr viel von den Zeichen übrig).
  585.      Diese Einstellung spart übrigens einige Rechenzeit.
  586.  
  587. Schräglage des Bildes:
  588.      Hier  kann  man  einstellen,  ob das Programm auch schräg eingescannte
  589.      Vorlagen  akzeptiert.  Bei  normalem  Text  kann man diese Einstellung
  590.      immer  so wählen, daß auch eine stärkere Schäglage akzeptiert wird. Es
  591.      kann  aber in seltenen Fällen notwendig sein, eine schwache Schräglage
  592.      einzustellen:   Bei   Texten   die   kurze   Absätze   oder   einzelne
  593.      (freistehende)  kurze  Zeilen enthalten, die sehr(!!!) weit eingerückt
  594.      sind,   kann  es  passieren,  daß  das  Programm  diese  Zeilen  sonst
  595.      'übersieht'.  (Beispiel:  Briefe  mit  oben  rechts stehendem Absender
  596.      (weit eingerückt bezüglich dem restlichen Text))
  597.  
  598.  
  599. Font (ALT-F)
  600. ------------
  601. Hier  erhält  (bzw.  bestimmt)  man  Informationen  über die gerade im
  602. Speicher befindliche Zeichensatz-Datenbank.
  603.  
  604. Mindestgröße der Zeichen:
  605.  
  606.      Breite, Hoehe:
  607.           Hiermit   wird   die  Mindestgröße  der  Zeichen  bestimmt.  Alle
  608.           Bereiche   des   Bildes,  die  eine  geringere  Größe  als  diese
  609.           Mindestgröße  besitzen,  werden nicht beachtet. Kleinere Flecken,
  610.           die  durch  unsauberes  Scannen entstehen, werden auf diese Weise
  611.           ignoriert.
  612.  
  613.      Abmessen:
  614.           Die  Mindestgröße  kann  mit Hilfe eines 'Gummibandes' abgemessen
  615.           werden (siehe 'Abmessen' bei Leerzeichen).
  616.  
  617.      Beim   Verlassen   des   Dialogs  prüft  das  Programm,  ob  die  hier
  618.      angegebenen  Werte mit allen Zeichen aus der Datenbank vereinbar sind.
  619.      Existiert  schon  ein  kleineres  Zeichen in der Datenbank, werden die
  620.      oben   be-   schriebenen  Werte  korrigiert,  so  daß  dieses  Zeichen
  621.      weiterhin  beachtet wird. Der Benutzer wird darüber in einer ALERT-Box
  622.      informiert.
  623.  
  624. Mindestbreite der Leerzeichen:
  625.  
  626.      Breite:
  627.           Legt die Mindestbreite der Leerzeichen fest
  628.  
  629.      variable Breite:
  630.           Falls  in  der Vorlage alle (Leer-)Zeichen gleich breit sind, muß
  631.           dieser  Knopf ausgeschaltet werden. Sonst sollte er eingeschaltet
  632.           werden.
  633.  
  634.      Abmessen:
  635.           Die  Maus  besitzt  jetzt die Form eines Fadenkreuzes. Jetzt kann
  636.           man  bei  gedrückter Maustaste eine Box aufziehen. Die Breite der
  637.           Box  beim  Loslassen  der  Maustaste,  entspricht der gewünschten
  638.           Leerzeichenbreite.   Wird   das   Bild   in  einer  Verkleinerung
  639.           angezeigt,  wird  die  abgemessene  Breite entsprechend angepasst
  640.           (d.h.  die  Größe  der  Box  bezieht  sich  auf  die eingestellte
  641.           Verkleinerung  des  Bildes).  WICHTIG:  Es wird die Mindestbreite
  642.           der Leerzeichen bestimmt.
  643.  
  644. Kommentar:
  645.      Hier  kann  man  beliebigen Text eingeben, der auch beim Speichern der
  646.      Datenbank  mitgepeichert  wird.  Hier  sollte man notieren, um welchen
  647.      Zeichensatz  es  sich handelt (z.B. Herkunft: aus Zeitschrift XYZ) und
  648.      mit  welcher  Scannereinstellung  (DPI, Kontrast, Helligkeit etc.) die
  649.      Zeichen  entstanden sind. Somit kann man vor dem Scannen von Text, den
  650.      Scanner  richtig einstellen (Weichen die Scannereinstellungen zu stark
  651.      ab,  wird  das  Programm  unter  Umständen  nur  noch  wenige  Zeichen
  652.      erkennen).
  653.  
  654.  
  655. Font bearbeiten (ALT-E)
  656. -----------------------
  657. Hier kann man einige Änderungen an der Zeichensatz-Datenbank vornehmen.
  658.  
  659. Zeichensatz-Überblick:
  660.      Hier  kann  man durch die Zeichen blättern. Ein Klick auf ein Zeichen,
  661.      wählt dieses aus (siehe nächsten Punkt).
  662.  
  663. Ausgewähltes Zeichen:
  664.      Hier  sind  Änderungen  an dem ausgewählten Zeichen möglich. 'Löschen'
  665.      löscht  dieses  Zeichen  aus der Datenbank, in 'ASCII' kann man die zu
  666.      dem   Zeichen   gehörenden  ASCII-  Code  (bis  zu  11  ASCII-Zeichen)
  667.      ändern/bestimmen.
  668.  
  669. Zeichen suchen:
  670.      Man  kann  ASCII-Zeichen  suchen.  'Suchen'  sucht  ab Anfang, 'Suchen
  671.      fortsetzen'  sucht ab der aktuellen Position in der Datenbank. Ist das
  672.      Suchen  erfolgreich,  wird  das  gefundene  Zeichen nach 'Ausgewähltes
  673.      Zeichen' über tragen.
  674.  
  675. Sortieren:
  676.      Die Zeichen der Datenbank werden sortiert.
  677.  
  678. Statistik:
  679.      Man  erhält  eine  Übersicht,  welche  Zeichen  sich  wie  oft  in der
  680.      Datenbank  befinden.  Es  werden  aber  nur  die  wichtigsten  Zeichen
  681.      angezeigt (Platzgründe).
  682.  
  683.  
  684. Korrektur (ALT-C)
  685. -----------------
  686. Die  Texterkennung  ist  natürlich  nicht perfekt. Es gibt Zeichen, die das
  687. Programm  schwer  (bzw.  nicht)  unterscheiden/erkennen  kann.  Bei einigen
  688. Zeichensätzen  sind  beispielsweise '1' und 'l' noch nicht mal mit dem Auge
  689. gut  zu  unterscheiden,  wenn  dann der Scanner noch einige Ungenauigkeiten
  690. 'einbaut'  kann  das Zeichen nicht mehr genau zugeordnet werden. Hier hilft
  691. nur  noch  eine  Korrektur,  die  die Umgebung des Zeichens betrachtet, und
  692. prüft  ob  in dieser Umgebung das eine oder andere Zeichen wahrscheinlicher
  693. ist  (z.B.  innerhalb  von  Ziffern  wird  sich  kein  'l' sondern eine '1'
  694. befinden).
  695. Bestimmte  Zeichen  werden  als  mehrere einzelne Zeichen erkannt (z.B. <">
  696. wird als zwei mal <'> erkannt).
  697.  
  698. In  dieser  Dialogbox  können Korrekturregeln für diese Probleme festgelegt
  699. werden.
  700.  
  701. Ersetzungen:
  702.      Hier  wird  eingetragen, welche Zeichenkombinationen durch eine andere
  703.      ersetzt   werden   soll.   (Man   kann  z.B.  zwei  (Hoch-)Kommata  in
  704.      Anführungsstriche umwandeln)
  705.  
  706. Korrekturen:
  707.      Wenn  im  zu  erkennenden  Text  die  Zeichen  1/l,  l/I oder 0/O sehr
  708.      ähnlich  sind, kann man automatische Korrekturen einschalten.
  709.      ACHTUNG:   Diese  Korrekturen  können  im  Einzelfall  natürlich  auch
  710.      falsche Ergebnisse liefern!
  711.  
  712. Text formatieren:
  713.  
  714.      Original Format:
  715.           Eine  Zeile  Text  im  Bild,  wird  zu  einer  Zeile  ASCII-Text.
  716.           Leerzeichen am Zeilenanfang können ignoriert werden.
  717.  
  718.      neu formatieren:
  719.           Der  Text  im Bild wird vollkommen neu formatiert. Dabei wird die
  720.           gewünschte  Zeilenbreite  beachtet.  Dies  ist nützlich, wenn man
  721.           Vorlagen  hat,  die  aus  engen  Spalten bestehen. In diesem Fall
  722.           besitzt   der   Text   meistens   viele   getrennte  Wörter.  Bei
  723.           eingeschalteter  Trennungskorrektur  werden  die Trennungsstriche
  724.           automatisch   entfernt.   Es   gibt   aber   auch   hier   einige
  725.           Ausnahmeregeln.   Die   deutsche   Regel  "'ck'  wird  mit  'k-k'
  726.           getrennt"  kann  ausgeschaltet werden (für nicht-deutschsprachige
  727.           Texte).  Diese  Option  ist  natürlich nur für Fließtext gedacht,
  728.           für  Programm-Listings, Tabellen etc. ist diese Einstellung nicht
  729.           geeignet. (Das Programm selbst setzt keine neuen Trennstriche!)
  730.  
  731. Leerzeilen zwischen Erkennungs-Vorgängen:
  732.      Zwischen   den  Texten,  die  aus  verschiedenen  Erkennungs-Vorgängen
  733.      stammen, wird die angegebene Anzahl von Leerzeilen eingefügt.
  734.  
  735. Unbekanntes Zeichen:
  736.      Hier   gibt   man   an,   mit   welchem   Zeichen  das  Programm  (bei
  737.      ausgeschaltetem Lernmodus) unbekannte Buchstaben kennzeichnen soll.
  738.  
  739.  
  740. Allgemein (ALT-A)
  741. -----------------
  742. Dialoge:
  743.      Die  Dialogboxen  können  wahlweise in der Bildschirmmitte oder an der
  744.      Mausposition  auftauchen.  Der  Punkt  'im Fenster'  bewirkt,  daß die
  745.      Dialogboxen in Fenster verlegt werden. In Multitasking-Systemen sollte
  746.      man die  Dialoge  in  Fenster legen,  da ein  echter  Dialog  Ausgaben 
  747.      anderer Programme  blockiert; Fenster-Dialoge blockieren nicht. Da der
  748.      von den Dialogboxen verdeckte  Bildschirmbereich gepuffert  wird,  ist
  749.      der Bildaufbau beim Verlassen des Dialogs sehr schnell  (normalerweise
  750.      schneller  als bei  Fenster-Dialogen).  
  751.      
  752. Pfade & Dateien:
  753.      Klickt  man  auf die Pfad-Boxen, kann man im Fileselector verschiedene
  754.      Zugriffspfade   bestimmen.   Diese  Pfade  werden  beim  Programmstart
  755.      automatisch  voreingestellt, sodaß man beim Laden/ Speichern gleich im
  756.      richtigen Verzeichnis landet.
  757.  
  758.      Klickt  man  auf  die  Standard-Datei-Boxen,  kann man im Fileselector
  759.      Dateien   aussuchen.   Diese   Dateien   werden   beim   Programmstart
  760.      automatisch  geladen. Wenn man immer die gleiche Zeichensatz-Datenbank
  761.      bzw.   die  gleichen  Korrekturregeln  benutzt,  kann  man  sie  somit
  762.      automatisch laden lassen.
  763.  
  764. Verschiedenes:
  765.      Wird  der 'Text-Fenster'-Button angekreuzt, wird das Text-Fenster nach
  766.      dem Programmstart automatisch geöffnet.
  767.  
  768. Klemmbrett:
  769.      Hier  kann  man  die  Verwendung  des  Klemmbretts  für die Funktionen
  770.      'kopieren',   'ausschneiden'   und   'einfügen'  getrennt  für  Grafik
  771.      (IMG-Fenster) und Text (Textfenster) ein.- bzw. ausschalten.
  772.  
  773.      Da  das  Programm  Grafik  in  Text  verwandelt,  ist  ein  'kopieren'
  774.      und/oder  'ausschneiden' von Text in das Klemmbrett sehr nützlich. Das
  775.      'Ausschneiden'  (=löschen)  von  Grafik  in  das  Klemmbrett  ist aber
  776.      wahrscheinlich  nicht beabsichtigt, da normalerweise nur Grafik-Blöcke
  777.      gelöscht  werden sollen, die die Texterkennung stören würden. Schaltet
  778.      man  z.B.  die  Klemmbrett-Unterstützung  für  das  'Ausschneiden' von
  779.      Grafik  aus,  spart man Zeit (die Grafik muß nicht gespeichern werden)
  780.      und  es  wird  verhindert,  daß ein zuvor auf das Klemmbrett kopierter
  781.      Text durch eine ausgeschnittene Grafik überschrieben wird.
  782.  
  783. Hilfe-System:
  784.      Die   Online-Hilfe   funktioniert  nur  in  Verbindung  mit  1st-Guide
  785.      (Shareware,  von  Guido  Vollbeding)  oder  ST-Guide (Fairware, von H.
  786.      Weets,  C. Wempe). Man muß in OCR angeben, welches Hilfesystem benutzt
  787.      wird,  und wo die Hilfstexte zu finden sind. Im Feld 'Hilfe-Accessory'
  788.      muß  man  im  Fileselector  das  entsprechende Accessory (1STGUIDE.ACC
  789.      oder   STGUIDE.ACC)  festlegen  und  im  Feld  'Indexdatei'  die,  zum
  790.      ausgewählten  Hilfesystem  gehörende,  Index-  oder  Referenzdatei. Im
  791.      Falle  von  1st-Guide  wählt  man  die  Datei  OCR.IDX;  im  Falle von
  792.      ST-Guide OCR.REF (oder OCR_E.REF für die englischen Texte).
  793.  
  794.  
  795. sichern
  796. -------
  797. Die   Einstellungen   des   Programms   werden   gesichert.  Beim  nächsten
  798. Programmstart  werden  die Einstellungen auf die gesicherten Werte gesetzt.
  799. Gesichert werden:
  800.   * Alle  Einstellungen  der  Dialogboxen  'Text erkennen', 'Bildgröße' und
  801.     'Allgemeine Einstellungen'
  802.   * Fensterpositionen und Fenstergrößen der beiden Fenster
  803.  
  804.  
  805.  
  806.  
  807. Tips & Tricks
  808. =============
  809. Man  sollte  immer  darauf  achten,  daß  man  beim  Scannen  die  gleichen
  810. Scanner-Einstellungen  benutzt,  mit  der  auch  die  Zeichensatz-Datenbank
  811. aufgebaut  wurde.  Werden  andere  Einstellungen benutzt kann es passieren,
  812. daß  die  Zeichen  dicker  oder  dünner  ausfallen;  das Programm wird dann
  813. Probleme   haben,   die   Zeichen  zu  erkennen.  Falls  die  Scan-Vorlagen
  814. allerdings  sehr  unterschiedliche  Qualität  haben,  kann es dennoch nötig
  815. sein, andere Scanner-Einstellungen zu benutzen.
  816.  
  817. Für  jeden  unterschiedlichen  Zeichensatztyp und für jede Größe sollte man
  818. eine  eigene Zeichensatz-Datenbank aufbauen. Dadurch bleiben die Datenbänke
  819. klein.  Eine durch viele Zeichensatztypen aufgeblähte Datenbank verlangsamt
  820. den  Erkennungsvorgang  deutlich.  Es  ist  in  machen Fällen aber trotzdem
  821. nicht  zu  vermeiden,  daß  man mehrere Zeichensatztypen in einer Datenbank
  822. halten  muß  (z.B.  wenn  man oft Texte bearbeitet, die normale UND kursive
  823. Schrift  enthalten).  Damit  man später noch weiß, welche Zeichensatz-Datei
  824. für  welche  Vorlage  (und Scannereinstellung) geeignet ist, sollte man die
  825. Kommentarfelder in 'Einstellungen'/'Font' immer gewissenhaft ausfüllen.
  826.  
  827. Die  Scannergebnisse  sollten  sauber  und  gleichmäßig  sein. Kontrast und
  828. Helligkeit  so  einstellen,  daß mehrere Zeichen nicht zusammenwachsen aber
  829. in  den  Zeichen  selbst keine Lücken entstehen. Zusammengewachsene Zeichen
  830. sind  meist  unproblematischer  als  Lücken in den Zeichen selbst, daher im
  831. Zweifelsfall den Scanner etwas dunkler stellen.
  832.  
  833. Je  niedriger  die  Scannerauflösung,  desto  weniger  Platz  benötigen die
  834. Zeichen  in  der  Datenbank.  Allerdings  besteht  bei  niedrigen  Scanner-
  835. auflösungen  die  Gefahr,  daß  mehrere Zeichen zusammenwachsen, daher wird
  836. die  Erkennung  unsicherer.  Man  muß  etwas  experimentieren um die ideale
  837. Auflösung  zu  finden.  Wenn  der  eigene  Scanner nur niedrige Auflösungen
  838. zuläßt  (z.B.  max.  200  dpi),  muß  man  etwas  mehr  Arbeit  und  Geduld
  839. investieren  um  brauchbare  Ergebnisse  zu  erzielen.  Man sollte, bis die
  840. Zeichensatzdatenbank  relativ  komplett  ist, mit einer Übereinstimmung von
  841. ca.  90%  arbeiten.  Es sollten dabei einzelne Zeichen durchaus mehrfach in
  842. der  Datenbank aufgenommen werden (besonders Problemkinder wie 'e' und 'c',
  843. 'b'  und  'h'  oder  andere).  Erst  wenn  alle wichtigen Buchstaben in der
  844. Datenbank  vorhanden  sind,  sollte  man die Übereinstimmung auf niedrigere
  845. Werte (75%-85%) einstellen, damit OCR nicht mehr so oft nachfragt.
  846.  
  847. Den  Grad der Übereinstimmung beim Vergleich der Zeichen kann man bei hohen
  848. Scannerauflösungen   (ab  300  DPI)  bzw.  guten  Scannergebnissen  niedrig
  849. einstellen  (meistens  genügt  75%).  Sollten  bei der Erkennung bestimmter
  850. Zeichen  immer  wieder  falsch  bestimmt  werden,  sollte  man den Grad der
  851. Übereinstimmung  etwas  erhöhen.  Bei  hohem Grad, fragt das Programm etwas
  852. öfter nach.
  853.  
  854. Möchte  man  in  den  Dialogboxen  Buchstaben  eingeben,  die nicht auf der
  855. Tastatur  vorhanden  sind,  benötigt  man entweder TOS 2.06/3.06 oder höher
  856. oder   MultiTOS   (man   kann   den  ASCII-Code,  bei  gedrückt  gehaltener
  857. ALTERNATE-Taste,  über  den  Ziffernblock  eingeben)  oder  Let'em  Fly von
  858. Oliver  Scheel  (Nach  betätigen von SHIFT-INSERT erhält man eine Übersicht
  859. über alle möglichen Zeichen) oder COMPOSE von Pascal Fellerich.
  860.  
  861. Besitzt  man  keine  Festplatte,  sollte  man  die Klemmbrett-Unterstützung
  862. ausschalten (siehe 'Parameter'/'Allgemein').
  863.  
  864. Auch  wenn  das  Programm  ab  Version  1.2  (leicht)  schräg  eingescannte
  865. Vorlagen  akzeptiert,  sollte  man  darauf  achten,  die Vorlagen möglichst
  866. gerade einzuscannen.
  867.  
  868.  
  869.  
  870. Technisches
  871. ===========
  872. Das  Programm  unterstützt  die  erweiterten WM_ARROWED-Nachrichten und die
  873. WM_BOTTOMED-Nachricht von Winx 2.2.
  874.  
  875. OCR unterstützt das Drag&Drop-Protokoll (ARGS) von MultiTOS.
  876.  
  877. Das  Programm  unterstützt  außerdem  den  VSCR-Cookie. D.h. auch bei einer
  878. hohen   virtuellen   Grafikauflösung   erscheinen   Dialogboxen  im  gerade
  879. sichtbaren Bildausschnitt.
  880.  
  881. Auf  dem  Falcon  (>=TOS  4.02) und unter MultiTOS werden die 3D-Effekte in
  882. den  Dialogboxen  benutzt.  Die Bildgröße und Bildausrichtung kann man dann
  883. auch über ein Submenü einstellen.
  884.  
  885. Speicherplatzverbrauch:   Der  meiste  Speicher  wird  gewöhnlich  von  den
  886. eingescannten   Bildern  verbraucht.  Dieser  Speicherplatz  wird  außerdem
  887. zweimal  benötigt: Das Bild muß einmal im Standardformat (die TextErkennung
  888. bezieht   ihre   Daten   aus   diesem   Speicherbereich)   und   einmal  im
  889. geräteabhängigem  Format  (dieses  Format  ist abhängig von der Grafikkarte
  890. und wird zur Anzeige auf dem Bildschirm benötigt) vorliegen.
  891.  
  892. Beispiel:
  893. Eine  DIN  A4 Seite Text (8x11 Zoll), mit 400 DPI eingescannt, benötigt ca.
  894. 1.7  MBytes,  das  Programm  benötigt  diesen  Platz  zweimal: also ca. 3.4
  895. MBytes.
  896.  
  897.  
  898.  
  899. Bekannte Fehler und Unschönheiten
  900. =================================
  901. Das  Programm  kann  in  seltenen Fällen zwei Zeichen nicht trennen, obwohl
  902. sie  nicht  zusammengewachsen  sind.  Grund: Es gibt einige Buchstaben, die
  903. aus  mehreren nicht zusammenhängenden Teilen bestehen (z.B. alle Buchstaben
  904. mit  Punkt  [i,j,ä  usw.]  oder  ░,ñ  usw.);  das  Programm  versucht diese
  905. Buchstaben  nicht  in  mehrere  Teile zu trennen, mehrere sich überlappende
  906. Buchstaben  sollten  aber  doch  getrennt werden (aber diese Unterscheidung
  907. klappt nicht immer).
  908.  
  909. Bei  großen Scannerauflösungen werden die Zeichen der Datenbank recht groß.
  910. Das Programm verbraucht dann sehr viel Rechenzeit.
  911.  
  912. Die  Größe  der  Zeichen ist zur Zeit noch auf max. 96x96 Pixel beschränkt,
  913. daher  sollte  man  die Scannerauflösung nicht zu hoch wählen. (Empfehlung:
  914. max.  400  DPI, dann können auch Ligaturen aus 2-3 Buchstaben noch in 96x96
  915. Pixeln untergebracht werden).
  916.  
  917. Aufgrund  eines  Fehlers  im  Betriebssystem  (<=TOS  2.06) kann es bei der
  918. Anzeige  eines großen Bildes zu Pixel-Müll kommen. Der Fehler steckt in der
  919. Funktion  'vr_trnfm()'. Hierfür gibt es einen Patch von Laurenz Prüßner, S.
  920. und  W.  Behne  (veröffentlicht im ST-Magazin 9/91). Auf dem TT/Falcon oder
  921. bei  installiertem  NVDI  (oder  einem VDI-Treiber einer Grafikkarte) tritt
  922. dieser  Fehler  (hoffentlich)  nicht  mehr auf (der oben genannte Patch ist
  923. dann nicht nötig).
  924. ACHTUNG:  Ab  OCR  V1.2a  wird  man  diesen Fehler normalerweise nicht mehr
  925. bemerken  (auch  wenn  der  oben genannte Patch nicht installiert ist). Ein
  926. kleiner einfacher Trick machts möglich :-)
  927.  
  928.  
  929. Zukunft
  930. =======
  931. Folgende Erweiterungen sind geplant (Vorschläge werden gerne aufgenommen):
  932.  
  933. *  Nachfrage  nach  unbekannten  Zeichen nachdem das komplette Bild (Block)
  934.    bearbeitet  wurde.  Bei  unvollständigen  Datenbänken,  könnte  man  das
  935.    Programm  alleine rechnen lassen ohne gelegentlich Fragen beantworten zu
  936.    müssen; die kommen dann ganz am Schluß.
  937.  
  938.  
  939. *  Batch-Betrieb:  Automatisches  Abarbeiten  mehrerer  Vorlagen.  (Voraus-
  940.    setzung hierfür ist die Implementation des ersten Punktes)
  941.  
  942. *  Änderungen  (auf  Pixelebene) der Zeichen in der Datenbank. (Um größere
  943.    Scann-Fehler etwas auszugleichen)
  944.  
  945. *  Mehrere  Zeichensatz-Datenbänke gleichzeitig verwalten. Man könnte dann
  946.    auch  bei  Texten  die verschiedene Schrifttypen oder -größen enthalten,
  947.    die  Datenbänke  so  organisieren,  daß sie nur einen Schrifttyp (Größe)
  948.    enthalten.
  949.  
  950.  
  951.  
  952. Sonstiges
  953. =========
  954. Empfehlenswerte Programme für den Autoordner:
  955.  
  956. COMPOSE von Pascal Fellerich: Mehrere verschiedene Verfahren um bequem alle
  957. Zeichen des ATARI-Zeichensatzes einzugeben  (auch diejenigen, die nicht auf 
  958. der Tastatur vorhanden sind) und Mausbeschleuniger.
  959.  
  960. Winx von Martin Osieka:  Mit Hilfe dieses Programms kann man bis zu vierzig
  961. Fenster  gleichzeitig öffnen;  und es werden einige  zusätzlichen  Fenster-
  962. funktionen installiert.
  963.  
  964. Diese  Programme  gibt  es in Mailboxen und auf FTP-Servern oder direkt von
  965. den Autoren.
  966.  
  967.  
  968. Danksagung
  969. ==========
  970. Vielen Dank an
  971.  
  972. Jean-Jacques Ardoino  (Französische RSC-Datei, LISEZMOI)
  973. Joe Connor            (Überarbeitung der englischen RSC-Datei und
  974.                        Anleitung, UK Support)
  975. Stefan Damerau        (Englische Anleitung)
  976. Henk van der Griendt  (Holländische RSC-Datei, LEESMIJ)
  977.  
  978. Vielen  Dank  an  alle,  die  mir  Vorschläge gemacht haben, die mir Fehler
  979. gemeldet  haben,  die  sich  zu einer Spende entschlossen haben und an alle
  980. Betatester.
  981.  
  982.  
  983. Versionsübersicht
  984. =================
  985.  
  986. Version  Datum         Was hat sich geändert
  987. ---------------------------------------------------------------------------
  988. V1.3b    20.09.1994    - Bugfix: Fehler in der Zeilentrennung behoben 
  989.                          (konnte zum Absturz führen (fremder Speicher wurde
  990.                          unter bestimmten Umständen überschrieben)).
  991.  
  992. V1.3a    17.09.1994    - Alertboxen werden wie Dialoge in Fenster gelegt.
  993.                        - Bugfix: Die Zeichen {}[]@\ konnten in den Dialogen
  994.                          nicht eingegeben werden (mit deutscher Tastatur),
  995.                          jetzt geht's wieder.
  996.                        
  997. V1.3     30.08.1994    - Die Probleme mit IMG-Bildern von Repro-Studio 
  998.                          (junior) treten scheinbar nicht mehr auf (na 
  999.                          hoffentlich).
  1000.                        - Dialoge tastaturbedienbar
  1001.                        - Bugfix: Fehler beim Durchsuchen des Menübaums nach 
  1002.                          Shortcuts behoben (Der Fehler ist allerdings nie 
  1003.                          aufgetreten, da keine Shortcuts der Art 
  1004.                          SHIFT-Funktionstaste verwendet wurden)
  1005.                        - Das Programm reagiert jetzt schneller auf Events
  1006.                          während des Erkennungsvorgangs.
  1007.                        - Fenster-Dialoge (UNDO-Taste entspricht Abbruch)
  1008.                        - Online-Hilfe wenn 1st-Guide oder ST-Guide
  1009.                          installiert ist.
  1010.                        - Kleine Korrektur in der 'I/l-Korrektur'
  1011.                        - GDPS-Scannertreiber Unterstützung
  1012.                        - Zwei Buttons wanderten vom 'Allgemein'-Parameter
  1013.                          Dialog in den 'Texterkennung'-Parameter Dialog, da
  1014.                          sie dort eigentlich auch hingehören.
  1015.                        - Man kann jetzt auch Zeichen ohne Nachfragedialog
  1016.                          identifizieren (geht schneller, da man nicht mehr
  1017.                          für jedes Zeichen zusätzlich RETURN drücken muß)
  1018.                        - Die minimalen Zeichenausmaße können angegeben
  1019.                          werden (Bessere Trennung zwischen Buchstaben
  1020.                          und Flecken durch unsaubere Scan-Vorlagen)
  1021.                        - Filteroption abschaltbar
  1022.                        - Es kann jetzt auch auf die Texte neben den Check-
  1023.                          boxen (ankreuzbare Buttons) und Radio-Buttons
  1024.                          geklickt werden, um dieses Buttons anzuwählen.
  1025.                        - Probleme mit einigen IMG-Dateien (in denen mehr
  1026.                          Scanlines kodiert sind, als im IMG-Header ange-
  1027.                          geben) behoben.
  1028.                        - Neues Datei-Format für .LIB und .KOR-Dateien.
  1029.                          Das alte Format kann natürlich weiterhin geladen
  1030.                          werden.
  1031.  
  1032. V1.25b   30.05.1994    - Bugfix: Fehler in Zeichenseparation behoben
  1033.                        - Bugfix: Fehler in 'neu formatieren' (Korrektur-
  1034.                          Dialog) behoben.
  1035.  
  1036. V1.25a   20.05.1994    - Bugfix in deutscher RSC-Datei: Text eines Alert-
  1037.                          Buttons war zu lang :-( Es sind nur max.
  1038.                          10 Zeichen pro Button erlaubt. Mit 'MultiDial'
  1039.                          und/oder 'Let'em Fly' gehen aber auch mehr,
  1040.                          deshalb habe ich nichts gemerkt.
  1041.                        - Bugfix: Fehlerbehandlung in 'ASCII speichern'
  1042.                        - Bugfix: Probleme mit MTOS beim Fensterscrollen
  1043.                          (MTOS sendet scheinbar auch MU_BUTTON-events,
  1044.                          wenn man mit den Scrollpfeilen scrollt...)
  1045.                        - Infozeile im Grafikfenster. Es wird die Bildgröße
  1046.                          und die Größe des Blocks (falls definiert) ange-
  1047.                          zeigt. Während des Erkennungsvorgangs wird hier
  1048.                          angezeigt, wieviel schon erledigt ist. Damit ist
  1049.                          es jetzt möglich auch im Multitaskingbetrieb zu
  1050.                          kontrollieren, ob OCR noch arbeitet (da die Maus
  1051.                          dort nicht in eine Biene verwandelt wird).
  1052.                        - Während das Erkennungsvorgangs werden nicht mehr
  1053.                          alle Menüpunkte gesperrt. Die entsprechenden
  1054.                          Funktionen können also jederzeit aufgerufen werden
  1055.  
  1056. V1.25    05.05.1994    - 'Texterkennung fortsetzen' ist möglich
  1057.                        - Verbesserte Unterscheidung von <'> und <,>
  1058.                        - 'k-k -> ck'-Korrektur (Trennungsstriche entfernen)
  1059.                          kann ausgeschaltet werden (Wichtig für alle nicht-
  1060.                          deutschsprachigen Texte)
  1061.                        - Dateinamen: Fehlende Extensions werden automatisch
  1062.                          angehängt.
  1063.                        - Dateinamen (IMG,LIB,KOR), die als Parameter über-
  1064.                          geben werden, werden automatisch geladen.
  1065.                        - Fehler in Zeilentrennung behoben (konnte unter
  1066.                          Umständen sogar zum Absturz führen :-(
  1067.                        - Neuer schnellerer Vergleichsalgorithmus
  1068.                          für die 'mittel'/'schnell'-Einstellung im
  1069.                          'Texterkennungs'-Dialog
  1070.                        - Unterstützung von AP_TERM (MultiTOS)
  1071.                        - Erkennungsvorgang beschleunigt
  1072.                        - Bild spiegeln/drehen (erst wichtig, wenn man
  1073.                          aus OCR heraus Texte einscannen kann)
  1074.                        - Fensterinhalt mit rechter Maustaste verschiebbar
  1075.                        - Leerzeichenbreite abmessbar
  1076.                        - Block löschen mit DELETE
  1077.                        - MultiTOS Drag&Drop (ARGS)
  1078.                        - Englische Anleitung
  1079.                          (Vielen Dank an Stefan Damerau und Joe Connor)
  1080.  
  1081. V1.2a    29.03.1994    - Fehler in Zeichentrennung behoben (hatte nur
  1082.                          Auswirkungen auf 'dünne' GDOS-Fonts; Fehler wurde
  1083.                          übrigens erst in V1.2 eingebaut)
  1084.                        - Fehler beim VDI-Fontgrö₧e-berechnen behoben
  1085.  
  1086. V1.2     08.03.1994    - Dialoge (verschiebbar) können unsichtbar
  1087.                          verschoben werden (SHIFT-Taste gedrückt halten)
  1088.                        - Erkennungsvorgang beschleunigt
  1089.                        - Buchstaben-Trennung verbessert
  1090.                        - Repräsentat für unbekanntes Zeichen kann
  1091.                          vom Benutzer bestimmt werden
  1092.                        - Fehler beim IMG-Laden behoben
  1093.                        - Schräg eingescannte Vorlagen können jetzt
  1094.                          auch bearbeitet werden.
  1095.                        - Viele weitere Kleinigkeiten wurden einge-
  1096.                          baut.
  1097.  
  1098. V1.1a    06.02.1994    - Überflüßige 'Redraws' entfernt
  1099.                        - Fehler in Textblock-löschen entfernt
  1100.                        - Fehler im Zeichenvergleich beseitigt
  1101.  
  1102. V1.1     04.02.1994    - Klemmbrett-Unterstützung
  1103.                        - Redraw-Fehler beim Scrollen behoben
  1104.  
  1105. V1.0a    01.02.1994    - Redraw-Fehler im Grafik-Fenster entfernt
  1106.                        - OCR versucht jetzt nicht mehr unter Mag!X 2.0
  1107.                          ein Submenu zu installieren
  1108.  
  1109. V1.0     30.01.1994    - erste veröffentlichte Version
  1110.  
  1111.  
  1112.