home *** CD-ROM | disk | FTP | other *** search
/ Vectronix 2 / VECTRONIX2.iso / FILES_01 / OCR_13B.LZH / OCR.13B / HELP / 1STGUIDE / TESTART < prev    next >
Text File  |  1994-07-27  |  4KB  |  59 lines

  1. Text erkennen (F1)
  2. ==================
  3. Startet  die  Texterkennung.  Wenn  ein ▌Block▌BFENSTER▌ markiert wurde, wird nur
  4. dieser   Blockinhalt   zur   Texterkennung  benutzt;  ist  kein  Block
  5. definiert,  wird  das  komplette  Bild  zur  Texterkennung  verwendet.
  6. Bilder  und  Linien  müßen eventuell vorher ▌gelöscht▌BLOSCHEN▌ werden, damit das
  7. Programm Textzeilen bzw. einzelne Buchstaben erkennen kann.
  8.  
  9. WICHTIG:
  10. --------
  11. Bitte  achten  Sie  darauf,  daß  die  richtige  Zeichensatz-Datenbank
  12. geladen  wurde.  Wenn  noch  keine  passende  Datenbank vorhanden ist,
  13. sollte  man  mit  '▌Font löschen▌FLOSCH▌' die eventuell im Speicher befindliche
  14. löschen   (In   'Parameter'/'▌Font▌FONT▌'  sollte  man  jetzt  unbedingt  die
  15. relevanten  Scannereinstellungen  ins Kommentarfeld eintragen. Auch an
  16. die Leerzeichenbreite sollte man denken).
  17.  
  18. Das  Programm  sucht  zunächst  nach  der ersten Zeile. Als Zeile wird
  19. erkannt,  was durch mindestens eine leere (weiße) Linie oben und unten
  20. umgrenzt  wird  und  mindestens  5  Pixel  hoch ist (Ich nehme an, daß
  21. niemand  auf  die  Idee kommt, solch kleine Buchstaben (<5 Pixel Höhe)
  22. erkennen   zu  wollen).  Auf  diese  Weise  kann  das  Programm  unter
  23. Umständen   Unterstreichungen   automatisch   ignorieren   (wenn  sich
  24. Unterlängen   einiger  Buchstaben  aber  auf  gleicher  Höhe  wie  die
  25. Unterstreichung  befinden,  funktioniert  dies  nicht  mehr; in diesem
  26. Fall muß man die Unterstreichung löschen (▌Block löschen▌BLOSCHEN▌)).
  27. Nach  dem  das Programm eine Zeile gefunden hat, werden die Buchstaben
  28. dieser     Zeile     separiert     und    mit   den   Buchstaben   der
  29. Zeichensatz-Datenbank  vergleichen. Das Zeichen aus der Datenbank, das
  30. die  größte  Ähnlichkeit  mit  dem zu erkennenden Zeichen hat, wird in
  31. den  Text  eingefügt.  Findet  sich in der Datenbank kein Zeichen, das
  32. eine  ausreichende Ähnlichkeit hat, wird bei eingeschaltetem ▌Lernmodus▌TERKENN▌
  33. der  Benutzer  nach dem Zeichen befragt, bei ausgeschaltetem Lernmodus
  34. wird  ein,  vom  Benutzter  bestimmbares,  ▌Ersatzzeichen▌KORREKT▌  in  den Text
  35. eingefügt.  Sowohl  die  Art  des Vergleichs zwischen den Zeichen, als
  36. auch  der  Grad  der  ▌Übereinstimmung▌TERKENN▌, der mindestens nötig ist um ein
  37. Zeichen als 'erkannt' zu betrachten, läßt sich einstellen.
  38.  
  39. Bei  eingeschaltetem  ▌Lernmodus▌TERKENN▌, fragt das Programm in einer Dialogbox
  40. nach,  wenn es ein Zeichen nicht mit ausreichender Sicherheit erkennen
  41. kann  (Die  Dialogbox  kann wahlweise auch ausgeschaltet werden (siehe
  42. '▌Texterkennung▌TERKENN▌'-Optionen).   Das   Zeichen   wird   in  der  Dialogbox
  43. angezeigt  und  ausserdem  im  Bildfenster  markiert. In der Dialogbox
  44. gibt  man  das  (die) zu diesem Zeichen passende(n) ASCII-Zeichen ein.
  45. Man  kann  hier  bis  zu  elf  ASCII-Zeichen eingeben, da es vorkommen
  46. kann,  daß Zeichen beim Scannen zusammenwachsen (Das Programm kann sie
  47. dann  nicht  trennen).  Zusammengewachsene  Zeichen (Ligaturen) können
  48. durchaus  auch  schon  in  der  Vorlage vorkommen, dies wird gerne bei
  49. bestimmten  Zeichenfolgen  gemacht. In der Dialogbox kann man außerdem
  50. angeben,  ob  das  zu  erkennende Zeichen in die Zeichensatz-Datenbank
  51. aufgenommen,  und  ob  das  ASCII-Zeichen in den Text eingefügt werden
  52. soll.  Diese  beiden Einstellungen sind normal- erweise eingeschaltet.
  53. Wenn  man aber weiß, daß das zu erkennende Zeichen so nicht (oder nie)
  54. mehr   vorkommen  wird  (weil  es  beispielsweise  durch  Fehler  beim
  55. Scannen,  oder  eine schlechte Scan-Vorlage verunstaltet ist) kann man
  56. verhindern,  daß  das Zeichen in der Zeichensatz-Datenbank gespeichert
  57. wird.  Verläßt  man  die Dialogbox mit 'OK' wird mit der Texterkennung
  58. fortgefahren,  'Abbruch'  bricht  die  Texterkennung  ab. 
  59.