home *** CD-ROM | disk | FTP | other *** search
/ Vectronix 2 / VECTRONIX2.iso / FILES_01 / OCR_13B.LZH / OCR.13B / HELP / 1STGUIDE / TERKENN < prev    next >
Text File  |  1994-07-27  |  6KB  |  123 lines

  1. Texterkennung (ALT-O)
  2. =====================
  3. Diese Einstellungen beeinflussen die Texterkennung.
  4.  
  5. Lernmodus:
  6. ----------
  7. Wird  ein  Zeichen  nicht  mit genügend hoher Übereinstimmung erkannt,
  8. wird   der   Benutzer   bei  eingeschaltetem  Lernmodus  befragt,  bei
  9. ausgeschaltetem  Lernmodus   wird   ein   ▌Ersatzzeichen▌KORREKT▌  in  den  Text 
  10. eingefügt.
  11.  
  12. Übereinstimmung:
  13. ----------------
  14. Hier  gibt  man  an,  wie groß die Übereinstimmung beim Vergleich sein
  15. muß, um ein Zeichen als 'erkannt' zu betrachten.
  16.  
  17. Akustisches Signal:
  18. -------------------
  19. Wenn  die  Zeichensatz-Datenbank  ziemlich  vollständig  ist, wird das
  20. Programm  sehr  selten (wenn überhaupt) nach einem Zeichen fragen. Man
  21. kann  das  Programm  daher  alleine  rechnen lassen; wenn dieser Knopf
  22. angewählt  ist, macht das Programm mit einem PING aufmerksam, wenn die
  23. Erkennung  beendet  ist  oder  das  Programm nach einem Zeichen fragt.
  24. (Dieser  Ton kann auch mit dem Kontrollfeld abgeschaltet werden! D.h.:
  25. Wenn  man ihn im Kontrollfeld abgeschaltet hat, wird man niemals einen
  26. Ton hören!)
  27.  
  28. Nachfrage immer mit Dialogbox:
  29. ------------------------------
  30. Ist  dieser  Button  angewählt,  fragt  das  Programm  immer mit einer
  31. ▌Dialogbox▌TESTART▌  nach  unbekannten  Zeichen. In dieser Dialogbox muß man das
  32. Zeichen   identifizieren   (falls   mehrere   Zeichen   zusammenhängen
  33. (Ligaturen),  kann man auch entsprechen viele ASCII-Zeichen eingeben).
  34. In  der  Dialogbox  kann man ausserdem angeben, ob das Zeichen auch in
  35. die Datenbank bzw. in den Text übernommen werden soll.
  36. Das  Identifizieren der Zeichen kann beschleunigt werden, wenn man die
  37. Dialogbox   nicht   benutzt.   Das  Programm  markiert  dann  nur  das
  38. entsprechende   Zeichen   in  den  Fenstern.  Man  kann  das  gesuchte
  39. ASCII-Zeichen  einfach  über  die  Tastatur  eingeben. Auf diese Weise
  40. können  aber  keine  Ligaturen identifiziert werden. Um auch Ligaturen
  41. bearbeiten   zu  können,  kann  man  jederzeit  durch  Druck  auf  die
  42. Leertaste die oben beschriebene Dialogbox aufrufen.
  43.  
  44. Aufnahme in Datenbank, in Text einfügen:
  45. ----------------------------------------
  46. Diese  beiden  Buttons  entsprechen den Buttons im dem ▌Dialog▌TESTART▌, mit dem
  47. das  Programm  nach  unbekannten  Zeichen fragt. Hier kann man angeben
  48. wie  die  Buttons  in  Nachfrage-Dialog  voreingestellt werden sollen.
  49. Hier  kann  man sich eine geeignete Voreinstellungen wählen, sodaß man
  50. während  des Erkennungsvorganges möglichst wenige Einstellungen ändern
  51. muß.  Wenn  die Zeichensatz-Datenbank schon (fast) komplett ist, fragt
  52. das  Programm  meist nach Buchstaben die durch Scanfehler verunstaltet
  53. wurden   (diese   Buchstaben   sollen  dann  nicht  in  die  Datenbank
  54. aufgenommen  werden), daher ist es günstig die 'Aufnahme in Datenbank'
  55. auszuschalten.  Wurde  eine  Datenbank  neu angelegt, ist es günstiger
  56. 'Aufnahme in Datenbank' einzuschalten.
  57.  
  58. Filter für vereinzelte Punkte:
  59. ------------------------------
  60. Ist  diese  Option  eingeschaltet,  werden  vereinzelte  Pixel  in den
  61. Zeichen  herausgefiltert.  Bei  einer Scannerauflösung von nur 200 dpi
  62. sollte  man  diese Option ausschalten, bei hoeheren Scannerauflösungen
  63. kann   aber  bei  eingeschaltetem  Filter  die  Erkennungsrate  erhöht
  64. werden.  Sind  die gescannten Bilder sauber (keine vereinzelten Pixel)
  65. kann man diese Option ausschalten um Rechenzeit zu sparen.
  66.  
  67. Vergleich der Zeichen:
  68. ----------------------
  69. Das  Programm  vergleicht  die  Zeichen des Bildes mit den Zeichen der
  70. Zeichensatz-Datenbank.  Zum  Vergleich  wird das zu erkennende Zeichen
  71. wie eine Schablone über die Zeichen der Datenbank gelegt.
  72.  
  73.   genau:
  74.   ------
  75.       Diese  Einstellung  verbraucht  die  meiste  Rechenzeit, da beim
  76.       Vergleich   der   Zeichen   die   Unterschiede   unterschiedlich
  77.       gewichtet  werden. Dadurch wird aber die höchste Genauigkeit und
  78.       die höchste Trefferquote erreicht.
  79.  
  80.   mittel:
  81.   -------
  82.       Bei  dieser  Einstellung  wird  die  Gewichtung der Unterschiede
  83.       nicht  durchgeführt. Dadurch spart man Rechenzeit. Bei kleineren
  84.       Scannerauflösungen  kann  es  dann  passieren,  daß das Programm
  85.       bestimmte  Zeichen  verwechselt. Bei höheren Auflösungen (ab 300
  86.       DPI)   dürfte  es  aber  wenig  Probleme  geben,  so  daß  diese
  87.       Einstellung  durchaus  eine  Alternative zur 'genau'-Einstellung
  88.       darstellt.
  89.  
  90.   schnell:
  91.   --------
  92.       Wie   in   'mittel',   aber   ein   wenig  schneller  und  etwas
  93.       fehleranfälliger.
  94.  
  95. Qualität des Bildes:
  96. --------------------
  97. Stammt   das  Bild  aus  einem  Scanner,  sollte  man  hier  unbedingt
  98. 'Scanner'  auswählen.  Kleine  Unterschiede  zwischen den Zeichen, die
  99. durch   das   Scannen   entstehen,   werden   in   dieser  Einstellung
  100. herausgefiltert (Filter).
  101. Hat  man  aber  ein  Bild  aus einem Zeichenprogramm, werden die darin
  102. vorkommenden  Texte  (Systemzeichensatz  oder GDOS- Zeichensätze) sehr
  103. wahrscheinlich   ohne   jegliche   Störung   sein   (im  Gegensatz  zu
  104. eingescannten   Texten,   die   normalerweise  immer  Störungen  [z.B.
  105. unsaubere  Ränder]  enthalten).  In  diesem  Fall sollte man 'präzise'
  106. einstellen.   Dann  werden  ALLE  Unterschiede  zwischen  den  Zeichen
  107. beachtet.  Wenn diese Zeichensätze sehr klein sind, müssen tatsächlich
  108. ALLE  Unterschiede  beachtet  werden (die oben genannten Filter lassen
  109. sonst  eventuell  nicht  mehr  viel  von  den  Zeichen  übrig).  Diese
  110. Einstellung spart übrigens einige Rechenzeit.
  111.  
  112. Schräglage des Bildes:
  113. ----------------------
  114. Hier  kann  man  einstellen,  ob das Programm auch schräg eingescannte
  115. Vorlagen  akzeptiert.  Bei  normalem  Text  kann man diese Einstellung
  116. immer  so wählen, daß auch eine stärkere Schäglage akzeptiert wird. Es
  117. kann  aber in seltenen Fällen notwendig sein, eine schwache Schräglage
  118. einzustellen:   Bei   Texten   die   kurze   Absätze   oder   einzelne
  119. (freistehende)  kurze  Zeilen enthalten, die sehr(!!!) weit eingerückt
  120. sind,   kann  es  passieren,  daß  das  Programm  diese  Zeilen  sonst
  121. 'übersieht'.  (Beispiel:  Briefe  mit  oben  rechts stehendem Absender
  122. (weit eingerückt bezüglich dem restlichen Text))
  123.