home *** CD-ROM | disk | FTP | other *** search
/ Vectronix 2 / VECTRONIX2.iso / FILES_07 / OCR_13B.ZIP / OCR.13B / DOCS / OCR_E.DOC < prev    next >
Text File  |  1994-09-18  |  46KB  |  1,028 lines

  1. ============================================================================
  2.  
  3. OCR V1.3 (August 1994)
  4.  
  5. Optical Character Recognition for the Atari ST/STe/TT and Falcon by:
  6.  
  7. Alexander Clauss
  8. Stresemannstra₧e 44
  9. 64297 Darmstadt
  10. Germany
  11.  
  12. ----------------------------------------------------------------------------
  13. OCR is FREEWARE. It may be copied and used freely. Distribution by
  14. BBSs and PD libraries is allowed. However, OCR may NOT under ANY
  15. circumstances be included in CD-ROM collections or on magazine cover
  16. disks without my prior written permission.
  17. OCR and its documentation must always remain together and complete with
  18. all its files and documentation. Changes to the program and documentation
  19. is forbidden.
  20.  
  21. If you like OCR and use it regularly, you should send the author a
  22. (voluntary) donation. 20-30 DM seems reasonable but even if you don't
  23. send me any money at least send me a postcard or Email so I know whether
  24. any interest in OCR exists...
  25.  
  26. New versions are available directly from the author (please include disk,
  27. self addressed envelope and an international reply coupon to cover the
  28. return postage or you won't get a reply). Alternatively you download the
  29. latest release version from various FTP servers, try:
  30.  
  31. ftp.uni-kl.de (/pub/atari/misc) or
  32. ftp.isbiel.ch (atari/diverses))
  33.  
  34. If you'd like to be informed when a new version is released you can either
  35. send me your Email address or a SAE or postcard and I'll let you know by
  36. snailmail...
  37.  
  38.  
  39. OCR UK support and update service
  40. ============================================================================
  41. OCR is Freeware. If you like the program and use it regularly you should
  42. contribute a voluntary donation. Between £8-12 is reasonable but even a
  43. postcard or Email with feedback is better than nothing. Users who would
  44. like to make a voluntary contribution in the UK should:
  45.  
  46. a) Make a cheque for payable to J. Connor for any amount
  47. b) Be sure to include your name and address.
  48. c) Send cheque to UK Address below
  49.  
  50. Joe Connor, 65 Mill Road, Colchester, CO4 5LJ, England
  51.  
  52. Email: jconnor@cix.compulink.co.uk
  53.  
  54. The UK support scheme does NOT make any profit. A small part of your
  55. contribution is retained to cover the stationary, media, currency and
  56. postage costs incurred running the scheme.
  57.  
  58. Why you should contribute
  59. -------------------------
  60. The best reason for contributing is to support and encourage future English
  61. versions and support for OCR. You'll also receive a Master disk containing
  62. the latest version and access to the free update service.
  63.  
  64. UK users who have contributed to OCR can obtain the latest English Version
  65. from Joe Connor at any time, free of charge, by sending a Stamped Addressed
  66. Envelope enclosing an unlabelled floppy disk.
  67.  
  68.  
  69.  
  70. Important! I'm naturally interested to receive bug reports messages and/or
  71. suggestions for improvements. If you want to report a bug please always
  72. include the following details: computer type, TOS version, Auto folder
  73. programs and Accessories.
  74.  
  75. I'm particularly interested in constructive criticism and suggestions for
  76. future versions!
  77.  
  78. Contact
  79. ----------------------------------------------------------------------------
  80. Alexander Clauss
  81. Stresemannstra₧e 44
  82. D-64297 Darmstadt
  83. Germany
  84.  
  85. Email: aclauss@rbg.informatik.th-darmstadt.de
  86.  
  87. (If you don't get a reply from this Email address try the snailmail
  88. address).
  89.  
  90. Bank details
  91. ----------------------------------------------------------------------------
  92. Sparkasse Darmstadt
  93. Sort code: 508 501 50
  94. Account number: 0115032143
  95.  
  96. Please indicate your address on the transfer and state 'OCR & Version
  97. number' as reason for transfer.
  98.  
  99.  
  100. English translation
  101. -----------------------------------------------------------------------------
  102. Stefan Damerau
  103. Bergholm 31
  104. D-24857 Fahrdorf
  105.  
  106. Email: Stefan_Damerau@sl.maus.de
  107. !!!!!!!!!!!!!!!!!!!!!!IMPORTANT: MESSAGE LIMIT: 16kB!!!!!!!!!!!!!!!!!!!!!!
  108.  
  109.  
  110. Edited by Joe Connor. Email at: jconnor@cix.compulink.co.uk
  111.  
  112.  
  113.  
  114. ============================================================================
  115.  
  116. System requirements
  117. ----------------------------------------------------------------------------
  118. This program runs on all Atari ST/STe/TT and Falcon computers. OCR
  119. functions at any resolution above 496x200. 500 Kb RAM storage is sufficent
  120. but working with scanned images needs a lot of memory, the more RAM the
  121. better as usual! Naturally you'll also need a scanner.
  122.  
  123. Brief Overview
  124. --------------
  125. The program can recognise text in scanned images and save the text in
  126. ASCII, which can be further processed using your favourite text editor.
  127.  
  128. Correction arrangements can be defined to assist with difficult to
  129. recognise characters etc.
  130.  
  131. Individual databases can be created for each font.
  132.  
  133. There's a seperate mode to handle images from drawing packages where the
  134. texts were written using the system and/or GDOS fonts which takes much less
  135. computer time.
  136.  
  137. ============================================================================
  138. OCR functions
  139. ----------------------------------------------------------------------------
  140. Most menu options can also be selected using keyboard shortcuts. The
  141. corresponding shortcuts are indicated in brackets.
  142.  
  143.  
  144. Starting OCR
  145. ============
  146. When starting OCR from the command line using filenames these files will be
  147. automatically loaded. The following extensions are supported:
  148. - *.IMG (Images)
  149. - *.LIB (Character set databases)
  150. - *.KOR (Correction setups)
  151. More than one filename can be entered, but only one of each type will be
  152. loaded. If there's more than one of a type the one with the latest
  153. time/date stamp will be loaded.
  154.  
  155. MultiTOS Drag & drop
  156. --------------------
  157. Under MultiTOS any *.IMG, *.LIB or *.KOR files can be dragged from any
  158. desktop window to an OCR window and they will be loaded.
  159.  
  160. Dialogs
  161. -------
  162. All the dialogs can optionally be displayed in windows to avoid blocking
  163. other processes when multitasking. Single tasking users should continue
  164. to use normal dialogs as they are slightly faster.
  165.  
  166. All buttons are selectable using keyboard shortcuts. [Return] or [Enter]
  167. selects 'OK', [Undo] selects 'Cancel'. All other buttons can be selected
  168. by holding down the [Alternate] key and pressing the underscored
  169. character.
  170.  
  171. Pressing the [Insert] key inside any editable field invokes a dialog box
  172. containing the entire Atari character set. Any desired character can be
  173. selected using the mouse. This provides an easy method of accessing
  174. characters not normally avaialalble from the keyboard.
  175.  
  176. To move any non-windowed dialog click and drag (anywhere on the dialog
  177. background) using the mouse. Hold down the [Shift] key at the same time
  178. and the dialog turns invisible (apart from its border) which is handy if
  179. you need to read the contents of the screen underneath the dialog.
  180.  
  181.  
  182. Windows
  183. -------
  184. The following keyboard entries are available:
  185. [Control]+U Close top window
  186. [Control]+* Toggle between full screen and original window size
  187. [Control]+W Cycle through the open windows
  188.  
  189. Cursor keys; the contents of the topmost window is scrolled a line at a
  190. time in the corresponding direction.
  191. [Shift] + Cursor keys; the contents of the topmost window is scrolled a
  192. screen at a time in the corresponding direction.
  193.  
  194. When positioning the mouse above the upper window, this window can be
  195. scrolled by holding down the RIGHT Mouse button and moving the mouse.
  196. Holding down either [Shift] key increases the scrolling speed.
  197.  
  198.  
  199. Image windows
  200. -------------
  201. The scanned image is displayed in an image window. Because scanned images
  202. are often very large it's possible to display the image at a reduced size,
  203. 50%, 25%, 12.5% etc. Refer to 'Image size' for more details.
  204.  
  205. Marking block; using a click and drag action the mouse can be used to mark
  206. a block inside an Image window. If the block was not perfectly defined fist
  207. time round it can easily be repositioned by dragging one of the eight grab
  208. handles.
  209.  
  210. Deleting blocks (Cut block) [Control]+X; use this option to remove unwanted
  211. lines or other distractions which cannot be recognized as text.
  212.  
  213. Multi-column text can be processed by individually marking each column for
  214. recognition.
  215.  
  216. Text windows
  217. ------------
  218. After recognition text is output to this window.
  219.  
  220. Marking block; using a click and drag action the mouse can be used to mark
  221. a block consisting of complete lines inside the text window which are
  222. displayed in inverse video. The start/end line of the block can be adjusted
  223. by holding down either [Shift] key and clicking to mark the new block
  224. start/end line.
  225.  
  226. Cut block [Control]+X; the marked block is moved to the clipboard and
  227. removed from the text window.
  228. Copy block [Control]+C; the marked block is copied to the clipboard for use
  229. by another application which supports the Atari Clipboard.
  230. Paste block [Control]+V; pastes an IMG format file into the Image window.
  231.  
  232. ============================================================================
  233.  
  234. The OCR drop down menus
  235. ----------------------------------------------------------------------------
  236. ^ = [Control] key
  237. A = [Alternate] key
  238. S = [Shift] key
  239.  
  240. OCR         | File              | Edit                  | Options          |
  241. ---------------------------------------------------------------------------|
  242. About OCR.. | Load image...  ^Q | Mark all           ^A | Help        HELP |
  243. ------------| Save image... S^S | Remove block mark S^A |------------------|
  244. Accessories | Scan image...  ^R |-----------------------| Recognition.. AO |
  245. (and other  |-------------------| Cut                ^X | Font...       AF |
  246. Tasks)      | Save ASCII...  AS | Copy               ^C | Edit font...  AE |
  247. ------------| Delete ASCII...   | Paste              ^V | Corrections.. AC |
  248.             |-------------------|-----------------------|------------------|
  249.             | Load font...   AR | Image size...       > | General...    AA |
  250.             | Save font...   AW | Align picture...    > |------------------|
  251.             | Delete font...    |-----------------------| Save Options     |
  252.             |-------------------| Open text window   ^T |------------------|
  253.             | Quit           ^Q |-----------------------|
  254.             |-------------------| Start recognition  F1 |
  255.                                 | Resume recognition F2 |
  256.                                 | Break recognition ESC |
  257.                                 |-----------------------|
  258.  
  259.  
  260.       Submenus (Falcon & MTOS only!)
  261.  
  262.        * Image size  + Align Picture
  263.        |---------|   |----------------|
  264.        | 100% ^0 |   |Rotate +90°   AM|
  265.        |  50% ^1 |   |Rotate -90°   AN|
  266.        |  25% ^2 |   |Mirror horiz. AH|
  267.        |12.5% ^3 |   |Mirror vert.  AV|
  268.        |6.25% ^4 |   |----------------|
  269.        |---------|
  270.  
  271. Desk
  272. ----------------------------------------------------------------------------
  273. Important information about OCR and the author and programmer.
  274.  
  275.  
  276. File drop down menu
  277. ----------------------------------------------------------------------------
  278. Load image [Control]+O
  279. ----------------------
  280. Loads an image in monochrome GEM .IMG format. If an image is already loaded
  281. a dialog appears offering the following options:
  282.  
  283. Save; before the new image is loaded, the old image is saved.
  284. Load; the new image is loaded. Any changes made to the old image are lost.
  285. Cancel; the command is cancelled.
  286.  
  287. Save image [Shift][Control]+S
  288. -----------------------------
  289. Saves the image in monochrome GEM .IMG format.
  290.  
  291. Scan picture [Control]+R
  292. ------------------------
  293. Selecting this to scan some text. In order to do this a GDPS-Scanner
  294. driver must be installed. If more than one driver is available select the
  295. desired driver. Remember OCR currently only handles monochrome images. Set
  296. the scanner (and the driver) to sensible settings!
  297. If you work with MultiTOS with memory protection switched on, the MP-Flags
  298. in the header of the GDPS driver should be set to GLOBAL, because
  299. OCR and the GDPS driver need to have access to each others memory. OCR
  300. allows its memory to be accessed by the driver if it's installed as an
  301. desktop accessory, you don't need to change anything!
  302.  
  303. Save ASCII [Alternate]+S
  304. ------------------------
  305. Saves the recognised text in ASCII format. If an existing filename is
  306. selected the text in the original file will be overwritten or the text
  307. is appended to the selected file.
  308.  
  309. Delete ASCII
  310. ------------
  311. The recognised text is deleted. If the text has not yet been saved, a
  312. dialog appears offering the following options:
  313.  
  314. Save; the text is saved before it's deleted.
  315. Delete; the text is deleted.
  316. Cancel; the command is cancelled.
  317.  
  318. Load font [Alternate]+R
  319. -----------------------
  320. A font database is loaded. If the font database is already loaded in memory
  321. and it has not yet been saved, a dialog appears offering the following
  322. options:
  323.  
  324. Save; the current font database is saved before the new one is loaded.
  325. Load; the font database is loaded.
  326. Cancel; the command is cancelled.
  327.  
  328. Save font [Alternate]+W
  329. -----------------------
  330. The font database is saved.
  331.  
  332. Delete font
  333. -----------
  334. The font database is deleted. If the font database has not been saved a
  335. dialog appears offering the following options:
  336.  
  337. Save; the current font database is saved then removed from memory.
  338. Cancel; the command is cancelled.
  339.  
  340. If you wish to create a new database the old one must first be removed from
  341. memory.
  342.  
  343.  
  344. Quit program [Control]+Q
  345. ------------------------
  346. Exit the program using this option. If any data has not yet been saved, a
  347. dialog appears offering the following options:
  348.  
  349. Save; a last chance to save your data.
  350. Cancel; a last chance to remain in OCR.
  351. End; quit OCR and return to the desktop.
  352.  
  353.  
  354. Process drop down menu
  355. ----------------------------------------------------------------------------
  356. Mark all [Control]+A
  357. --------------------
  358. If the Image Window is topped; the entire image is marked as a block
  359. If the Text Window is topped; the entire text is marked as a block
  360.  
  361. Remove block marks [Shift][Control]+A
  362. -------------------------------------
  363. Removes the block markers from the topped window (either Image or Text).
  364.  
  365. Cut block [Control]+X
  366. ---------------------
  367. This option is only available if the GEM Clipboard is available (although
  368. the block will be removed anyway!) The clipboard must also be active in the
  369. 'General' dialog from the 'Options' drop down menu.
  370.  
  371. The marked block in either the Text or Image windows is moved to the
  372. clipboard and removed from the text window.
  373.  
  374. Copy block [Control]+C
  375. ----------------------
  376. This option is only available if the GEM Clipboard is available. The
  377. clipboard must also be active in the 'General' dialog from the 'Options'
  378. drop down menu.
  379. The marked block in either the Image or Text windows is copied to the
  380. Clipboard for use by another application which supports the Atari
  381. Clipboard protocol.
  382.  
  383. Atari Clipboard support
  384. -----------------------
  385. OCR supports the Atari Clipboard which normally uses a folder on your boot
  386. partition/disk, for example C:\CLIPBRD. Any Atari application which
  387. supports the Clipboard can easily exchange data. The Cut and Copy options
  388. export data to the clipboard and the Paste option imports Image data into
  389. OCR.
  390.  
  391. Here's how it might be used in practice; After scanning in an article from
  392. a magazine using an application eg 'SCAN.PRG' we call the Copy option in
  393. SCAN.PRG to copy the scanned image to the Clipboard in IMG format.
  394.  
  395. Next we switch to OCR, either directly in a multitasking environment or by
  396. leaving SCAN.PRG, and running OCR. In OCR we top the Image window and
  397. select 'Paste' to copy the image into OCR. After the text recognition is
  398. complete the text window is topped and using the 'Copy' option the ASCII
  399. format text is exported to the Clipboard. Now we switch to a word processor
  400. to edit/spell check the text before printing out the final result.
  401.  
  402. The clear advantage of the Clipboard is that no filenames were needed to
  403. get from scanned image to the printed text, everything took place inside
  404. the Clipboard folder automatically, a powerful tool!
  405.  
  406.  
  407. Paste block [Control]+V
  408. -------------------------------
  409. This option is only available if the Atari Clipboard is available. The
  410. clipboard must also be active in the 'General' dialog from the 'Options'
  411. drop down menu.
  412. This option is only available if the 'Image window' is topped. If the
  413. Clipboard contains a valid IMG file it will be pasted into the 'Image
  414. window'.
  415.  
  416.  
  417. Delete Block (Delete)
  418. ---------------------
  419. (No Menu item for this)
  420. The 'Delete' key removes a marked block. It won't be copied to the
  421. clipboard.
  422.  
  423.  
  424. Image size [Control]+0 to 4
  425. ---------------------------
  426. Using this menu option the image can be displayed at various sizes (this
  427. doesn't affect the 'Recognise text' function. Under MultiTOS or on the
  428. Falcon the image size is also adjustable through a submenu otherwise a
  429. Dialog box appears:
  430.  
  431. 100%  [Control]+0  1:1  Original size
  432. 50%   [Control]+1  1:2  Width and height of the image are both halved
  433. 25%   [Control]+2  1:4  One quarter full size
  434. 12.5% [Control]+3  1:8  One eighth full size
  435. 6.25% [Control]+4  1:16 One sixteenth full size
  436.  
  437.  
  438. Align picture (Alternate M,N,V,H)
  439. ---------------------------------
  440. Use this option to align text which has been scanned at 90 degrees (a very
  441. useful option for hand scanner users) MTOS or Falcon users can use the
  442. submenu.
  443.  
  444. Rotate +90° (Alt M)  : Rotates the picture 90 degrees anti clockwise
  445.  
  446. Rotate -90° (Alt N)  : Rotates the picture 90 degrees clockwise
  447.  
  448. Mirror horiz. (Alt H): If the scanner is moved in the 'wrong' direction the
  449.                        picture is mirrored in memory.
  450.  
  451. Mirror vert.  (Alt V): See 'Mirror horiz.'
  452.  
  453.  
  454.  
  455. Open text Window [Control]+T
  456. ----------------------------
  457. Opens the text Window where the recognised text is displayed.
  458.  
  459. Start recognition [F1]
  460. ----------------------
  461. Begins the Optical Character Recognition. If a block is marked only the
  462. contents of the block is analysed by the text recognition function. If no
  463. block is marked the entire image is analysed. It's important to remove
  464. extraneous lines (including underlines in some cases) and other details
  465. before starting so the individual characters can be recognised.
  466.  
  467. Important! Please ensure the correct font database is loaded. If no font
  468. database is available, use the 'Delete font' option, if available, to
  469. remove any font currently in memory. Select the 'Font' option from the
  470. 'Options; drop down menu and enter any relevant scanner settings into the
  471. dialog and set the width setting for the 'Space' character (see 'Font').
  472.  
  473. The program searches for the first line. A line must have at least one
  474. empty (white) pixel above and below the characters which must at least 5
  475. pixels high (I'm assuming nobody expects to be able to recognise letters
  476. smaller than 5 pixels high).
  477. Using these rules OCR can ignore underlined words automatically although in
  478. some case the descenders will cause problems. If this proves to be the case
  479. you'll have to remove the underlining manually using either the 'Block
  480. delete' or a suitable Art package.
  481.  
  482. After OCR indentifies a line, the individual characters are isolated and
  483. compared with the characters in the font database. The character from the
  484. database which best fits the character being analysed is inserted in the
  485. text Window. If there isn't a sufficiently similar character in the
  486. database to the character being analysed, within the preset degree of
  487. saftey, one of two alternatives occurs, dependent one the setting of 'Learn
  488. mode' option in the 'Text recognition' dialog from the 'Options' drop down
  489. menu:
  490.  
  491. a) If 'Learn mode' is active the mystery character(s) is displayed in a
  492. dialog box and marked in the image Window. Enter the appropriate ASCII
  493. character into the dialog box. Up to five ASCII characters can be entered
  494. because during scanning several characters can be merged together and in
  495. some cases OCR cannot separate them. Joined characters (Ligatures) can also
  496. be handled using this method. The following options are also available:
  497.  
  498. Include in database (default active); the character is included in the
  499. database for future use. Bear in mind that a bad scan may throw up
  500. character definitions you'll never need again, so use your judgement to
  501. decide whether to save the character for future use.
  502.  
  503. Import into text (default active); decide whether the ASCII characters
  504. should be inserted into the text.
  505.  
  506. Exit via 'OK' button; text recognition continues.
  507. Exit via 'Cancel' aborts text recognition.
  508.  
  509. b) If 'Learn mode' is not active; a '?' is placed in the text.
  510.  
  511. Both the method used to compare characters and the degree of agreement
  512. needed to consider a character as 'recognised' can be adjusted (Refer to
  513. 'Options').
  514.  
  515. Resume recognition [F2]
  516. -----------------------
  517. By pressing the [Esc] during recognition it's possible to break off
  518. recognition to adjust settings and resume recognition from the last
  519. position using the new settings, without starting from the beginning
  520. again.
  521. Resume recognition is only possible if the image remains unchanged so be
  522. careful not to re-size, cut or delete the marked block, use the rotate
  523. or mirror options or load another image. You can, however, change your
  524. view of the image using the 'Image size' option if desired.
  525.  
  526. Break recognition [Esc]
  527. -----------------------
  528. Pressing the [Esc] key aborts text recognition at the end of the current
  529. line, so it may take some time before recognition stops.
  530.  
  531. Options Drop down menu
  532. ----------------------------------------------------------------------------
  533. Text recognition [Alternate]+O
  534. ------------------------------
  535. A dialog appears in which the following settings influence text
  536. recognition:
  537.  
  538. Learn mode; if a character is not recognised using the preset levels of
  539. certainty, this option decides the next action which can either:
  540.  
  541. a) If Learn mode is active; a further dialog box appears to teach OCR about
  542.    the unrecognised character. Refer to 'Recognise text' for more details.
  543.  
  544. b) If 'Learn mode' is not active; a '?' is placed in the text.
  545.  
  546. Agreement; this option sets the degree of agreement neccessary before a
  547. character is considered recognised.
  548.  
  549. Sound bell on query; selecting this option sounds a ping when the end of
  550. the text or an unrecognised character is reached. If the font database is
  551. fairly complete, you'll hardly ever hear the ping. Deselect this option or
  552. use the Control panel to disable the ping if it annoys you.
  553.  
  554. Display training dialog:
  555.   If this option is selected (checkbox crossed) every time an
  556.   unrecognisable character is encountered the 'Indentify character'
  557.   training dialog appears ready for you to identify the character and add
  558.   it to the database, if the character comprised more than one character
  559.   (eg ligatures) these can also be entered.
  560.   Recognition can be speeded up by de-selecting this option (checkbox
  561.   empty) in which case OCR highlights the unrecognised character and you
  562.   can enter the ASCII character directly using the keyboard. If you need to
  563.   enter more than a single character (eg ligatures) press the [spacebar] to
  564.   display the 'Indentify character' training dialog.
  565.  
  566. Insert in database/text:
  567.   Sets the default action when a character isn't recognised. Using a
  568.   large database OCR is only likely to inquire when scanning errors are
  569.   encountered. Normally you wouldn't want to include these characters in the
  570.   font database and using this option you can switch it off permanently.
  571.  
  572.   Important! When you're in the process of creating a new database remember
  573.   to switch this option on again!
  574.  
  575.  
  576. Filter out single pixels:
  577.   If this option is set, single pixels within characters are filtered out.
  578.   Select this option (checkbox crossed) when scanning at a resolution
  579.   greater than 200dpi to improve the recogition rate. If your scans are
  580.   Because this takes longer you may prefer to de-select (checkbox empty)
  581.   this option if your scans are clean.
  582.  
  583. Character comparison; OCR attempts to recognise characters by placing the
  584. electronic equivalent of a 'stencil' over each character. Three levels of
  585. analysis are available:
  586.  
  587. Exact;  This takes a longer processing time than medium or fast due to
  588.         different priorities for the differences when checking the
  589.         characters but yields the highest level of accuracy.
  590.  
  591. Medium; This option does not assign different priorities to differences.
  592.         It's quicker but may incorrectly recognised when scanned at a low
  593.         scanning resolution. At 300dpi this shouldn't be a problem and is
  594.         worth a try before resorting to 'Exact'.
  595.  
  596. Fast;   Similar ro 'Medium' but a bit faster and probably a slightly
  597.         higher level of wrongly recognised characters.
  598.  
  599. Image quality; if the image originates from a scanner you should always
  600. select 'Scanner'. Small differences between the characters, which occur
  601. during scanning, are filtered using this setting.
  602.  
  603. Using the Scanner setting ALL differences between characters are
  604. considered.  As the size of the characters approaches the lower limit (5
  605. pixels high is the absolute minimum) the filters remove so much of the
  606. original character that recognition becomes unreliable and very time
  607. consuming.
  608.  
  609. If the image file originates from a drawing or DTP application and includes
  610. GDOS or system fonts these characters are likely to be precise so select
  611. the 'Precise' setting.
  612.  
  613. Image slope
  614. This option determines whether OCR will accept angled images. You can
  615. usually leave this option on unless the text consists of short lines with
  616. lots of preceding spaces. For example, envelopes with sender in the upper
  617. left hand corner and the address in the lower right hand corner.
  618.  
  619.  
  620. Font [Alternate]+F
  621. ------------------
  622. This option displays the options for the currently loaded database:
  623.  
  624. Minimum character size:
  625.   Width, Height:  These set the minimum size a character can occupy. Any
  626.                   part of the image smaller than the values set are
  627.                   ignored. Small dots caused during scanning are simply
  628.                   ignored.
  629.  
  630.   Measure...:     A crosshair shaped cursor appears, using a click and drag
  631.                   action, over the text image, draw a box to define the
  632.                   width and/or height of the minimum character size then
  633.                   release the mouse button.
  634.  
  635.   On exiting the dialog OCR checks these settings against all the
  636.   characters in the database to make sure no characters smaller than the
  637.   entered settings (otherwise they would not be checked). If any
  638.   character(s) smaller than the selected settings are found the settings
  639.   are changed to the size of the smallest character. An alert box informs
  640.   you if this has taken place.
  641.  
  642. Minimum space width:
  643.   Width:    Sets the minimum width occupied by a space character.
  644.  
  645.   Variable: If the font is monospaced (i.e. each space character is the
  646.             same width) deselect this option, otherwise leave it active.
  647.  
  648.   Measure:  A crosshair shaped cursor appears, using a click and drag action,
  649.             over the text image, draw a box to define the width of the space
  650.             between words and release the mouse button. If you change the
  651.             image viewing size the space width is automatically resized i.e
  652.             The size of the box relates to the image size)
  653.  
  654.             Important! This setting determines the MINIMUM width for spaces.
  655.  
  656. Comments; use these fields to enter any desired text describing the
  657. database, for example: font origin (magazine/book/typed) scanner settings
  658. (dpi/contrast/brightness). This text is stored with a .LIB extension along
  659. with the font database for easy future reference.
  660.  
  661.  
  662. Edit font [Alternate]+E
  663. -----------------------
  664. Select this option to display the 'Edit font' dialog. Using the options in
  665. this dialog you can undertake changes to fine tune the font database.
  666.  
  667. Font overview; using this option you can scroll through the characters. A
  668. character can be selected by clicking on it and it appears in the 'Selected
  669. character' area.
  670.  
  671. Selected character; this area is used to assign or change the ASCII
  672. character (or string of up to 5 ASCII characters) associated with the
  673. selected character. Using the 'Delete' button you can delete the selected
  674. character from the font database.
  675.  
  676. Search (for character); this option is used to move to the desired area of
  677. the ASCII table. 'Search' begins searching from the beginning, 'Again'
  678. continues searching from the current position. If the search is successful,
  679. the character found will be displayed in the 'Selected character' area.
  680.  
  681. Sort; the font database is sorted.
  682.  
  683. Statistics; an overview of the font database is displayed. From this
  684. display it's easy to see at a glance which characters have not yet been
  685. defined (or duplicated) along with other useful information. Only the main
  686. ASCII characters are displayed.
  687.  
  688. Correction [Alternate]+C
  689. ------------------------
  690. Selection this option to display the 'Correction' dialog.
  691.  
  692. Text recognition is not an exact science and is rarely perfect. There are
  693. characters which even the human eye has difficulty recognising except by
  694. context, eg '1'and 'l'. OCR is intelligent enough to consider the
  695. surrounding characters and will for example return '1' if the character
  696. being analysed is surrounded by numerals. Some characters are recognised as
  697. two or more individual signs, <"> for example is recognised as two <'>
  698. characters.
  699.  
  700. Using the options in the dialog these problems can be minimised.
  701.  
  702. Substitutions; enter a character string combination which should be
  703. replaced by another. You may like to define the previous example which
  704. converts <'><'> to <">.
  705.  
  706. Corrections; selecting this option enables the auto correction of very
  707. similar characters such as 1/l, l/I or 0/O.
  708.  
  709. Important! Bear in mind auto-correction is not foolproof and can in
  710. individual cases return the wrong result!
  711.  
  712. Text format:
  713. Original format; a line of text in the image becomes a line of ASCII text,
  714. preceding space characters can be ignored.
  715.  
  716. New format; the text format of the image is ignored and a completely new
  717. format is imposed according to the 'Line length' setting. This is
  718. particularly useful when converting narrow columns of text which often
  719. contain a liberal sprinkling of hypenated words.
  720.  
  721. Remove hyphens; this option attempts to reconstruct whole words. If you're
  722. converting German text which follows the 'k-kck' convention the additional
  723. option to convert these characters should be activated. For all non-German
  724. texts this option should be turned OFF.
  725.  
  726. Important! Generating a new format is not a good idea for program listings,
  727. source code, tables etc!)
  728.  
  729. Number of empty lines; set the number of lines in the ASCII text between
  730. seperate OCR runs.
  731.  
  732. Unknown character; defines the character used to replace unrecognised
  733. characters if 'Learn mode'.
  734.  
  735.  
  736. General [Alternate]+A
  737. ---------------------
  738. Dialogs:
  739. Dialog boxes can be set to appear centred on the screen or under the
  740. mouse pointer.
  741. The 'In windows' option (unsurprisingly) puts the dialogs into windows.
  742. In a multitasking environment the 'In windows' option allows other
  743. processes to continue whilst waiting for user input whereas non-windowed
  744. (modal) dialogs freeze all other processes.
  745. If you're NOT multitasking the normal (modal) dialogs are slightly
  746. faster.
  747.  
  748. Paths & Files; click on any box and use the file selector to set the
  749. corresponding path. On starting OCR these paths are automatically set so
  750. that loading/saving takes place to the desired directory.
  751.  
  752. Text Window; if this option is active the text window is opened
  753. automatically after starting OCR.
  754.  
  755. Clipboard; sets up which actions the clipboard will handle. This works with
  756. both the 'Image' and 'Text windows. This is handy to 'Cut/Copy' recognised
  757. text to the clipboard and NOT 'Cut/Copy' parts of the graphic (maybe images
  758. apart from the scanned text) over the text in the SCRAP.TXT (There's only
  759. ever one SCRAP.* in the clipboard). AND: Not copying images to the
  760. clipboard saves time.
  761.  
  762. Files; click on these boxes and using the file selector select any files
  763. you would like automatically loaded by OCR. You could use this option to
  764. load a default set of font database and/or set of correction rules.
  765.  
  766. Save
  767. ----
  768. Saves OCR's settings. The following settings are saved:
  769.  
  770. * All settings in the 'Recognition', 'Image size' and 'General' dialogs.
  771. * Window layout and size for both the image and text windows.
  772.  
  773. ============================================================================
  774.  
  775. Hints & tips
  776. ----------------------------------------------------------------------------
  777. When creating a font database always be sure to record the scanner
  778. settings. When you want to reuse the font database remember to set the
  779. scanner to the settings used when the database was created. If you don't do
  780. this the characters can easily appear thicker or thinner and can make the
  781. font database virtually useless.
  782.  
  783. Ideally keep a seperate database for each different font and point size you
  784. scan regularly. This keeps the databases small and considerably speeds up
  785. text recognition. It's probably not practical to stick rigidly to this rule
  786. as you may want to convert text containing both normal and italicised
  787. versions of the same font within a body of text...
  788.  
  789. Fill out the 'Comments' field including the scanner settings, font details
  790. and source conscientiously.
  791.  
  792. Make the best possible scan by adjusting the scanner settings. Adjust the
  793. brightness and contrast so that characters neither 'grow' together or start
  794. to break up ans show gaps.
  795. If you can't get a perfect scan it's preferable to accept characters
  796. which grow together rather than single characters which are starting to
  797. break up, try using a higher contrast.
  798.  
  799. The lower the scanner resolution the smaller the
  800. memory requirements for the database and the faster text recognition takes
  801. place. However, if you scan at too low a resolution characters will start
  802. to grow together. There's no substitute for experimentation to find the
  803. best combination of settings for each task.
  804. If your scanner only supports low resolutions (e.g. 200dpi or less) it
  805. takes more effort and time to get good results. Whilst building the
  806. database we strongly suggest you set the agreement to 90%. You'll find some
  807. characters (eg 'e', 'c', 'b' and 'h') may well be entered into the database
  808. more than once. After all important letters are in the database you can
  809. lower the agreement to around 85%-75% and get acceptable results without
  810. OCR asking too often.
  811.  
  812. By adjusting the 'Agreement' setting it's possible to get good results even
  813. at low scanner resolutions. If characters are repeatedly being incorrectly
  814. recognised increase the degree of agreement, although OCR is likely to
  815. display it's manual recognition dialog more often.
  816.  
  817. You can enter characters which are not available on the keyboard into
  818. dialogs in several different ways:
  819.  
  820. a) Using TOS versions later than 2.06/3.06 or MultiTOS hold down the
  821. [Alternate] key and enter the ASCII code for the desired character into the
  822. numeric keypad.
  823.  
  824. b) Install 'Let'em Fly' and press [Shift]+[Insert] and a further dialog
  825. appears from which you can select the desired character.
  826.  
  827. c) Use 'COMPOSE' by Pascal Fellerich
  828.  
  829. Switch off Clipboard support if you don't have a harddisk (Refer to the
  830. 'General' dialog in the 'Options' drop down menu).
  831. ============================================================================
  832.  
  833. Technical
  834. ----------------------------------------------------------------------------
  835. OCR supports:
  836. - The expanded WM_ARROWED and WM_BOTTOMED calls in Winx 2.2.
  837. - The VSCR Cookie, this means that dialogs will always be displayed in the
  838.   visible portion of a virtual screen.
  839. - On the Falcon (>=TOS 4.02) and under MultiTOS the 3D effects are supported
  840.   in dialog boxes.
  841. - Sub menus (for Image size)
  842. - MultiTOS Drag&Drop (ARGS)
  843.  
  844. RAM usage: Most RAM is used scanning the images. This RAM is needed twice,
  845. once in standard format (the ocr accesses the data from this part) and
  846. again in the format relevant to the display device used. Here's a guide:
  847.  
  848. A DIN A4 page (8*11 inches), scanned at 400 dpi uses around 1.7Mb.
  849. OCR needs 2 x 1.7Mb = 3.4 Mb.
  850.  
  851. ============================================================================
  852.  
  853. Known bugs and limitations
  854. ----------------------------------------------------------------------------
  855. In rare cases OCR cannot separate two characters where OCR believes they
  856. are only one character. For example where characters consist of several
  857. unconnected parts and all letters followed by a punctuation mark [i, j, ä
  858. etc.] or [ñ, å etc]. OCR does not try to seperate these letters into
  859. several parts, however OCR does attempt to seperate several overlapping
  860. letters although the degree of success is variable!
  861.  
  862. At high scanner resolutions the size of the database and computer time
  863. needed becomes unmanageable, especially on a standard ST.
  864.  
  865. The size of the characters is currently limited to a mazimum of 96x96
  866. pixels, which is enough to handle characters at 400 dpi with most scanners.
  867. (2-3 character ligatures still fit into 96*96 pixels).
  868.  
  869. An error in operating systems <=TOS 2.06 can cause OCR to display pixel
  870. garbage instead of a large picture. An error in the 'vr_trnfm()' function
  871. causes this. There's a patch by Laurenz Pruessner, S. and W. Behne that
  872. fixes this (Released in the German ST-Magazin 9/91). If you have a
  873. TT/Falcon or use an NVDI/VDI driver with a graphics card you don't need
  874. this fix.
  875.  
  876. Important! From OCR V1.2a this bug won't appear even without one of the
  877.            above fixes -a little trick makes this possible :-)
  878.  
  879. ============================================================================
  880.  
  881. The future
  882. ----------------------------------------------------------------------------
  883. The following enhancements are planned (suggestions are always gratefully
  884. received):
  885.  
  886. * Analysis of unrecognised characters after the complete image (block) has
  887.   been processed. OCR could attempt to automatically complete partial
  888.   databases asking the occasional question before reaching a final
  889.   conclusion.
  890.  
  891. * Batch mode: the ability to automatically handle different texts one using
  892.   a batch file (requires the first ToDo topic)
  893.  
  894. * Allows pixel level editing of the characters in the data base.
  895.  
  896. * Handle several font databases simultaneously. This would make it much
  897.   easier to handle multi font/point size text layouts.
  898.  
  899. ============================================================================
  900.  
  901. Other
  902. ----------------------------------------------------------------------------
  903. I recommend the installation of 'Let'emFly' by Oliver Scheel as this adds
  904. many enhanced features such as keyboard shortcuts, flying dialogs and
  905. character selection to dialog boxes.
  906.  
  907. Winx by Martin Osieka. With the help of this program up to 40 windows can
  908. be open simultaneously. Many other window enhancements are built-in.
  909.  
  910. All these programs are available on BBSs and FTP Servers or direct from the
  911. authors.
  912.  
  913. ============================================================================
  914.  
  915. Credits
  916. =======
  917. Many thanks to:
  918.  
  919. Jean-Jacques Ardoino: French RSC
  920. Joe Connor:           English RSC, English DOCs editor, UK Support
  921. Stefan Damerau:       English DOCs, all the hard work before Joe edits it!
  922. Henk van der Griendt: Dutch RSC, LEESMIJ
  923.  
  924.  
  925. Many thanks to all the people who made suggestions, sent bug reports or a
  926. donation And (last but not least) to all Beta testers.
  927.  
  928. ============================================================================
  929.  
  930. History
  931. ----------------------------------------------------------------------------
  932. Version  Date          Changes
  933. ----------------------------------------------------------------------------
  934. V1.3     10.08.1994    - Keyboard shortcuts in dialogs.
  935.                        - Bugfix: Bug in Searching for keyboard shortcuts
  936.                          in the menu fixed.
  937.                        - OCR now reacts faster to events during recognition.
  938.                        - Windowed dialogs ([Undo] same action as 'Cancel')
  939.                        - ST-Guide AND 1st-Guide format on-line Help provided.
  940.                        - Bugfix: Problems with 'I/l Correction' resolved
  941.                        - GDPS scanner driver support
  942.                        - Two buttons moved from 'General' to a better
  943.                          position in 'Recognition'.
  944.                        - Characters can be indentified without displaying
  945.                          the 'Indentify character' dialog which is much
  946.                          faster as [Return] after each character is no
  947.                          longer needed
  948.                        - Minimum character measurements can be set which
  949.                          results in better separation of characters and
  950.                          pixels in bad scans)
  951.                        - Filter can be switched ON/OFF
  952.                        - Checkboxes and radio buttons can be selected by
  953.                          clicking the text beside them.
  954.                        - Problems with some IMG's (those which contain more
  955.                          scanlines than defined in the header) fixed
  956.                        - New file format for *.LIB and *.KOR files.
  957.                          Naturally the old format is still supported
  958.  
  959. V1.25b   30.05.1994    - Bugfix: Bug in character separation fixed
  960.                        - Bugfix: Bug in 'Reformat' (Correction dialog)
  961.                          fixed
  962.  
  963. V1.25a   20.05.1994    - Bugfix: German RSC-file: Text of an Alert button
  964.                          shortened :-(
  965.                          10 characters per button is the limit and I hadn't
  966.                          noticed this because MultiDial and Let'em fly
  967.                          both support more.
  968.                        - Bugfix: Error handling 'Save ASCII' fixed
  969.                        - Bugfix: MTOS Problems when scrolling (apparently
  970.                          MTOS sends MU_BUTTON-events too)...
  971.                        - Info line in the graphics window. The image and
  972.                          block (if marked) sizes are displayed. During
  973.                          recognition progress is reported. When running
  974.                          under in a multitasking environment the busy bee
  975.                          is no longer displayed and control is enabled.
  976.                        - When running under in a multitasking environment
  977.                          the some menu items can now be selected during
  978.                          recognition.
  979.  
  980. V1.25    05.05.1994    - 'Resume recognition' now possible
  981.                        - Better recognition of <'> or <'> characters
  982.                        - 'k-kck' correction (hyphen removal option) can be
  983.                          switched off (important for all non-German texts)
  984.                        - Filenames: Missing extensions automatically added
  985.                        - Filenames (IMG, LIB, KOR) can be loaded automatically
  986.                          by passing them as parameters from a command line
  987.                        - Line seperation bug removed (caused some crashes)
  988.                        - Newer, faster algorithm for comparison using the
  989.                          'medium/fast' setting in the 'Recognition' dialog
  990.                        - AP_TERM (MTOS) support
  991.                        - Recognition speed dramatically increased
  992.                        - Image alignment (mirror/rotate) built-in (ready for
  993.                          direct OCR scanner support)
  994.                        - Moveable window contents using right mouse button
  995.                        - MultiTOS Drag&Drop support (ARGS)
  996.                        - English DOCs included.
  997.                          (Many thanks to Stefan Damerau and Joe Connor)
  998.  
  999. V1.2a    29.03.1994    - Character seperation bug removed (only caused
  1000.                          problems with 'thin' GDOS fonts; This bug was built
  1001.                          in with V1.2 first time :-/
  1002.                        - VDI font size calculation bug removed
  1003.  
  1004. V1.2     08.03.1994    - Moveable dialogs can be move transparently (by
  1005.                          holding down the [Shift] key)
  1006.                        - Faster recognition
  1007.                        - Better character separation
  1008.                        - Wildcard for unknown letters now user defined
  1009.                        - IMG load error fixed
  1010.                        - Oblique scans can now be recognised
  1011.                        - Several minor new features added
  1012.                        - First release with English manual/Resource and French
  1013.                          resource
  1014.  
  1015. V1.1a    06.02.1994    - Unneccessary 'redraws' removed
  1016.                        - Text block deleting error fixed
  1017.                        - Error in character comparison removed
  1018.  
  1019. V1.1     04.02.1994    - Clipboard support added
  1020.                        - Redraw error in scrolling fixed
  1021.  
  1022. V1.0a    01.02.1994    - Redraw error in the graphics window fixed
  1023.                        - OCR doesn't try to install a submenu under Mag!X 2.0
  1024.  
  1025. V1.0     30.01.1994    - First release
  1026. ----------------------------------------------------------------------------
  1027. EOF
  1028.