home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #20 / NN_1992_20.iso / spool / comp / ai / neuraln / 3451 < prev    next >
Encoding:
Text File  |  1992-09-10  |  16.7 KB  |  421 lines

  1. Newsgroups: comp.ai.neural-nets
  2. Path: sparky!uunet!gatech!darwin.sura.net!jvnc.net!nuscc!iti.gov.sg!news
  3. From: kaykit@iti.gov.sg (Chan Kay Kit)
  4. Subject: Information on OCR products: a summary
  5. Message-ID: <1992Sep11.062202.4395@iti.gov.sg>
  6. Sender: news@iti.gov.sg (News Admin)
  7. Reply-To: kaykit@iti.gov.sg
  8. Organization: Information Technology Institute, National Computer Board, S'pore
  9. Date: Fri, 11 Sep 1992 06:22:02 GMT
  10. Lines: 409
  11.  
  12.  
  13. Hello everybody {:-)
  14.  
  15.     Thanks to all those who responded to my call for help on OCR
  16. products. I have appended below all the information I received for anyone
  17. who might be interested:
  18.  
  19. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  20. From alanb@well.sf.ca.us Wed Sep  2 18:53:27 1992
  21.  
  22.  
  23. Please ask george@visus.com for information about the OCR capabilities of
  24. PaperSight on the NeXT.  He can point you to customers who could supply the
  25. kind of evaluation you are looking for.
  26.  
  27. Alan
  28.  
  29. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  30. From fs@fortec.tuwien.ac.at Wed Sep  2 02:44:34 1992
  31.  
  32.  
  33. Hi,
  34.  
  35. I read your query on comp.ai.neural-nets.
  36.  
  37. There is a company in Austria - Europe. They sell a very good product 
  38. called "proLector". Get in contact with them.
  39.  
  40. Sorry, I have only the posting address:
  41.  
  42. improx
  43. Rennweg 83
  44. A-2345 Brunn am Gebirge
  45. Tel: +43/2236/33506
  46. FAX: +43/2236/32732
  47.  
  48. regards,
  49. Franz Peter SEILER
  50.  
  51. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  52. From gilad@optics.jct.ac.il Tue Sep  1 18:39:02 1992
  53.  
  54.  
  55. Hi!
  56. you can find shareware software on OCR, in the SIMTEL20,
  57. and you can download them. try to find the file OCRSHR22.ZIP.
  58. and there is something more in the same directory.
  59.  
  60. there you can find a documantation file about OCR. in the OCRSHARE22 file.
  61.  
  62.  
  63.  
  64.  
  65.             Bye
  66. I will be glad if you can send me the mails you will get about OCR.
  67.  
  68.  
  69.             my e-mail is : gilad@optics.jct.ac.il
  70.  
  71. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  72. From seymour@m31.dgbt.doc.ca Tue Sep  1 19:43:31 1992
  73.  
  74.  
  75. The paper
  76.  
  77. "A Report on the Accuracy of OCR Devices"
  78.  
  79. by Stephen V. Rice, Junichi Kanai and Thomas A. Nartker
  80. Information Science Research Institute
  81. University of Nevada, Las Vegas
  82. 4505 Maryland Parkway
  83. Las Vegas, NV 89154-4021
  84.  
  85. maybe useful.
  86.  
  87. It compares 
  88. Caere Omni Page Professional
  89. Calera RS 9000
  90. ExperVision TypeReader
  91. Kurzweil 5200
  92. Recognita Plus
  93. and Toshiba ExpressReader
  94.  
  95. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  96. From @scapa.cs.ualberta.ca:arms@cs.ualberta.ca Tue Sep  1 07:39:26 1992
  97.  
  98.  
  99. Since you mentioned noise, you might be interested in our OCR demo
  100. for adaptive logic networks (ALNs).  It will be a while before anything
  101. commercial is available, but three people have said they want to produce
  102. ALN-OCR systems.
  103.  
  104. Sorry if this is not what you are interested in.
  105.  
  106. Best wishes,
  107.  
  108. Bill
  109.  
  110.  
  111. The atree Adaptive Logic Network Simulation Package and References
  112.  
  113. The latest release of the atree adaptive logic network (ALN)
  114. simulation package, atree release 2.7, is available via anonymous ftp
  115. from menaik.cs.ualberta.ca [129.128.4.241] in directory pub/ (use
  116. binary mode).  It runs on IBM PCs and compatibles under Windows 3.x.
  117. Included is documentation and ON-LINE HELP that will help you to
  118. understand the basic principles of adaptive logic networks and enable
  119. you to try out some examples of your own creation.  All C and C++
  120. source code is provided.
  121.  
  122. The atree package is not a toy, despite the fact that it is used for
  123. demonstration purposes, and is non-commercial.  Experimenters are
  124. using it on challenging problems of medicine, physics and the
  125. environment.  It has been used to grade beef based on ultrasound
  126. images, design hardware to discriminate particles produced by an
  127. accelerator, help to design walking prostheses for spinal cord damaged
  128. patients and measure the composition of tarsands from spectral data.
  129.  
  130. It is possible to use inexpensive, off-the-shelf programmable logic
  131. devices to realize the results of training ALNs in high-speed
  132. hardware, though we do not provide those facilities in the atree
  133. software.
  134.  
  135. Please read the license, and the warranty (that protects the
  136. developers, not the users).  All neural networks which are "black
  137. boxes" trained and tested on sample data are possibly unsafe, i.e.
  138. unexpected outputs can occur. The current free atree package is no
  139. exception.  A commercial version is planned for later release, and
  140. eventually a safe design methodology will be available.
  141.  
  142. We shall use release 2.7 as an example here, but please see what the
  143. latest version number is before you ftp the software by examining the
  144. contents of pub/.  Atree release 2.7 is available in either of two
  145. files in this directory: atre27.exe and a27exe.exe.  The file
  146. atre27.exe contains the full C and C++ sources for those who want to
  147. program some applications using Borland C++ 3.x and Application
  148. Frameworks, or some similar C/C++ development environment.  The other,
  149. smaller file contains just the executables for those who just want to
  150. try out atree release 2.7.
  151.  
  152. Everyone should have a look at the OCR demo!  It has been referred to
  153. as "quite impressive" by experts in the OCR area.  Test yourself
  154. against the trained ALNs, and scribble in your own characters (any
  155. language, any alphabet) to see how noisy and distorted the characters
  156. can be, yet still be recognized by the logic networks.  The demo can
  157. be obtained without the rest in pub/a27ocr.exe.
  158.  
  159. To set up your software on the PC under Windows 3.x, it is recommended
  160. that you execute atre27.exe in your main directory, whereupon it will
  161. create a subdirectory atree_27 and extract everything into it.
  162. Running "setup" in that directory will create a group of icons you can
  163. use to invoke demos and the facilities for programming adaptive logic
  164. network applications in the lf language.  The "Open" command gives you
  165. access to numerous instructive examples.  Clicking on the Help button
  166. gives you access to explanations of theory and code.
  167.  
  168. The Unix version, atree release 2.0, will be upgraded sometime to add
  169. some of the functionality of release 2.7.  It is not yet capable of
  170. the nice color displays of the Windows version, but besides running on
  171. Unix workstations it can be easily ported to Macintosh, Amiga, and
  172. other machines.
  173.  
  174. Thanks to all those who have sent comments about their work on ALNs,
  175. and have helped us to develop new concepts at a rapid rate. We would
  176. appreciate your continued help in finding any problems in the latest
  177. release.
  178.  
  179. Welcome to the world of adaptive logic networks!
  180.  
  181. Bill
  182.  
  183. ***************************************************
  184. Prof. William W. Armstrong, Computing Science Dept.
  185. University of Alberta; Edmonton, Alberta, Canada T6G 2H1
  186. arms@cs.ualberta.ca Tel(403)492 2374 FAX 492 1071
  187. ***************************************************
  188.  
  189.     Recommended Publications on Adaptive Logic Networks
  190.  
  191. W. Armstrong, Adaptive Boolean Logic Element, U. S. Patent 3934231,
  192. Feb. 28, 1974 (multiple filings in various countries),
  193. assigned to Dendronic Decisions Limited.
  194.  
  195. G. v. Bochmann, W. Armstrong, Properties of Boolean Functions
  196. with a Tree Decomposition, BIT 13, 1974. pp. 1-13.
  197.  
  198. W. Armstrong, Gilles Godbout: Use of Boolean Tree Functions to Perform
  199. High-Speed Pattern Classification and Related Tasks, Dept. d'IRO,
  200. Universite de Montreal, Doc. de Travail #53, 1974. (unpublished,
  201. except in summary form as follows:)
  202.  
  203. W. Armstrong and G. Godbout, "Properties of Binary Trees
  204. of Flexible Elements Useful in Pattern Recognition", IEEE 1975
  205. International Conf. on Cybernetics and Society, San Francisco, 1975,
  206. IEEE Cat. No. 75 CHO 997-7 SMC, pp. 447-449.
  207.  
  208. W. Armstrong and J. Gecsei, "Architecture of a Tree-based
  209. Image Processor", 12th Asilomar Conf. on Circuits, Systems
  210. and Computers, Pacific Grove, Calif., 1978, pp. 345-349.
  211.  
  212. W. Armstrong and J. Gecsei, "Adaptation Algorithms for
  213. Binary Tree Networks", IEEE Trans. on Systems, Man and
  214. Cybernetics, 9, 1979, pp. 276-285.
  215.  
  216. W. Armstrong, J.-D. Liang, D. Lin, S. Reynolds, Experiments Using
  217. Parsimonious Adaptive Logic, Tech. Rept. TR 90-30, Department of
  218. Computing Science, University of Alberta, Edmonton, Alberta, Canada,
  219. T6G 2H1.  This is now available in a revised form via anonymous FTP
  220. from menaik.cs.ualberta.ca [129.128.4.241] in pub/atree2.ps.Z (the
  221. title of the revised document is "Some Results concerning Adaptive
  222. Logic Networks").
  223.  
  224. W. Armstrong, A. Dwelly, J.-D. Liang, D. Lin, S. Reynolds, Learning
  225. and Generalization in Adaptive Logic Networks, in Artificial Neural
  226. Networks, Proceedings of the 1991 International Conference on
  227. Artificial Neural Networks ( ICANN'91), Espoo,
  228. Finland, June 24-28, 1991, T. Kohonen, K.Makisara, O. Simula, J. Kangas eds.
  229. Elsevier Science Publishing Co. Inc. N. Y. 1991, vol. 2, pp. 1173-1176.
  230.  
  231. Allen G. Supynuk, William W. Armstrong, Adaptive Logic Networks and
  232. Robot Control, Proc. Vision Interface Conference '92, also called
  233. AI/VI/GI '92, Vancouver B. C., May 11-15, 1992, pp. 181 - 186.
  234.  
  235. R. B. Stein, A. Kostov, M. Belanger, W. W. Armstrong and D. B.
  236. Popovic, Methods to Control Functional Electrical Stimulation in
  237. Walking, First International FES Symposium, Sendai, Japan, July 23 -
  238. 25, 1992 (Invited paper, to appear).
  239.  
  240. Aleksandar Kostov, Richard B. Stein, William W. Armstrong, Monroe
  241. Thomas, Evaluation of Adaptive Logic Networks for Control of Walking
  242. in Paralyzed Patients, 14th Ann. Int'l Conf. IEEE Engineering in
  243. Medicine and Biology Society, Paris, France, Oct. 29 - Nov. 1, 1992
  244. (to appear).
  245.  
  246. In case you have difficulty in obtaining the above documents or the
  247. atree release 2.0 software for Unix or release 2.7 for IBM-PC and
  248. compatibles under Windows, the software and all of the above documents
  249. prior to 1991 can be obtained from the University of Alberta for a
  250. media fee to cover the costs of copying and mailing of $150
  251. (Canadian), made payable to the University of Alberta.  Two 3 1/2"
  252. diskettes are normally included but an attempt will be made to satisfy
  253. needs for other media, e.g. tapes.  Orders can be sent c/o Professor
  254. W. W.  Armstrong, Department of Computing Science, University of
  255. Alberta, Edmonton, Alberta, Canada, T6G 2H1.
  256.  
  257. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  258. From tie013@its.csiro.au Tue Sep  1 07:38:26 1992
  259.  
  260.  
  261. Some time ago we went through n exercise of looking at OCR products for
  262. the PC.  We wanted a scanner and OCR software.  We eventually purchased
  263. Wordscan from Calera Recognition Systems, 2500 Augustine Drive, Santa
  264. Clara, CA, USA, 95054.  This runs under Windows and works very well.
  265.  
  266. The scanner we bought is a Hewlett Packard ScanJet IIc, a flat bed A4.
  267. Wordscan will interpret a well printed and formatted sheet with 100%
  268. accuracy.  It will also put it out in any one of 20 or 30 word processor
  269. formats.  It retains bolding, underlining, italics, point sizes etc, etc.
  270. You can also switch that off if you wish.  
  271.  
  272. I cannot speak for others such as OmniPage (the only other one in the 
  273. race that I could find) as when I tried to run the demo we got with the
  274. scanner it would not work with windows running in standard or real mode,
  275. and, at the time, I could not run windows in enhanced mode.
  276.  
  277. I would be interested in the features you discover about other packages.
  278. Are you planning to produce a report or list of your findings? 
  279. If so I would like to receive a copy.
  280.  
  281. If I can give you any more information please let me know.
  282.  
  283. Best regards  Garth Tier
  284.  
  285. -- 
  286. Garth Tier who is in Alice Springs not Canberra!
  287.  
  288. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  289. From jax@polyslo.csc.calpoly.edu Tue Sep  1 00:33:16 1992
  290.  
  291.  
  292.   What platform are you going to be working on? Unix or PC or Macintosh or ??
  293.   For the PC, PC Magazine and other PC publications have published reviews
  294.   on OCR systems that go into a good amount of detail on their capabilities.
  295.   I have not seen a review for a Unix based OCR yet.
  296.    Many of the points you addressed before were given in the PC articles.
  297.    If you are running on a PC platform, I can dig out a my old PC mags and
  298.    let you know the volume number for the OCR review article.
  299.  
  300.   The reason I am (somewhat) knowledgable on the subject is that at Cal Poly
  301.  some students (myself included) just finished a undergraduate class in 
  302.  computer vision applications. We wrote a full optical character recogntion
  303.  system that can take in a text image, checks to see if their is any rotation
  304.  on the image (if the text was scanned in say at a 5 degree angle) and
  305.  rotates the image back to the proper upright position. This step has 
  306.  increased the average accuracy of recognition rates. A few weeks ago I posted
  307.  my own software up for public ftp on polyslo.csc.calpoly.edu.
  308.   At the end of the class I was obtaining greater than 99% accuracy on 
  309.  non-rotated images, and 98% acc. on rotated images. My program does 
  310.  auto-binarization, so that a dark background, or lots of static will 
  311.  be filtered out (such as in low quality fax transmission). Some other 
  312.  students went even further that myself and were able to obtain 98%+ 
  313.  recognition rates even on very hazy/noisy images. I only recieved a B
  314.  in the class, so you can see that my project was not top of the line.
  315.  Other students were regularly obtaining full, 100% acc. on non-rotated
  316.  images, and 99+% on rotated images. Currently the project only handles one
  317.  font type at a time (the neural net COULD be trained on multiple fonts, but
  318.  this could bring the recog rates down to around 97%) but since size is not
  319.  one of the paramters used for the net, different point size fonts can be
  320.  used with reasonably the same rates of recognition.
  321.    If you would like more information then what I have provided, feel free
  322.  to mail me, or you can also send mail to the professor who taught the class,
  323.  as he would most likely have many sources of reference for this type of
  324.  material. His email address is:
  325.     cstaley@zeus.calpoly.edu
  326.  
  327.  Good Luck.
  328.  
  329. Shawn Jacques
  330. jax@polyslo.csc.calpoly.edu
  331. sjacques@nemesis.calpoly.edu
  332.  
  333. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  334. From eha@phoenix.oulu.fi Mon Aug 31 15:17:36 1992
  335.  
  336.  
  337. Hi :)
  338. >     There are many commercial OCR engines on the market right now for
  339. > reading printed text. I am aware of products like the Kurzweil K-5000 and
  340. > Discover 7320 Model 5 (from Xerox), OmniPage (from Caere Corp.), SAIC (from
  341. > Differential Processing System) and NestorReader.
  342. Those are on Mac and PC. On other computers like Amiga, there is some also.
  343. I must tell that I have used only OmniPage, and heard of some others...
  344.  
  345. >     I wonder if anybody has done independent evaluation of any OCR
  346. > products, since such information would be useful to potential users. 
  347. > Specifically, I need answers to the following questions:
  348. > (i) name of product and company which produces it  
  349.  
  350. Not quite sure about the name, but it's made by Miggraph. They sell it with 
  351. their own scanner, but the product works with files too.
  352. > (ii) fonts and point sizes handled by product
  353. >From 6 up to 127 if I remember right. Maybe even bigger.
  354.  
  355. > (iii) whether the OCR engine exhibits true multifont and "multisize"
  356. >       capability i.e. is able to recognize text without the user
  357. >       having to specify in advance its font type and point size.
  358.  
  359. Yes, I think so, as I remember reading that it handles multiple fonts, and
  360. has some learning algorithm.
  361. >       If so, what is the accuracy over a variety of fonts and point sizes?
  362. >       If not, what is the accuracy over common fonts like Courier, Times
  363. >       Roman and Helvetica and point sizes from 8 to 24 points? 
  364. I don't know about those numbers. All fonts are included in the starter 
  365. package.
  366.  
  367. > (iv) What are the commercial OCR products, if any, that can
  368. >      1. recognise a page of text containing a mixture of fonts and point
  369. >     sizes at greater than 98% accuracy?
  370. >      2. recognise a page of text containing a single known font and a
  371. >     range of point sizes at greater than 99% accuracy?
  372. No comments. 
  373.  
  374. > (v) Are there any commercial OCR systems that accept noisy input or 
  375. >     text on shaded background eg. carbon and photostated/fax copies and
  376. >     still maintain an acceptable accuracy (say greater than 95%)?
  377.  
  378. Not sure, but I think that software can find text in IFF files. Not quite sure.
  379. And it can read Fax'd files too.
  380.  
  381. > Further, if there are any evaluations of commercial handwritten OCR systems, 
  382. > I will also be interested to hear about them.
  383. > Please email all replies/references to kaykit@iti.gov.sg. If there are 
  384. > enough responses, I will summarise.
  385.  
  386. Please do. And I have no other knowledge of that Miggraph product except
  387. what I have read from some news.
  388. > Thanks!
  389. >
  390. YRWLCM
  391.  
  392. Esa Haapaniemi
  393. University of Oulu
  394. Finland
  395.  
  396. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  397.  
  398.  
  399. Kay Kit
  400.  
  401.  
  402.  
  403. ---
  404. Kay-Kit CHAN                | Internet: kaykit@iti.gov.sg
  405. Knowledge Systems Lab            | Bitnet:   kaykit@itivax
  406. Information Technology Institute    | Tel:      (65) 772-0920
  407. National Computer Board of Singapore    | Fax:      (65) 770-3043
  408.  
  409.