home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / bit / listserv / edtech / 1692 < prev    next >
Encoding:
Text File  |  1992-08-22  |  2.1 KB  |  42 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!UWF.BITNET!STANKULI
  3. Approved-By:  "EDTECH Moderator" <21765EDT@MSU.BITNET>
  4. Message-ID: <EDTECH%92082112521308@OHSTVMA.IRCC.OHIO-STATE.EDU>
  5. Newsgroups: bit.listserv.edtech
  6. Approved: NETNEWS@AUVM.AMERICAN.EDU
  7. Date:         Fri, 21 Aug 1992 12:49:47 EDT
  8. Sender:       "EDTECH - Educational Technology" <EDTECH@OHSTVMA.BITNET>
  9. From:         stan kulikowski ii <STANKULI@UWF.BITNET>
  10. Subject:      proposal estimates for OCR scanning?
  11. Lines: 29
  12.  
  13.   i am preparing a proposal which needs to include substantial optical
  14. character recognition (OCR scanning) to capture printed textbook materials into
  15. a machine-readable format.  i need some expertise on what expenses to plan for.
  16. the project will collect all reading assignments for students in a class and
  17. then scan in as much as we can per month for statistical analysis of the
  18. material.
  19.  
  20.   as i understand the process, we scan text in a fixed font and then have to
  21. hand-correct errors in the range of 5-10 characters per 1000.  this then needs
  22. a third pass to verify the correction.  result is about 1 char per 100K error.
  23. through-put rate is about the same as hiring a skilled secretary (55 wpm) to
  24. type in the text, reading from the hardcopy.  (secretary is without dual
  25. reading for 1/100K verification).  from this, can i estimate that 2 graduate
  26. students (20 hr per week) could process about 200M per 9 month academic year?
  27.  
  28.   can i assume that a 486 cpu with 10M ram is adequate engine for OCR?  what
  29. scanner and software expenses should i request?  hand-held or flatbed? i have
  30. heard that OCR is prone to mechanical downtime.  would 2 sets of OCR hardware
  31. per cpu be adequate to keep the process moving?
  32.  
  33.   now, how much a wrinkle will it be to do this in russian (or other
  34. indoeuropean languages) rather than english?
  35.                                             stan
  36.  
  37.                         stankuli@UWF.bitnet
  38.      .
  39.     ===    we all help each other get a little further down the road,
  40.     ║ ║          or be damned for the fools that we are.
  41.     ---                       -- the motorcycle modificationalist's moto
  42.