home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / ai / 4274 < prev    next >
Encoding:
Internet Message Format  |  1992-11-14  |  17.5 KB

  1. Xref: sparky comp.ai:4274 comp.sys.hp:12890 comp.sys.mac.apps:17173
  2. Newsgroups: comp.ai,comp.sys.hp,comp.sys.mac.apps
  3. Path: sparky!uunet!pageworks.com!world!eff!sol.ctr.columbia.edu!usc!elroy.jpl.nasa.gov!ucla-cs!oahu.cs.ucla.edu!shank
  4. From: shank@oahu.cs.ucla.edu (Eric Shank)
  5. Subject: Re: Info sought on Optical Character Readers (for music)
  6. Message-ID: <1992Nov13.195927.9127@cs.ucla.edu>
  7. Sender: usenet@cs.ucla.edu (Mr Usenet)
  8. Nntp-Posting-Host: oahu.cs.ucla.edu
  9. Organization: UCLA, Computer Science Department
  10. References: <1992Nov12.175043.3232@rdg.dec.com>
  11. Date: Fri, 13 Nov 92 19:59:27 GMT
  12. Lines: 368
  13.  
  14. Regarding Optical Music Recognition-
  15.  
  16. This is somewhat of a frequently asked question; following is a
  17. summary of articles I've collected from the net over the years, to
  18. which I would add that two theses (one old PhD and one recent MS have
  19. been done at MIT on the subject; check your local library)
  20.  
  21.  
  22. Following articles are both questions and answers, reposted without
  23. authors permission:
  24. __________
  25.  
  26. Date: 1 May 90 22:45:27 GMT
  27. From: Torkil Hammer <torkil%psivax@net.uu.uunet>
  28. Subject: optical music recognition
  29. To: music-research@prg
  30. Message-ID: <3382@psivax.UUCP>
  31.  
  32. I have a large collection of printed sheet music and want to convert
  33. it into machine readable form through a scanner.  Is there any software
  34. available for doing the "optical character recognition" of the notes?
  35.  
  36. Torkil Hammer
  37.  
  38. ------------------------------
  39. Date: 19 Oct 90 16:31:42 GMT
  40. From: Dave Baines <dwb%cs.ed.ac.uk%edcastle%ukc%mcsun@net.uu.uunet>
  41. Subject: Optical musical score recognition
  42. To: music-research@prg
  43. Message-ID: <714@skye.cs.ed.ac.uk>
  44.  
  45. I am posting this for a student here who does not have access to UseNet so
  46. please send any replies directly to him via E-mail.
  47.  
  48. ------------------------------------------------------------------------------
  49.  
  50. Optical Musical Score Recognition
  51.  
  52.   I am seeking information for my final year honours project at the department
  53. of Computer Science, Edinburgh University.  The project involves interpreting
  54. musical features (notes, sharp signs etc) from an image produced by an optical
  55. scanner.  Has anyone ever tackled a similar project, or know of any literature
  56. in this field ?
  57.  
  58. Thanks in advance,
  59. David Bainbridge (dxb@lfcs.ed.ac.uk)
  60.  
  61. ------------------------------
  62.  
  63. Date: 21 Oct 90 04:43:28 GMT
  64. From: John M Davison <davisonj%en.ecn.purdue.edu%noose.ecn.purdue.edu%samsung%zaphod.mps.ohio-state.edu@edu.ohio-state.cis.tut>
  65. Subject: Optical musical score recognition
  66. To: music-research@prg
  67. Message-ID: <1990Oct21.044328.12156@ecn.purdue.edu>
  68.  
  69.     The WABOT-1 musical robot, which is pictured on the cover of
  70. the Spring 1986 _Computer_Music_Journal_ and written up in the Summer
  71. 1986 _Computer_Music_Journal_, could (unless I am mistaken) scan a
  72. page of sheet music in about ten seconds and convert the score to a
  73. sequence which WABOT-1 would subsequently play.  (The sheet music was
  74. scanned in one shot; real-time scanning, such as a human performer
  75. would do, was not implemented.)
  76.  
  77. -davisonj@en.ecn.purdue.edu
  78.  
  79. ------------------------------
  80.  
  81. Date: Sun, 21 Oct 90 09:03:11 BST
  82. From: Stephen.Page@prg
  83. Subject: Optical musical score recognition
  84. To: dxb@uk.ac.ed.lfcs
  85. Cc: music-research
  86. Message-ID: <9010210803.AA02026@msc0.prg.ox.ac.uk>
  87.  
  88. I'm not aware of any recent work in this field (it seems to have died away...)
  89. but here are the basic references for foundation work in the field:
  90.  
  91. Clarke, A.T., B.M. Browne, and M.P. Thorne. "Inexpensive Optical Character
  92. Recognition of Musical Notation: A New Alternative for Publishers." In 
  93. _Computers_and_Music_Research_. Proceedings of a conference held on 11-14 April
  94. 1988. [Ed. Alan Marsden.] Lancaster: Centre for Research into the Applications
  95. of Computers to Music, Univ. of Lancaster, [1988], pp. 84-87.
  96.  
  97. Kassler, Michael. "An Essay Towards Specification of a Music-Reading Machine."
  98. In _Musicology_and_the_Computer_. Ed. Barry S. Brook. New York: City Univ.
  99. of New York Press, 1970, pp. 151-175.
  100.  
  101. Kassler, Michael. "Optical Character-Recognition of Printed Music: A Review
  102. of Two Dissertations." _Prespectives_of_New_Music_, 11, No. 1 (Fall-Winter
  103. 1972), p. 250.
  104.  
  105. Prerau, David S. "Computer Pattern Recognition of Printed Music." _AFIPS_
  106. Conference_Proceedings_, 39 (1971), 153-62.
  107.  
  108. Prerau, David S. "Computer Pattern Recognition of Standard Engraved Musical
  109. Notation," Diss. MIT. 1970.
  110.  
  111. Prerau, David S. "DO-RE-MI: A Program that Recognises Music Notation.
  112. _Computers_and_the_Humanities_, 9 (1975), 25-29.
  113.  
  114. Roads, Curtis. "The Tsukuba Musical Robot." _Computer_Music_Journal_, 10,
  115. Mo. 2 (Summer 1986), 39-43.
  116.  
  117.  
  118. Here's an excerpt from my dissertation (Stephen Dowland Page, "Computer Tools
  119. for Music Information Retreival," Diss. Oxford 1988, pp. 43-44):
  120.  
  121. "The use of a device which can scan a printed score is, in theory, the most
  122. effective method of music input. It allows exact, uninterpreted input of the
  123. written score. [Previously I had discussed the differences between written,
  124. performed, and perceived music.]
  125.  
  126. Michael Kassler set out an abstract specification for a "music-reading machine"
  127. in 1970. He defined the input (a certain vocabulary of musical symbols) and
  128. output (a stream of binary digits) of a machine he called "M". Although this
  129. is an interesting exercise, "M" has never been built and probably will not be
  130. built for many years. There are many practical problems to be solved at a
  131. lower level--for example, the recognition of simple note shapes.
  132.  
  133. Although optical scanning of printed letterpress is at an advanced stage,[1]
  134. music has many more complexities than text, such as the variable shape of
  135. slurs, the wide variety of music fonts, and the two-dimensional nature of a
  136. score, which must be recognised by a machine. David Prerau, in his 1970
  137. dissertation, put forward optical methods which have been successfully
  138. tested on a small fragment of two-part music. A recent Japanese experiment,
  139. a "musical robot" which can play music on a keyboard, incorporates optical
  140. scanning. Beyond these few projects, development of optical scanning has
  141. been very limited.
  142.  
  143. [1] The Kurzweil Data Entry Machine has been in use in literary studies for
  144. a number of years. After "training" on a font it can read pages of text into
  145. the computer faster, and more reliably, than a person can type them. Already
  146. this machine has been made obsolescent by faster, more 'intelligent'
  147. machines."
  148.  
  149. This is a tricky area. Watch your scope!
  150. By the way, Michael Kassler is now connected to an email network, as
  151.     michael@extro.ucc.su.oz.au .
  152.  
  153.  
  154.                                                 - Dr Stephen Page
  155. ------------------------------------------------------------------------------
  156. 4 Harwood Terrace             Technology and Systems Integration Division
  157. Fulham                        Andersen Consulting
  158. London    SW6 2AB             2 Arundel Street
  159. U.K.                          London    WC2R 3LT
  160.                               U.K.
  161.  
  162. JANET   sdpage@uk.ac.oxford.prg                    | Work 071-438 5000
  163. ARPA    sdpage%prg.oxford.ac.uk@nsfnet-relay.ac.uk |   +44-71-438 5000
  164. UUCP    ...!ukc!ox-prg!sdpage                      | Home 071-371 9981
  165. BITNET  sdpage%uk.ac.oxford.prg@AC.UK              |   +44-71-371 9981
  166.         Fax: 071-831 1133    Telex: 8812711
  167.  
  168. ------------------------------
  169. Music-Research Digest       Sat, 27 Oct 90       Volume 5 : Issue  88 
  170.  
  171. Today's Topics:
  172.                          ANSI X3V1.8M update
  173.               Optical musical score recognition (2 msgs)
  174.  
  175.  
  176. *** Send contributions to Music-Research@uk.ac.oxford.prg
  177. *** Send administrative requests to Music-Research-Request
  178.  
  179. *** Overseas users should reverse UK addresses and give gateway if necessary
  180. ***     e.g.   Music-Research@prg.oxford.ac.uk
  181. ***     or     Music-Research%prg.oxford.ac.uk@nsfnet-relay.ac.uk
  182.  
  183. *** Back issues, index, etc.: send "help" in a message to archive-server
  184. ***   @uk.ac.oxford.prg (in the UK) or @hplpm.hpl.hp.com (elsewhere)
  185.  
  186. ----------------------------------------------------------------------
  187.  
  188. Date: Wed, 24 Oct 90 12:04:37 EDT
  189. From: "Steven R. Newcomb" <srn%cmr@edu.fsu.cc.mailer>
  190. Subject: ANSI X3V1.8M update
  191. To: Music-Research <Music-Research%uk.ac.oxford.prg@uk.ac.nsfnet-relay>
  192. Message-ID: <9010241604.AA24468@cmrp.cmr.uucp>
  193.  
  194. This note is an update on the ANSI X3V1.8M Standard Music Description Language
  195. (SMDL) activity, and it is prompted by Edward L. Stauff's query in MRD 5.86.
  196.  
  197. >   1.  How (if at all) can I get a copy of the spec?  (ANSI in NYC doesn't
  198. >       seem to know about it.)
  199.  
  200. The committee no longer distributes the working drafts of the standards
  201. in electronic form for various reasons.  The drafts available from the
  202. MRD archives are hopelessly obsolete and they should probably be
  203. discarded (or heavily disclaimered) to minimize confusion.  Printed
  204. copies of the most recent draft is always available from the X3V1.8M
  205. Secretariat, The Computer Music Association, Larry Austin, President, P. 
  206. O.  Box 1634, San Francisco, California 64101-1634 USA.  I don't know
  207. what they are charging these days per page, but there will be a
  208. duplicating, handling, and postage charge.  If all you are interested in
  209. is technical information, then what you want is two documents:
  210. X3V1.8M/SD-7 (ANSI Project X3.749-D, "HyTime", which is the music and
  211. time-based document time and hyperlink standard, about 80 pp.), and
  212. X3V1.8M/SD-8 (ANSI Project X3.542-D, "Standard Music Description
  213. Language [SMDL]", which is everything about music except for what is in
  214. SD-7, about 60 pp).  In addition, I would urge you to consider ordering
  215. X3V1.8M/SD-0, our General Information and Guide to Participation
  216. document (4 pp); X3V1.8M/SD-2, our Document Register (a list of
  217. committee documents, most of which are also available from the
  218. Secretariat); X3V1.8M/SD-3 (list of current committee participants);
  219. X3V1.8M/SD-6 (User Needs and Functional Specification). 
  220.  
  221. Please be informed that all of these documents are works in progress and
  222. they can all be expected to change.  The next meeting will be in San
  223. Jose, California, Nov 12-16, 1990.  The meeting announcement and draft
  224. agenda can be found in document X3V1.8M/90-66. 
  225.  
  226. It is not particularly astonishing that whoever Mr.  Stauff talked to at
  227. ANSI does not know about X3V1.8M, since it functions at a leaf node of
  228. the ANSI organization, which is vast and variegated.  Perhaps if he had
  229. mentioned the project numbers, they would have been more helpful.  Thank
  230. you for bringing this glitch to my attention; I'll talk to them and
  231. bring them up to speed on this. 
  232.  
  233. >   2.  Has it become stable enough that it's worth starting to develop tools
  234. >       to support it?
  235.  
  236. I would not recommend large investments in SMDL tools per se as yet,
  237. since the standard is not complete.  It's been fairly stable for a year,
  238. but that does not mean that some major unforeseen problem won't force
  239. some parts to be redesigned between now and its adoption as an ANSI
  240. and/or ISO standard.  TO ALL WHO ARE INTERESTED IN BUILDING SMDL TOOLS:
  241. please obtain the documents listed above, read them carefully, and give
  242. us your constructive criticism and suggestions; contributing written
  243. responses to the documents makes you an official participant in the
  244. X3V1.8M standard-building process.  Your input is vital to the technical
  245. success of SMDL. 
  246.  
  247. >   3.  Is anyone currently developing tools for it (i.e. editor, print
  248. >       formatter, conversions, etc.)?
  249.  
  250. At the Florida State University Center for Music Research we intend to
  251. build tools, but we're not doing it yet, because we are concentrating
  252. our efforts on refining the standard itself.
  253.  
  254. Although I cannot speak on their behalf, many people and organizations
  255. have expressed their eagerness to apply HyTime and SMDL to various
  256. problems.  The array of applications turns out to be staggeringly
  257. large.  Even the U. S. Air Force has expressed great interest, believe it
  258. or not.
  259.  
  260. One application particularly exciting to me is representing scores which
  261. have been read by an automatic music-reading system.  Dr.  Nicholas
  262. Carter of the University of Surrey has expressed interest in adapting
  263. his evolving system for automatic score reading in such a way as to
  264. output SMDL.  (Dr.  Carter is working with the Oxford University Press
  265. on this project.  Incidentally, I was surprised that his project, which
  266. is the most advanced one I know of, was not mentioned in the recent
  267. rundown of score reading projects here in MRD.)
  268.  
  269. >   4.  Is there any indication that the MIDI software industry is going to
  270. >       support it?  That is, can I expect programs like SCORE, FINALE,
  271. >       COPYIST, etc. to support it someday?
  272.  
  273. Dave Oppenheim of OpCode Systems is a longtime participant; he has kept
  274. us abreast of MIDI files standards so that we can avoid leaving out any
  275. of the information in that information set.  We have not heard from Dr. 
  276. T's, and we do not know what their plans are.  Dave Kusek, President of
  277. Passport Designs, which markets the Score product, was actually the host
  278. of the first meeting of X3V1.8M (1986, Half Moon Bay, California). 
  279. Passport has not chosen to send any representatives to meetings
  280. recently, but they are well aware of our activities.  Coda Music
  281. Software, which markets the Finale product, was an enthusiastic
  282. supporter of X3V1.8M, and it hosted a meeting in Minneapolis (1987). 
  283. Coda remains interested and aware; I know this because they were
  284. accidentally deleted from the mailing list (when their usual
  285. representative to the committee left the company) and we were asked to
  286. place their CEO's name on our list as his replacement.  To summarize, I
  287. would say that the prospects for universal (or near-universal) support
  288. of SMDL are excellent, but for now we must focus on making the standard
  289. technically excellent.  The rest will follow naturally.  Other music
  290. industry participants: American Interactive Media (Philips-Sony); Human
  291. Touch; Yamaha International; MIDIWORLD; Warner New Media; Interactive
  292. Media Systems; Graphire Corporation. 
  293.  
  294. The HyTime ("everything but pitch and meter") aspect of the project has
  295. attracted considerable interest; here are some of those industrial
  296. participants and observers: National Institute of Standards and
  297. Technology (NIST); Mead Data Central; Optical Publishing Association;
  298. General Electric; SGML Associates; Hewlett-Packard; Search Technology;
  299. IBM; Bellcore; Xerox; Army Research Institute; Central Intelligence
  300. Agency; CCETT; Bruel & Kjaer; Digital Equipment Corp; Oak Ridge National
  301. Laboratory; APL Integrators; ANSER Analytic Services; Knowledge
  302. Management Associates; Apple Computer; Oster & Associates; Industrial
  303. Technology Institute; Information Navigation; SoftQuad, Inc.; Mitre
  304. Corporation; Tektronix Labs; Bull HN Information Systems; Sun
  305. Microsystems; Taunton Engineering; Texas Instruments; Planning Analysis
  306. Corporation; Context Corporation. 
  307.  
  308. > Any information (including opinions, speculation, etc.) would be appreciated.
  309. > My interest in SMDL is in the possibility of using it as a vehicle for
  310. > exchanging music (scores) across the network.
  311.  
  312. Because SMDL is an application of Standard Generalized Markup Language (SGML;
  313. ISO 8879-1986), SMDL files will probably normally be plain ascii text
  314. files, which will easily transmit as e-mail or whatever.
  315.  
  316. ------------------------------
  317.  
  318. Date: Wed, 24 Oct 90 19:05:32 BST
  319. From: Nicholas Paul Carter <phs1nc@uk.ac.surrey.ph>
  320. Subject: Optical musical score recognition
  321. To: Music-Research@prg
  322. Message-ID: <861.9010241805@Zaphod.ph.surrey.ac.uk>
  323.  
  324. re: Music-Research Digest- Volume 5 : Issue  87 
  325.     and the messages concerning 'Optical musical score recognition'.
  326.  
  327. Contrary to Stephen Page's remark that "work in this field ... seems to have
  328. died away", our work into 'automatic recognition of printed music' is continuing
  329. here at the University of Surrey, as is that of several other research groups
  330. around the world.
  331. Anyone interested in this subject may wish to consult the following:-
  332.  
  333. "Computing in Musicology A Directory of Research", eds. Hewlett, W. and
  334. Selfridge-Field, E., Center for Computer Assisted Research in the Humanities,
  335. Menlo Park, CA., October 1989, 31-34.
  336. "Automatic Recognition of Printed Music in the Context of Electronic
  337. Publishing", Carter, N.P., PhD thesis, University of Surrey, February 1989.
  338. "Acquisition, Representation, and Reconstruction of Printed Music by Computer:
  339. A Review", Carter, N.P., Bacon, R.A. and Messenger, T., Computers and the
  340. Humanities, 22(2), 1988, 117-136.
  341. "Automatic Recognition of Music Notation", Carter, N.P. and Bacon, R.A.,
  342. pre-Proceedings of the International Association for Pattern Recognition
  343. Workshop on Syntactic and Structural Pattern Recognition, Murray Hill, NJ,
  344. 1990, 482.
  345.  
  346. Dr Nicholas Carter
  347. Research Officer, Depts. of Physics and Music, University of Surrey, U.K.
  348.  
  349. ------------------------------
  350.  
  351. Date: 22 Oct 90 14:57:03 GMT
  352. From: "Mr. P. H. Smith" <mrsmith%rice-chex%ai-lab%snorkelwacker@edu.ohio-state.cis.tut>
  353. Subject: Optical musical score recognition
  354. To: music-research@prg
  355. Message-ID: <11501@life.ai.mit.edu>
  356.  
  357. In article <714@skye.cs.ed.ac.uk> dxb@lfcs.ed.ac.uk (David Bainbridge) writes:
  358. >  I am seeking information for my final year honours project at the
  359. >department of Computer Science, Edinburgh University.  The project
  360. >involves interpreting musical features (notes, sharp signs etc) from
  361. >an image produced by an optical scanner.  Has anyone ever tackled a
  362. >similar project, or know of any literature in this field ?
  363.  
  364.  
  365. Alan Ruttenberg at the MIT Media Lab just showed me a demonstration of
  366. his optical score reading stuff.  His system finds beams, note heads,
  367. barlines, staff lines, accidentals, clefs, etc.  He's still working on
  368. it and has yet to implement the midi transcription.  Anyway, you
  369. should talk to him about it.
  370.  
  371. email: alanr@media-lab.media.mit.edu
  372.  
  373. Paul
  374. mrsmith@ai.mit.edu
  375.  
  376. ------------------------------
  377.  
  378. End of Music-Research Digest
  379.  
  380. -- 
  381. * These words are mine alone, but I make no claim to original thought *
  382.