home *** CD-ROM | disk | FTP | other *** search
/ ftp.umcs.maine.edu / 2015-02-07.ftp.umcs.maine.edu.tar / ftp.umcs.maine.edu / pub / WISR / wisr4 / proceedings / detex / simos.detex < prev    next >
Text File  |  1992-04-05  |  19KB  |  375 lines

  1.  [12pt] article 
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  
  10.   Navigating Soundspace: 
  11. Modelling the Sound Domain At Real World 
  12.  
  13.   Mark A. Simos 
  14.        Organon Motives 
  15.        45 Shea Road 
  16.        Cambridge, MA 02140 
  17.        simos@hpcesra.ce.hp.com 
  18.          
  19.        Real World (Studios) Ltd. 
  20.        Box Mill, Box 
  21.        Wiltshire UK SN14 9PL 
  22.  
  23.    
  24.  
  25.  
  26.   
  27.  
  28. This paper described a project initiated by the author in collaboration
  29. with Real World Studios,
  30. that is exploring ways of applying software reuse concepts,
  31. methods and tools to the domain of synthesized and sampled sound artifacts. 
  32. The paper provides
  33. background on the project, motivates the applicability of software reuse
  34. concepts and tools in multimedia domains, describes overall project aims from
  35. a reuse perspective, and summarizes current project status.
  36. Digital sound resources exemplify a growing
  37. class of multimedia artifacts (such as fonts, clip art, and
  38. video images) that challenge our conventional notions of 
  39. software systems or modules, yet exhibit a number of ``software-like''
  40. attributes. 
  41. As collections
  42. of these artifacts 
  43. grow larger, more
  44. complex, heterogenous and semantically rich 
  45. we encounter problems of component
  46. classification, retrieval, configuration and generation strikingly similar to
  47. those addressed by software reuse research. 
  48. Reuse techniques may therefore contribute unique approaches within the
  49. area of audio and other 
  50. multimedia database technology. In addition,
  51. we expect to extend and generalize 
  52. reuse methods and tools by applying them beyond traditional software 
  53. domains; for example, widening our
  54. repertoire of domain modelling techniques and representations.
  55. Even initial inventory and modelling tasks
  56. have yielded important general lessons for domain analysis methods. 
  57. The project will also explore the possible role of multimedia technology 
  58. itself as a component of general-purpose library interfaces. 
  59.  
  60.   0.3in 
  61.  
  62.    Keywords:  Domain Analysis, Reusability, Multimedia, Domain Modelling 
  63.  
  64.  
  65.   Background (Problem Under Investigation) 
  66. Real World Studios is a world-class recording studio in Wiltshire,
  67. UK, founded by Peter Gabriel in 1987, and well-known in the music industry.
  68. A successful commercial studio, Real World's
  69. design, architecture and organization reflect its original
  70. intent: to create an ideal environment for recording live traditional music
  71. performances and, more generally, to foster creative collaboration between
  72. artists and technologists from many cultures. Real World is in fact a
  73. ``community of enterprises'', with formal or informal relations between several
  74. businesses situated in close proximity to the studio proper, including: WOMAD,
  75. a non-profit group that organizes international world music festivals in
  76. Europe, Canada, and Japan; Peter Gabriel, Ltd.,
  77. Real World Records, a joint venture record
  78. label/publishing company; Real World Design, an engineering company that
  79. designs and prototypes audio hardware designs; a video editing company; and a
  80. local computer music composer-in-residence.
  81.  
  82. For several years, studio engineers and musicians have struggled to organize
  83. Real World's extensive and ever-expanding
  84. holdings of sound material (including many unique
  85. recordings of musicians from African, Asian, and other non-Western musical
  86. traditions) into a library that can be more effectively accessed. 
  87. The studio is a technologically sophisticated environment; 
  88. while there is an immediate problem to be addressed,    
  89. artists and engineers have given considerable thought to 
  90. advanced technology issues involved in creating a library 
  91. system that will intelligently augment (rather than supplant)
  92. the current reliance on informal, intuitive, memory-based retrieval strategies.
  93.   Project Aims and Approach 
  94. The current project is
  95. an attempt to create synergy between the studio's needs and vision and the
  96. tools, methods and open research questions in the reuse field.
  97. Initiating the project involved a lengthy ``warming up'' process, including
  98. extensive and mutual education on software reuse and domain analysis concepts
  99. and how they could be applied to the sound modelling problem, and on the
  100. nature of the work at Real World and the studio's concept of the potential
  101. sound library system. 
  102. As a result, Real World has supported some initial inventory, tool development
  103. and domain analysis activity.
  104. In addition,
  105. under the auspices of the studio, and as affiliate research scientist with the
  106. Palo Alto-based Institute for Research on Learning, I am preparing a concepts
  107. document (or ``Manifesto'') integrating Real World's conception with my previous
  108. and parallel work in reuse ([SIMOS86, SIMOS88, SIMOS90b, SIMOS91]). 
  109. Sun Microsystems'
  110. Multimedia Platform Products group is contributing additional support for the
  111. proposal effort. The Manifesto will serve as the foundation for a more
  112. extensive project proposal; the intent is to fund the overall project with a
  113. combination of grants from corporate, academic, and possibly governmental
  114. (U.S., U.K. and/or EC) sources. Extracts from the library and software tools
  115. developed may also be
  116. productized for the commercial music market or for educational purposes.
  117. As the following sections will make clear, we intend to pioneer innovative
  118. approaches to domain analysis, domain modelling, and library navigation that
  119. should contribute significantly, not only to the state of the art in the
  120. computer music industry, but to reuse technology in general.
  121.  
  122.   Reuse in Multimedia Domains. 
  123. The domain of synthesized and sampled sound seems to fall outside the scope
  124. of the kind of software components addressed by reuse research. In fact,
  125. digital sound resources 
  126. exemplify a broad class of multimedia artifacts such as font and clip art
  127. libraries, stackware, video libraries, and animation, emerging as a natural
  128. by-product of the computer as a digital medium. 
  129. Since
  130. collections of these artifacts can be stored, copied and transformed as
  131. digital data, in managing these collections we confront classic reuse problems
  132. such as: proliferation of subtle and unmanaged variants; 
  133. the need for semantically expressive classification schemes; 
  134. and the interplay of static
  135. parts with a large repertoire of generative and transformational capabilities
  136. [SIMOS90a].
  137. One
  138. objective of the project is therefore to stress techniques and tools
  139. developed for software reuse in a multimedia information domain.
  140. This research
  141. should help recast these techniques and tools in more general form, and refine
  142. our understanding of their range of application (i.e., ``re-engineering for
  143. reuse'' our reuse research).
  144.  
  145. For example, a distinguishing feature of the software reuse problem involves 
  146. the
  147. ability to use both constructive and generative techniques in engineering
  148. a component. A desired program family might be implemented with a set of
  149. static variants, with a generator, or a hybrid solution, depending on features
  150. such as the binding-time characteristics of the implementation language.
  151. This duality of static vs. dynamic implementation is relevant in the
  152. digital sound domain as well: synthesizers and samplers have numerous
  153. capabilities for dynamically altering the envelope and other attributes of
  154. a sound resource, and to store this dynamically modified version as a separate
  155. entity. Domain modelling tools need to provide transparent access to variants
  156. obtained through static selection or dynamic operations on components.
  157.  
  158.   Alternative Modelling Techniques 
  159. A second, related objective of the research
  160. is to explore ethnographic methods of data acquisition and
  161. alternative domain modelling techniques for reuse. Software
  162. reuse researchers have considered a wide spectrum of representation/retrieval
  163. schemes (e.g., free text searches, keyword-in-context, faceted schemes 
  164. [Prieto87],
  165. entity-relationship models, semantic network, frame-based, and object-oriented
  166. systems). While these vary widely in terms of flexibility, formality and
  167. extensibility, most share the characteristic of being textual/verbal in nature
  168. (even when a graphic interface is provided to navigate through the
  169. taxonomy). Effective retrieval of multi-media information may need to rely on
  170. different kinds of models and navigation strategies---both using different
  171. kinds of linguistic cues and non-verbal cues as well.
  172. Certain ``virtuoso'' studio engineers and sound
  173. programmers are surprisingly skillful at accessing massive collections of
  174. sound samples with minimal tool support. By empirical study of their intuitive
  175. classification and retrieval techniques, we hope to gain important insights
  176. into effective navigation strategies that will prove relevant beyond 
  177. multimedia domains.
  178.  
  179. For example, in a ``spatial'' model, navigation
  180. through the component collection is projected into movement (continuous or
  181. quantized) through a qualitative ``space'', each dimension or axis of which is
  182. mapped to some parameter or polarity between features. As a familiar example
  183. in the typeface domain, movement from ``light'', through ``medium'', ``demi-bold'',
  184. and ``bold'' faces to ``extra-bold'' could be modelled as movement along an axis
  185. of ``font weight''.
  186. Preliminary analysis of the kinds of categories used in the
  187. sound domain suggest that qualitative polarities like ``fat-thin'' and
  188. ``warm-cool'' may be important ways of structuring the sound palette. An
  189. attribute of ``brightness'' vs. ``darkness'' (or ``fatness'' vs.  ``thinness'') might
  190. be associated with one axis of the sound (or timbre) space. 
  191.   This work
  192. correlates in interesting ways with the notion of a ``design space'' in
  193. software design [Lane90, Bell71]. Open research questions involve exploration
  194. of what
  195. reasonable measures for distance or neighborhood there may be in
  196. different domain spaces that potentially exhibit different geometries or even
  197. topologies. 
  198.   Domain Modelling as Composition 
  199. Many researchers in music perception and cognition have explored
  200. spatial models for the perception of musical sound quality (timbre).
  201. Most have
  202. hypothesized a general timbre space model,
  203. attempting to 
  204. correlate (and validate experimentally)
  205. specific parametric changes with intuitive, qualitative categories,
  206. and embodying these schemes in the interfaces to 
  207. computer music-based software systems. 
  208. In contrast, our approach will not rely on
  209. pre-determining a single classification scheme for the sound assets; 
  210. rather, we see
  211. the sound modelling system itself as a testbed supporting research into these
  212. questions.
  213. Our intent is to create a software platform enabling performers,
  214. composers, engineers and listeners to iteratively evolve their own models of
  215. the sound domain through working (and playing) with the system. We assume that
  216. the sound model will be actively shaped to reflect individual, stylistic and
  217. cultural preferences, and will metamorphose over time, in part through use of
  218. the technology itself. We intend to study both the modelling and retrieval
  219. process among a selected set of expert sound librarians, and document the
  220. changing process resulting from use of various iterations of the toolset as it
  221. develops. This will yield insights on how domain models develop and evolve
  222. over time, both through the work of individuals and through joint use within
  223. ``communities of practice''. In the long term, we hope to create an environment
  224. that encourages musicians and engineers to treat model-building as a kind of
  225. ``instrument-building'', extending and interwoven with composition and
  226. performance.
  227.   Use of Multimedia Information in Library Navigation. 
  228. The software platform
  229. must support a variety of modalities and strategies for organizing,
  230. classifying, and retrieving sounds within the collection. The ability to
  231. audition sounds in real time as part of active library browsing 
  232. will be crucial to the tool's long-term success as an intuitive aid. We will
  233. investigate where names, categories, and unorthodox linguistic strategies
  234. can help structure the sound model, and
  235. where auditory information itself can provide 
  236. feedback to the
  237. navigation process.
  238.  
  239. In exploring this set of capabilities for the sound library, we will also be
  240. considering the role that auditory cues can play in the general task of
  241. navigating large and conceptually complex information bases. Since humans
  242. process information differently in auditory, visual, and other sensory modes,
  243. we may find that sound can be an important facet of any intuitive,
  244. instrument-like, ``playable'' interface to a large library. At the same time,
  245. musicians often use imagery drawn from other sensory modes---not only visual
  246. terms (e.g., color associations) but terms invoking taste, smell and
  247. temperature. It may be that intuitive, ``instrumental'' access to any collection
  248. structured with reference to a given sensory mode relies on synaesthetic
  249. ``mappings'' to other sensory modes. If this thesis is substantiated, we
  250. envision linkage to further domain analysis experiments in other multimedia
  251. domains, simultaneously exploring the organization of multimedia in
  252. libraries and its role in library interfaces.
  253.   Current Status and Experience 
  254. The first phase of the project, currently underway, involves several distinct
  255. tasks. First, preparatory work has been done similar in many ways to the
  256. preparation one would do for ethnographic fieldwork. This preparatory
  257. fieldwork involved familiarization with studio personnel and the rhythms
  258. and culture of the studio environment through interviews, documentation of
  259. artifacts and physical characteristics of the workplace, both passive and
  260. participant observation, and education in the complex technical
  261. areas involved, such as comparative study of synthesizer and sampler
  262. architectures, digital audio processing and multi-track recording technology.
  263. It has been important to develop the project concept in collaboration with
  264. members of the Real World community as a whole. This collaborative design
  265. approach helps create a sense of ownership on the part of eventual users of
  266. the system that is vital to its adoption.
  267.  
  268. Partly in keeping with this collaborative notion, and partly to get something
  269. practical done as a first step, short-term development tasks were identified
  270. to provide some immediate benefits to the studio while examining in more depth
  271. some of the larger issues involved. This short-term work has had three main
  272. facets: 1) definition and implementation of a relational database system for
  273. tracking synthesizer patches and samples from the various pieces of hardware
  274. in the studio; 2) inventory and data collection, logging the actual sound
  275. materials themselves; and 3) initial domain modelling: documenting the
  276. existing, ad hoc classification system; analyzing, re-clustering and
  277. consolidating existing categories; and finding intuitive representations for
  278. these revised categories and their inter-relationships. 
  279.   Issues 
  280. These preliminary
  281. stages of the project---beginning an inventory of the current, ad hoc sound
  282. collection, assessing patterns of usage, and design of a simple relational
  283. database---have
  284. yielded valuable and practical insights into domain analysis and library
  285. retrieval issues. 
  286. It's quite useful to start with a simple
  287. approach, even to see where it proves inadequate.
  288. This approach is
  289. in keeping with Prieto-Diaz' sound recommendations for an ``Initiation'' phase in
  290. getting a reuse program established within an organization [Prieto90]. 
  291.  
  292. Perhaps most illuminating have been the unexpected complexities of even
  293. the ``simple'' inventory task.
  294. ``Software'', understood loosely as data stored in a digital medium, breaks
  295. down our notions of physical commodities, because it can
  296. be replicated ad infinitum with a simple copy command.
  297. On a practical note, this means that inventorying existing assets in a
  298. software environment may present formidable problems in sorting out true
  299. variant versions from different copies of the ``same'' piece of software. 
  300. For example, in cataloguing sounds on the KORG WaveStation, I found that 
  301. approximately one third of the inventory
  302. consisted of duplicate or multiple copies. There are many and varied
  303. reasons for copying sounds
  304. in the studio environment: touring disks, 
  305. temporary ``palettes'' created for composition, or ``fly-in''
  306. recordings for sessions.
  307. The problem is aggravated by copies that have been ``tweaked'' at a level
  308. of granularity far below their overall size (like two giants differing by
  309. a toenail).
  310. Duplication and redundancy can also be the result of
  311. automated system activity: some
  312. locations were filled with automatic loads from other banks within the
  313. machine; 
  314. in addition, some seeming
  315. inventory was in fact empty (though misleadingly titled ``Unnamed''!)---an
  316. ``artifact'' of the hardware. All these variants must be catalogued and
  317. sifted through in order to isolate the
  318. library assets proper. 
  319. These sorts of problems apply to more than the
  320. artifacts themselves. One machine that provided an on-line database with
  321. user-definable categories sabotaged most advantages of the category field,
  322. simply by neglecting to provide a way of viewing the list of categories
  323. themselves; this resulted in many spurious variants of category names, making
  324. the database extremely error-prone to use.  Similar issues are likely to arise
  325. in any software inventory activity.
  326.   Summary 
  327. The Real World Sound Modelling project is a novel application of reuse methods
  328. and techniques, exemplifying a broad class of multimedia database/library
  329. applications which may well become important new software ``media'' in their own
  330. right. By bringing together the perspectives of multiple disciplines, we hope
  331. to bring a more methodical approach to the structuring of sound libraries.
  332. At the same time, by viewing domain modelling as
  333. art form as well as engineering discipline [ARANGO89], we hope to 
  334. bring a different
  335. approach to conventional software domains as well---taking one semi-tone
  336. step towards the transformation of
  337. merely ``workable'' into ``playable'' systems.
  338.    XXXXXXXXX 
  339.   Arango, G., ``Domain Analysis- From Art Form
  340. to Engineering Discipline'', in    Proceedings , 5th International Workshop
  341. on Software Specifications and Design, 1989, pp. 152--159.
  342.   Bell, C.G., and Allan Newell, 
  343.    Computer Structures: Readings
  344. and Examples , McGraw-Hill, New York, 1971.
  345.   Lane, T.    User Interface Software Structures ,     CMU-CS-90-101,
  346. doctoral thesis, Carnegie Mellon University, 1990.
  347.   Ruben Prieto-Diaz, ``Domain Analysis For
  348. Reusability'',    Proceedings , COMPSAC'87, 1987, pp. 23--29.
  349.   Ruben Prieto-Diaz, ``Making Software Reuse
  350. Work: An Implementation Model'', position paper, First International
  351. Workshop on Software Reusability, Dortmund Germany, 1991.
  352.   Simos, M.,    Alternative Technologies for Software
  353. Reusability , Proceedings, 3rd STARS Workshop on Applications Systems and
  354. Reusability, March 1986.
  355.   ibid., 
  356. ``The Domain Life Cycle: Steps Toward A Unified Paradigm
  357. for Software Reusability'',    Proceedings , RMISE Workshop on Software Reuse,
  358. Boulder, CO., October 1987; reprinted in 
  359.    Software Reuse: Emerging Technology ,
  360. IEEE Tutorial, ed. Will Tracz, 1988.
  361.   ibid., ``Methods and Tools for Reuse: Domain Analysis Issues'',
  362. position paper, 3rd Annual Workshop on Methods and Tools for Reuse, Syracuse,
  363. NY, 1990.
  364.   ibid.,    Alternative Approaches To Domain
  365. Analysis: Steps Toward A Job Description , course notes, 1990.
  366.   ibid., ``The Growing of an Organon: A Hybrid 
  367. Knowledge-Based Technology and Methodology for Software Reuse'', in 
  368.    Domain 
  369. Analysis and Software
  370. System Modeling , ed. Prieto-Diaz   Arango, IEEE Computer Society Press
  371. Tutorial, 1991, pp. 204-221.
  372.  
  373.  
  374.  
  375.