home *** CD-ROM | disk | FTP | other *** search
/ Black Box 4 / BlackBox.cdr / textinfo / langcomp.arj / CMPTRANS.TXT < prev    next >
Encoding:
Text File  |  1992-02-01  |  22.2 KB  |  498 lines

  1.  
  2.  
  3.      Where Do Translators Fit Into Machine Translation?
  4.      
  5.      Original And Supplementary Questions
  6.      
  7.      MT SUMMIT III                   June 3, 1991  
  8.                     2:00 -- 3:45 PM
  9.      
  10.      Here are the original questions for this panel as
  11. submitted to the speakers:
  12.      
  13.      1.  At the last MT Summit, Martin Kay stated that there
  14. should be "greater attention to empirical studies of
  15. translation so that computational linguists will have a
  16. better idea of what really goes on in translation and develop
  17. tools that will be more useful for the end user."  Does this
  18. mean that there has been insufficient input into MT processes
  19. by translators interested in MT?    Does it mean that MT
  20. developers have failed to study what translating actually
  21. entails and how translators go about their task?  If either
  22. of these is true, then to what extent and why?  New answers
  23. and insights for the MT profession could arise from hearing
  24. what human translators with an interest in the development of
  25. MT have to say about these matters.  It may well turn out
  26. that translators are the very people best qualified to
  27. determine what form their tools should take, since they are
  28. the end users.
  29.      
  30.      2.  Is there a specifically "human" component in the
  31. translation process which MT experts have overlooked?  Is it
  32. reasonable for theoreticians to envision setting up
  33. predictable and generic vocabularies of clearly defined
  34. terms, or could they be overlooking a deep-seated human
  35. tendency towards some degree of ambiguity--indeed, in those
  36. many cases where not all the facts are known, an inescapably
  37. human reliance on it?  Are there any viable MT approaches to
  38. duplicate what human translators can provide in such cases,
  39. namely the ability to bridge this ambiguity gap and improvise
  40. personalized, customized case-specific subtleties of
  41. vocabulary, depending on client or purpose?  Could this in
  42. fact be a major element of the entire translation process?
  43. Alternately, are there some more boring "machine-like"
  44. aspects of translation where the computer can help the
  45. translator, such as style and consistency checking?
  46.      
  47.      3.  How can the knowledge of practicing translators best
  48. be integrated into current MT research and working systems?
  49. Is it to be assumed that they are best employed as
  50. prospective end-users working out the bugs in the system, or
  51. is there also a place for them during the initial planning
  52. phases of such systems?  Can they perhaps as users be the
  53. primary developers of the system?
  54.      
  55.      4.  Many human translators, when told of the quest to
  56. have machines take over all aspects of translation,
  57. immediately reply that this is impossible and start providing
  58. specific instances which they claim a machine system could
  59. never handle.  Are such reactions merely the final nerve
  60. spasms of a doomed class of technicians awaiting
  61. superannuation, or are these translators in fact enunciating
  62. specific instances of a general law as yet not fully
  63. articulated?  Since we now hear claims suggesting that FAHQT
  64. is creeping in again through the back door, it seems
  65. important to ask whether there has in fact ever been
  66. sufficient basic mathematical research, much less algorithmic
  67. underpinnings, by the MT Community to determine whether
  68. FAHQT, or anything close to it, can be achieved by any
  69. combination of electronic stratagems (transfer, AI, neural
  70. nets, Markov models, etc.).  Must translators forever stand
  71. exposed on the firing line and present their minds and bodies
  72. to a broadside of claims that the
  73. next round of computer advances will annihilate them as a
  74. profession?  Is this problem truly solvable in logical terms,
  75. or is it in fact an intractable, undecidable, or provably
  76. unsolvable question in terms of "Computable Numbers" as set
  77. out by Turing, based on the work of Hilbert and Goedel?  A
  78. reasonable answer to this question could save boards of
  79. directors and/or government agencies a great deal of time and
  80. money.
  81.      
  82.      
  83.      SUPPLEMENTAL QUESTIONS
  84.      
  85.      
  86.      It was also envisioned that a list of Supplemental
  87. Questions would be prepared and distributed not only to the
  88. speakers but everyone attending our panel, even though not
  89. all of these questions could be raised during the session, so
  90. as to deepen our discussion and provide a lasting record of
  91. these issues.
  92.      
  93.      
  94.      FAHQT: Pro and Con
  95.      
  96.      Consider the following observation on FAHQT: "The ideal
  97. notion of fully automatic high quality translation (FAHQT) is
  98. still lurking behind the machine translation paradigm: it is
  99. something that MT projects want to reach." (1)  Is this a
  100. true or a false observation?
  101.      
  102.      Is FAHQT merely a matter of time and continued research,
  103. a direct and inevitable result of a perfectly asymptotic
  104. process?
  105.      
  106.      Will FAHQT ever be available on a held-held calculator-
  107. sized computer?  If not, then why not?
  108.      
  109.      To what extent is the belief in the feasibility of FAHQT
  110. a form of religion or perhaps akin to a belief that a
  111. perpetual motion device can be invented?
  112.      
  113.      
  114.      Technical Linguistic Questions
  115.      
  116.      Let us suppose a writer has chosen to use Word C in a
  117. source text because s/he did not wish to use Word A or Word
  118. B, even though all three are shown as "synonyms."  It turns
  119. out that all three of these words overlap and semantically
  120. interrelate quite differently in the target language.  How
  121. can MT handle such an instance, fairly frequently found in
  122. legal and diplomatic usage?
  123.      
  124.      Virtually all research in both conventional and
  125. computational linguistics has proceeded from the premise that
  126. language can be represented and mapped as a linear entity and
  127. is therefore eminently computable.  What if it turns out that
  128. language in fact occupies a virtual space as a multi-
  129. dimensional construct, including several fractal dimensions,
  130. involving all manner of non-linear turbulence, chaos, and
  131. Butterfly Effects?
  132.      
  133.  
  134.      Post-Editors and Puppeteers
  135.      
  136.      Let's assume you saw an ad for an Automatic Electronic
  137. Puppeteer that guaranteed to create and produce endless
  138. puppet plays in your own living room.  There would be no need
  139. for a puppeteer to run the puppets and no need for you even
  140. to script the plays, though you would have the freedom to
  141. intervene in the action and change the plot as you wished.
  142. Since the price was acceptable, you ordered this system, but
  143. when it arrived, you found that it required endless
  144. installation work and calls to the manufacturers to get it
  145. working.  But even then, you discovered that the number of
  146. plays provided was in fact quite limited, your plot change
  147. options even more so, and that the movements of the puppets
  148. were jerky and unnatural.  When you complained, you were
  149. referred to fine print in the docs telling you that to make
  150. the program work better, you would have to do one of two
  151. things: 1) master an extremely complex programming language
  152. or 2) hire a specially trained puppeteer to help you out with
  153. your special needs and to be on hand during your productions
  154. to make the puppets move more naturally.  Does this
  155. description bear any resemblance to the way MT has functioned
  156. and been promoted in recent years?
  157.      
  158.      
  159.      A Practical Example
  160.      
  161.      Despite many presentations on linguistic, electronic and
  162. philosophical aspects of MT at this conference, one side of
  163. translation has nonetheless gone unexplored.  It has to do
  164. with how larger translation projects actually arise and are
  165. handled by the profession.  The following story shows the
  166. world of human translation at close to its worst, and it
  167. might be imagined at first glance that MT could easily do a
  168. much better job and simply take over in such situations,
  169. which are far from atypical in the world of translation.
  170. But, as we shall see, such appearances may be deceptive.  To
  171. our story:
  172.      
  173.      A French electrical firm was recently involved in a
  174. hostile take-over bid and law suit with its American
  175. counterpart.  Large numbers of boxes and drawers full of
  176. documents all had to be translated into English by an almost
  177. impossible deadline.  Supervision of this work was entrusted
  178. to a paralegal assistant in the French company's New York law
  179. firm. This  person had no previous knowledge of translation.
  180. The documents ran the gamut from highly technical electrical
  181. texts and patents, records of previous law suits, company
  182. correspondence, advertisements, product documentation,
  183. speeches by the Company's directors, etc.  Almost every
  184. French-to-English translator in the NYC area was asked to
  185. take part.  All translators were required to work at the law
  186. firm's offices so as to preserve confidentiality.  Mere
  187. translation students worked side by side with newly
  188. accredited professionals and journeymen with long years of
  189. experience.  
  190.  
  191.     The more able quickly became aware that much of
  192. the material was far too difficult for their less experienced
  193. colleagues.  No consistent attempt was made to create or
  194. distribute glossaries.  Wildly differing wages were paid to
  195. translators, with little connection to their ability.
  196. Several translation agencies were caught up in a feverish
  197. battle to handle most of the work and desperately competed to
  198. find translators.  No one knows the quality of the final
  199. product, but it cannot have been routinely high.  Some
  200. translators and agencies have still not been fully paid.  As
  201. the deadline drew closer, more and more boxes of documents
  202. appeared.  And as the final blow, the opposing company's law
  203. firm also came onto the scene with boxes of its own documents
  204. that needed translation.  But these newcomers imposed one
  205. nearly impossible condition, also for reasons of
  206. confidentiality: no one who had translated for the first law
  207. firm would be permitted to translate for them.
  208.  
  209.  
  210.      Now let us consider this true-life tale, which occurred
  211. just three months ago, and see how--or whether--MT could have
  212. handled things better, as is sometimes claimed.  Let's be
  213. generous and remove one enormous obstacle at the start by
  214. assuming that all these cases of documents were in fact in
  215. machine-readable form (which, of course, they weren't).  Even
  216. if we accord MT this ample handicap, there are still a number
  217. of problems it would have had trouble coping with:
  218.      
  219.      1.  How could a sufficient number of competent post-
  220. editors be found or trained before the deadline?
  221.  
  222.      2.  How could a sufficiently large and accurate MT
  223. dictionary be compiled before the deadline?  Doesn't creating
  224. such a dictionary require finishing the job first and
  225. then saving it for the next job, in the hope that it
  226. will be similar ?
  227.  
  228.      3.  The simpler Mom & Pop store & smaller agency
  229. structure of the human translation world was nonetheless able to
  230. field at least some response to this challenge because of
  231. its large slack capacity.  Would an enormously powerful and
  232. expensive mainframe computer have the same slack capacity,
  233. i.e., could it be kept inactive for long periods of
  234. time until such emergencies occurred?  If so, how would this
  235. be reflected in the prices charged for its services?
  236.  
  237.      4.  How would MT companies have dealt with the secrecy
  238. requirement, that translation must be done in the
  239. law firm's office?
  240.  
  241.      5.  How would an MT Company comply with the demand of
  242. the second law firm, that the same post-editors not be
  243. used, and still land the job?
  244.  
  245.      6.  Supposing the job proved so enormous that two MT
  246. firms had to be hired--assuming they used different
  247. systems, different glossaries, different post-editors, how
  248. could they have collaborated without creating even
  249. more work and confusion?
  250.      
  251.      
  252.      Larger Philosophical Questions
  253.      
  254.  
  255.      Is it in any final sense a reasonable assumption, as
  256. many believe, that progress in MT can be gradual and
  257. cumulative in scope until it finally comes to a complete
  258. mastery of the problem?  In other words, is there a numerical
  259. process by which one first masters 3% of all knowledge and
  260. vocabulary building processes with 85% accuracy, then 5% with
  261. 90% accuracy, and so on until one reaches 99% with 99%
  262. accuracy?  Is this the whole story of the relationship
  263. between knowledge and language, or are there possibly other
  264. factors involved, making it possible for reality to manifest
  265. itself from several unexpected angles at once.  In other
  266. words, are we dealing with language as a linear entity when
  267. it is in fact a multi-dimensional one?
  268.  
  269.  
  270.      Einstein maintained that he didn't believe God was
  271. playing dice with the universe.  Is it possible that by using
  272. AI rule-firing techniques with their built-in certainty and
  273. confidence values, computational linguists are playing dice
  274. with the meaning of the that universe?
  275.  
  276.      
  277.      It would be possible to design a set of "Turing Tests"
  278. to gauge the performance of various MT systems as compared
  279. with human translation skills.  The point of such a process,
  280. as with all Turing Tests, would be to determine if human
  281. referees could tell the difference between human and machine
  282. output.  All necessary safeguards, handicaps, alternate
  283. referees, and double blind procedures could be devised,
  284. provided the will to take part in such tests actually
  285. existed.  True definitions for cost, speed, accuracy, and
  286. post-editing needs might all have at least a chance of being
  287. estimated as a result of such tests.  What are the chances of
  288. their taking place some time in the near future?
  289.  
  290.      
  291.      "Computerization is the first stage of the industrial
  292. revolution that hasn't made work simpler."  Does this
  293. statement, paraphrased from a book by a Harvard Business
  294. School professor, (2) have any relevance for MT?  Is it
  295. correct to state that several current MT systems actually add
  296. one or more levels of difficulty to the translation process
  297. before making it any easier?
  298.  
  299.      
  300.      While translators may not be able to articulate
  301. precisely what kind of interface for translation they most
  302. desire, they can certainly state with great certainty what
  303. they do NOT want.  What they do not want is an interface that
  304. is any of the following:
  305.  
  306.      
  307.           harder to learn and use than conventional
  308.       translation;
  309.  
  310.           more likely to make mistakes than the above;
  311.  
  312.           lending less prestige than the above;
  313.  
  314.           less well paid than the above.
  315.  
  316. Are these also concerns for MT developers?
  317.      
  318.      
  319.      What real work has been done in the AI field in terms of
  320. treating translation as a Knowledge Domain and translators as
  321. Domain Experts and pairing them off with Knowledge Engineers?
  322. What qualifications were sought in either the DE's or the
  323. KE's?
  324.      
  325.      Are MT developers using the words "asymptote" and
  326. "asymptotic" in their correct mathematical sense, or are they
  327. rather using them as buzzwords to impart a false air of
  328. mathematical precision to their work?  Is the curve their
  329. would-be asymptote steadily approaching a representation of
  330. FAHQT or something reasonably similar, or could it just turn
  331. out to be the edge of a semanto-linguistic Butterfly Effect
  332. drawing them inexorably into what Shannon and Weaver
  333. recognized as entropy, perhaps even into true Chaos?
  334.  
  335.      
  336.      Must not all translation, including MT, be recognized as
  337. a subset of two far larger sets, namely writing and human
  338. mediation?  In the first case, does it not therefore become
  339. pointless to maintain that there are no accepted standards
  340. for what constitutes a "good translation," when of course
  341. there are also no accepted standards for what constitutes
  342. "good writing?"  Or for that matter, no accepted standards
  343. for what constitutes "correct writing practices," since all
  344. major publications and publishing houses have their own in-
  345. house style manuals, with no two in total agreement, either
  346. here or in England.  And is not translation also a
  347. specialized subset of a more generalized form of "mediation,"
  348. merely employing two natural languages instead of one?  In
  349. which case, may it belong to the same superset which includes
  350. "explaining company rules to new employees," public relations
  351. and advertising, or choosing exactly the right time to tell 
  352. Uncle Louis you're marrying someone he disapproves of?  Are 
  353. not the only real differences between foreign language translation 
  354. and such upscale mediation that two languages are involved and the
  355. context is usually more limited?  In either case (or in both
  356. together), what happens if  all the complexities that can
  357. arise from superset activities descend into the subset and
  358. also become  "translation problems?" at any time?  How does
  359. MT deal with either of these cases?
  360.      
  361.  
  362.      Does the following reflection by Wittgenstein apply to
  363. MT: "A sentence is given me in code together with the key.
  364. Then of course in one way everything required for
  365. understanding the sentence has been given me.  And yet I
  366. should answer the question `Do you understand this
  367. sentence?': No, not yet; I must first decode it.  And only
  368. when e.g. I had translated it into English would I say `Now I
  369. understand it.'
  370.      "If now we raise the question `At what moment of
  371. translating do I understand the sentence? we shall get a
  372. glimpse into the nature of what is called `understanding.'"
  373. To take Wittgenstein's example one step further, if MT is
  374. used, at what moment of translation does what person or
  375. entity understand the sentence?  When does the system
  376. understand it?  How about the hasty post-editor?  And what
  377. about the translation's target audience, the client?  Can we
  378. be sure that understanding has taken place at any of these
  379. moments?  And if understanding has not taken place, has
  380. translation?
  381.      
  382.      
  383.      Practical Suggestions for the Future
  384.      
  385.      1.  The process of consultation and cooperation between
  386. working translators and MT specialists which has begun here
  387. today should be extended into the future through the
  388. appointment of Translators in Residence in university and
  389. corporate settings, continued lectures and workshops dealing
  390. with these themes on a national and international basis, and
  391. greater consultation between them in all matters of mutual
  392. concern.
  393.      
  394.      2.  In the past, many legislative titles for training
  395. and coordinating workers have gone unused during each
  396. Congressional session in the Department of Labor, HEW, and
  397. Commerce.  If there truly is a need for retraining
  398. translators to use MT and CAT products, it behooves system
  399. developers--and might even benefit them financially--to find
  400. out if such funding titles can be used to help train
  401. translators in the use of truly viable MT systems.
  402.      
  403.      3.  It should be the role of an organization such as MT
  404. Summit III to launch a campaign aimed at helping people
  405. everywhere to understand what human translation and machine
  406. translation can and cannot do so as to counter a growing
  407. trend towards fast-word language consumption and use.
  408.      
  409.      4.  Concomitantly, those present at this Conference
  410. should make their will known on an international scale that
  411. there is no place in the MT Community for those who falsify
  412. the facts about the capabilities of either MT or human
  413. translators.  The fact that foreign language courses, both
  414. live and recorded, have been deceitfully marketed for decades
  415. should not be used as an excuse to do the same with MT.  I
  416. have appended a brief Code of Ethics document for discussion
  417. of this matter.
  418.      
  419.      5.  Since AI and expert systems are on the lips of many
  420. as the next direction for MT, a useful first step in this
  421. direction might be the creation of a simple expert system
  422. which prospective clients might use to determine if their
  423. translation needs are best met by MT, human translation, or
  424. some combination of both.  I would be pleased to take part in
  425. the design of such a program.
  426.  
  427.      
  428.      
  429.      DRAFT CODE OF ETHICS
  430.      
  431.      
  432.      1.  No claims about existing or pending MT products
  433. should be made which indicate that MT can reduce the number
  434. of human translators or the total cost of translation work
  435. unless all costs for the MT project have been scrupulously
  436. revealed, including the total price for the system, fees or
  437. salaries for those running it, training costs for such
  438. workers, training costs for additional pre-editors or post-
  439. editors including those who fail at this task, and total
  440. costs of amortization over the full period of introducing
  441. such a system.
  442.      
  443.      2.  No claims should be made for any MT system in terms
  444. of "percentage of accuracy," unless this figure is also
  445. spelled out in terms of number of errors per page.  Any
  446. unwillingness to recognize errors as errors shall be
  447. considered a violation of this condition, except in those
  448. cases where totally error-free work is not required or
  449. requested.
  450.      
  451.      3.  No claim should be made that any MT system produces
  452. "better-quality output" than human translators unless such a
  453. claim has been thoroughly quantified to the satisfaction of
  454. all parties.  Any such claim should be regarded as merely
  455. anecdotal until proved otherwise.
  456.      
  457.      4.  Researchers and developers should devote serious
  458. study to the issue of whether their products might generate
  459. less sales resistance, public confusion, and resentment from
  460. translators if the name of the entire field were to be
  461. changed from "machine translation" or "computer translation"
  462. to "computer assisted language conversion."
  463.      
  464.      5.  The computer translation industry should bear the
  465. cost of setting up an equitably balanced committee of MT
  466. workers and translators to oversee the functioning of this
  467. Code of Ethics.
  468.      
  469.      6.  Since translation is an intrinsically international
  470. industry, this Code of Ethics must also be international in
  471. its scope, and any company violating its tenets on the
  472. premise that they are not valid in its country shall be
  473. considered in violation of this Code.  Measures shall be
  474. taken to expose and punish habitual offenders.
  475.      
  476.      
  477.      
  478.      Respectfully Submitted by
  479.      Alex Gross, Co-Director
  480.      Cross-Cultural Research Projects
  481.      & Chair, MT Committee,
  482.      New York Circle of Translators    
  483.  
  484.                                                             14
  485.  
  486.  
  487.      P.O. Box 660--Cooper Station
  488.      New York, NY 10276
  489.      uucp:  alexgro@dorsai.com
  490.      CIS#:  71071,1520
  491.  
  492.      
  493.      (1)  Kimmo Kettunen, in a letter to Computational
  494. Linguistics, vol. 12, No. 1, January-March, 1986
  495.      
  496.      (2)  (2)  Shoshana Zuboff: In the Age of the Smart
  497. Machine: The Future of Work and Power, Basic Books, 1991.
  498.