1 Seite zurückGLOSSAR-Homepage

SpracherkennungSpracherkennungs-Software, Sprachsteuerung, OCR, ViaVoice, FreeSpeech, Speech Processing, Voice Control System

    


Bücher zum Thema:
naechst.gif (256 Byte)

 

http://www.glossar.de/glossar/z_spracherkennung.htm

Sprechen statt tippen - OCR für die Sprache

Die Spracherkennung durch den PC zur Steuerung des Computers und zur Eingabe / Erfassung von Texten verändert den Umgang mit der Technik und steckt Ende des 20. Jahrhunderts nicht mehr in den Kinderschuhen. Möglich wurde das durch die ständig steigende Leistungsfähigkeit moderner Hard- und Software.
Das nächste Etappenziel (aus Sicht Sommer 1998) ist die interaktive Steuerung von Küchengeräten, Anrufbeantworter, Fahrkarten- oder Getränkeautomaten. Zukünftig soll selbst die Bedienung von Videorecordern zum Kinderspiel werden. Man wird dem Videorecorder einfach mitteilen, welchen Film er aufnehmen soll.

Zur Spracherkennung (analoges Signal) wird in ein Mikrofon gesprochen und das Signal mit Hilfe einer Soundkarte in digitale Daten umgewandelt. Spezielle Algorithmen qualifizieren die Eingabe und vergleichen sie mit den in einer Datenbank abgelegten Worten. Danach stehen die Daten in einer computerverständlichen Form zur Verfügung.
 

Software zum Thema:

 

 
ViaVoice von IBM:

Berichte, Briefe, Mails sollen sich mit Viavoice Pro 8 noch perfekter in Windows-Anwendungen diktieren lassen. Dazu wurde die Spracherkennung erneut verbessert - Viavoice soll jetzt einen Wortschatz von rund einer Million Wörter haben und auch zusammengesetzte Wörter erkennen. Bis zu 64.000 Wörter kann der Anwender noch hinzufügen. In die Pro-Version lassen sich außerdem Fachwörterbücher integrieren.

Zur besseren Spracherkennung trägt ein Mikrofon bei, das Hintergrundgeräusche mindert. Außerdem filtert Viavoice während des Diktierens Atmungs- und Lippengeräusche des Anwenders heraus. Viavoice soll mittlerweile so schlau sein, dass es aus dem Kontext heraus die richtigen Wörter schreibt und sogar den Unterschied zwischen gleich lautenden Wörtern erkennt, beispielsweise bei "mehr" und "Meer". Das Programm liest auch vor, Diktate ebenso wie die Inhalte von Webseiten, Mails und anderen Dokumenten. Das erledigt der Viavoice-Agent Woodrow. Viavoice unterstützt den Anwender nicht nur beim Diktieren, sondern eignet sich auch dazu, per Spracheingabe Anwendungen zu steuern. Neu in Viavoice Pro 8 sind dabei Sprachmarkierungen, die hörbar bestätigen, dass Befehle ausgeführt wurden. Über 40 Navigationsmakros mit Sprachmarkierungen sind im Lieferumfang enthalten. Der Anwender kann sich aber auch eigene Makros erstellen.

ViaVoice bei Amazon:

  • Infos / BestellungIBM ViaVoice Pro 8 CD NT,W98,W95 Professional Edition
    Preis: DM 313,99 (EUR 160,54)
    Die Pro-Version kann mit digitalen Diktiergeräten zusammenarbeiten. Die dafür nötige Zusatzsoftware und Hardware ist zusammen mit dem Diktiergerät zu erwerben.
      Infos / Bestellung
  • IBM ViaVoice Std 8 CD NT,W98,W95 Standard Edition
    Preis: DM 80,99 (EUR 41,40)
    Die Standard-Version arbeitet beispielsweise ohne die Möglichkeit, Sprachmarkierungen zu nutzen oder Fachvokabular einzubinden.
      Infos / Bestellung
  • ViaVoice Pro Upgrade 8.0 für Windows. CD- ROM für Windows ab 95
    Preis: DM 198,00 (EUR 101,23)
     
    Infos / Bestellung
  • IBM ViaVoice Millennium Edition CD Mac Millennium Edition
    Preis: DM 162,99 (EUR 83,33)

IBM überarbeitet Spracherkennungs-Konzept
(Meldung von CNet vom 22. Juni 2000)

IBM hat die Absicht, im Laufe der nächsten zwölf bis 18 Monate eine Reihe technologischer Entwicklungen vorzustellen, die als Grundlage für eine künftige Flut von Spracherkennungs-Produkten dienen sollen. IBM erwartet, dass die wachsende Beliebtheit drahtloser Datenverarbeitungsgeräte die Nachfrage nach Sprachverarbeitungs-Techniken steigern wird. W.S. "Ozzie" Osborne von IBM ist der Meinung, der Spracherkennungsmarkt werde bis 2006 auf 60 Milliarden Mark anwachsen.

Auf der Liste der von IBM geplanten technologischen Neuerungen stehen unter anderem: WebSphere Voice Server mit ViaVoice-Technologie, ViaVoice Dictation für Linux, CallPath Enterprise Foundation 6.3, Direct Talk Speech Recognition, Direct Talk Text-to-Speech, Direct Talk Beans für Java und Embedded ViaVoice. "Wir versuchen jetzt, eine durchgehend verbreitete Plattform mit Tools aufzubauen, mit denen Sprachanwendungen entwickelt werden können", sagt Osborne. IBM beabsichtigt, seine Spracherkennungs-Technologie zur industriellen Basis für Sprachanwendungen auszubauen. Analyst Bob Sutherland hält das für eine kluge Strategie, obwohl die Umsetzung noch einige Zeit in Anspruch nehmen kann.

FreeSpeech von Philips Speech Processing:

Philips stellt bei der Entwicklung der Algorithmen die Anpassung der Software an den Benutzer in den Vordergrund, so daß das Programm bereits nach kurzem Sprechertraining jeden Sprecher unterstützt. Dabei erreicht das Programm bei der Erkennung der Syntax und Wörter eine Richtigkeit von über 95 Prozent. Um das Diktat zu erleichtern, verwendet die Software das "Easy Edit"-Korrekturprogramm, das den Text synchron mit der Spracheingabe korrigiert, indem es markierte Wörter und Sätze akustisch wiedergibt.
Die von Philips entwickelte Technologie kommt nicht nur im PC Einsatz, sondern dient in den Philips GSM-Handys "Spark" und "Genie" zur Auswahl der Telefonnummern aus dem Telefonbuch.

FreeSpeech bei Amazon:

  • Infos / BestellungFreeSpeech 2000. 2 CD- ROMs für Windows 95/98/ NT 4.0. mit Headset
    Preis: DM 249,00 (EUR 127,31)
     
  • Infos / BestellungFreeSpeech 98 plus SpeechMike. CD- ROM für Windows 95/98/ NT 4. Deutsche Version
    Preis: DM 199,00 (EUR 101,74)

VOCS (Voice Control System) von Bosch Blaupunkt
Diese Entwicklung ist weniger für den Computer-Bereich gedacht, als vielmehr zur Bedienung der Verkehrstelematikplattform "Gemini" und das neue Radiophone (GSM-Phone und Autoradio) "Helsinki" via Spracheingabe steuern. Die Spracheingabe und -erkennung ist als ein Sicherheitsbeitrag zu bewerten, damit während des Fahrens die Hände am Lenkrad bleiben. Das von Blaupunkt entwickelte Spracherkennungssystem muß dabei nicht auf bestimmte Sprecher trainiert werden, sondern kann sogar Wörter erkennen, wenn sie in einer der in Deutschland üblichen Mundarten gesprochen sind.

Voice Drive von Sony (www.sony.de):
Hier geht es ebenfalls um die Sprachsteuerung zur Bedienung von Autoradios. Sony unterscheidet dabei drei Arten der Sprachein- und -ausgabe:

  • "Voice Guide" dient zur Bestätigung sämtlicher Eingaben des Benutzers durch eine entsprechende Sprachausgabe.
  • Mit "Voice Memo" läßt sich das Radio als Diktiergerät nutzen. Es lassen sich bis zu sechs Sprachnotizen von jeweils 15 Sekunden aufzeichnen.
  • Mit der Funktion "Voice Recognition" ist die Steuerung der Funktionen über Spracheingabe möglich. Die Spracheingabe erfolgt dabei über ein Mikrofon, das an die Sonnenblende des Fahrzeugs geklemmt wird.

Spracherkennungsprogramm rechtfertigt Wegfall von Arbeitsplatz
(Meldung von computerchannel.de vom 22. Februar 2001)

Die Einführung eines computergesteuerten Spracherkennungsprogramms rechtfertigt grundsätzlich den Wegfall von Arbeitsplätzen und damit verbundene betriebsbedingte Kündigungen. Das hat das Arbeitsgericht Frankfurt entschieden. Die Richter wiesen damit die Klage einer Phonotypistin gegen eine Rechtsanwaltskanzlei zurück.

In dem Anwaltsbüro waren nach der Einführung des Spracherkennungsprogramms die Schreibarbeiten unter die Rechtsanwaltsgehilfinnen verteilt worden. Der bislang mit der Erfassung der Texte beschäftigten Schreibkraft wurde betriebsbedingt gekündigt.

Laut Urteil rechtfertigt die Einführung neuer Computertechnologien im Unternehmen stets eine betriebsbedingte Kündigung, wenn dadurch Arbeitskräfte überflüssig werden, sagte die Gerichtsvorsitzende. Darüber hinaus sei die Kündigung auch als "sozial gerechtfertigt" anzusehen, nachdem es in dem Büro keine der Schreibkraft vergleichbare Arbeitnehmerin gegeben habe.

1 Seite zurückGLOSSAR-Homepage

Bücher zum Thema:


Bestellungen aus
Deutschland werden
von unserem Partner
AMAZON.de
versandkostenfrei
und ohne
Mindestbestellwert
bearbeitet!

Noch mehr
ausgewählte Bücher
gibt es bei
BAUBUCH.de.

   
Infos / BestellungSpracherkennung. Kosten, Nutzen, Einsatzmöglichkeiten
Axel Susen

1999. Taschenbuch. 229 Seiten. VDE - ISBN: 3800723239
Preis:  DM 42,00 (EUR 21,47)

Schon vor 30 Jahren gelang der entscheidende Durchbruch zur maschinellen Erkennung der menschlichen Sprache. Damals wurde bereits ein Erkennungsverfahren entwickelt, auf dessen Technik fast alle heutigen Spracherkennungsprogramme basieren. Die Spracherkennung und -verarbeitung - als innovativer und zukunftsweisender Bereich - wird bald in allen Bereichen des täglichen Lebens Einzug halten. Die Neuerscheinung behandelt zum einen die verschiedenen Aspekte der Sprachverarbeitung und zum anderen, welche technischen und anwendungsbezogenen Schwierigkeiten bei der praktischen Umsetzung bestehen. Erläutert werden auch die zahlreichen Systeme und erste marktfähige Produkte aus dem Bereich der Spracherkennung sowie deren spezielle Einsatz- und Anwendungsgebiete. Am weitesten verbreitet sind heute neben Telekommunikationsanwendungen Diktiersysteme. Auf der beiliegenden CD-ROM findet der Leser eine Aufstellung der derzeit verfügbaren Produkte sowie Demoversionen ausgewählter Software.
 

Copyright: GLOSSAR.de - Alfons Oebbeke, Neustadt 1997-2001
 
Navigation ohne Frames:

 
Glossar - Homepage - Linkseite - Suchen im ARCHmatic-Web-Pool (funktioniert nur im Online-Modus!!!) E-Mail-Kontakt - Gästebuch:Lob und Tadel - Foren: Fragen und Antworten -AEC-WEB (funktioniert nur im Online-Modus!!!)
# A B C D E F G H I J K L M N O P Q R S T U V W X Y Z