pte20090826033 Technologie/Digitalisierung, Produkte/Innovationen

Fraunhofer IPA integriert Sprache in Second Life

API ermöglicht Integration von Sprachdialogen in beliebige Anwendungen


Sprachdialogsysteme erweitern graphische Benutzeroberflächen  (Foto: voice.fraunhofer.de)
Sprachdialogsysteme erweitern graphische Benutzeroberflächen (Foto: voice.fraunhofer.de)

Stuttgart (pte033/26.08.2009/13:56) Das Fraunhofer Institut für Produktionstechnik und Automatisierung (IPA) http://www.ipa.fraunhofer.de hat im Rahmen eines Demonstrationsprojekt in Second Life gezeigt, wie einfach Sprachdialogsysteme in beliebige Anwendungen integriert werden können. Die vom Fraunhofer IPA entwickelte Programmierschnittstelle Voice Control API überträgt dabei die Kontrolle über Sprachdialogsysteme an das jeweilige Anwendungsprogramm, in diesem Fall an Second Life. "Die Programmierschnittstelle wurde plattformunabhängig konzipiert. Im Rahmen der bisherigen Forschungsarbeit wurde allerdings erst ein Sprachdialogsystem eingebunden", sagt Ronny Egeler, Projektentwickler am Fraunhofer IPA, im Gespräch mit pressetext. Bisher unterstützt nur die Heidelberger Firma Sikom http://www.sikom.de die für die Kommunikation mit Sprachdialogsystemen benötigten Standards.

Die Programmierschnittstelle ist jedoch nicht auf bestimmte Endgeräte beschränkt und kann wie ein Webservice angesprochen werden, was die einfache Integration von Sprachdialogen in beliebige Applikationen bzw. deren Steuerung aus Software-Anwendungen heraus ermöglicht. Auf diese Weise kann Sprache im Gegensatz zu rein graphischen Benutzeroberflächen als zusätzliches Interaktionsmedium genutzt werden. Im industriellen Bereich stellen Prüfdatenerfassungen, Ereignismeldungen oder unternehmensinterne Auskunfts- und Reservierungssysteme mögliche Einsatzgebiete für dieses Technologiepaket dar.

Ein möglicher Anwendungsfall wäre, dass eine Geschäftsanwendung die Voice Control API wie ein Webservice über sogenannte SOAP-Aufrufe ansteuert. Die standardisierte Programmierschnittstelle generiert dann Ablaufbeschreibungen zur Durchführung des Sprachdialogs im Voice-XML-Format und schickt diese an das jeweils eingebundene Sprachsteuerungssystem. Dieses enthält im Wesentlichen einen Spracherkenner, einen Dialog-Interpreter und eine Sprachsynthese. Über gängige Telefonschnittstellen oder eine Soundkarte erfolgt die Anbindung der Endgeräte.

Sprachliche Interaktion mit Computersystemen ist noch eine relativ neue Kulturtechnik. "Anders als bei der Gestaltung von graphischen Benutzeroberflächen fehlen auf dem Gebiet der Sprachdialogsysteme ausdefinierte Standards, zudem ergeben sich manchmal noch technische Schwierigkeiten in Zusammenhang mit fehlerhaften oder suboptimalen Erkennungsleistungen", so der Experte weiter. Problematisch seien daher umfangreiche Vokabulare, durch die Variabilität der menschlichen Stimme werde aber auch in Hinkunft wohl keine perfekte Erkennung möglich sein. Trotzdem bieten leicht integrierbare Sprachdialogsysteme schon jetzt massive Vorteile gegenüber bisherigen Interaktionsmöglichkeiten. Die Hände und der Blick bleiben frei, Sprache ist jedem Menschen unmittelbar zugänglich und die Anforderungen an die Endgeräte sind relativ gering.

(Ende)
Aussender: pressetext.austria
Ansprechpartner: Nikolaus Summer
Tel.: +43-1-81140-306
E-Mail: summer@pressetext.com
|