pts20100708026 Bildung/Karriere, Technologie/Digitalisierung

OCG Förderpreis 2010 vergeben

Preisträger ist DI Dietmar Schabus von der TU Wien


Copyright: Österreichische Computer Gesellschaft (OCG)
Copyright: Österreichische Computer Gesellschaft (OCG)

Wien (pts026/08.07.2010/13:46) Am 7. Juli 2010 wurde im Rahmen des Dinnerempfangs der Interantional Conference on Web Engineering, die derzeit an der TU Wien stattfindet, der diesjährige OCG-Förderpreisträger ausgezeichnet:

DI Dietmar Schabus gewann mit seiner Diplomarbeit Interpolation of Austrian German and Viennese Dialect/Sociolect in HMM-based Speech Synthesis, die er an der Fakultät der TU Wien verfasste.

Abstract
Das gängigste Verfahren zur maschinellen Erzeugung von gesprochener Sprache funktioniert nach dem Prinzip der Verkettung: Eine Sammlung von Äußerungen eines menschlichen Sprechers wird aufgenommen und vom Computer in kurze Segmente geteilt. Das so entstehende Inventar an Segmenten dient dann als "Baukasten" für beliebige neue Äußerungen, die aus den Segmenten zusammengesetzt werden können. Was die Sprachsignalqualität angeht, sind solche Systeme bisher allen anderen Verfahren überlegen. Andererseits beinhaltet ein menschliches "Sprachsignal" mehr als die reine textuelle Information: Wenn wir sprechen, kommunizieren wir auch Dinge wie unsere emotionale und gesundheitliche Verfassung, unsere Haltung dem Zuhörer gegenüber, unsere regionale und soziale Zugehörigkeit, usw. Zur Umsetzung einer Diversifizierung in diesen Bereichen mangelt es dem Verkettungsansatz an Flexibilität.

Der in dieser Diplomarbeit verfolgte parametrische Ansatz hingegen bietet diese Flexibilität. Das Sprachsignal kommt hier durch ein Analyse-Resynthese-Verfahren zustande: Mittels Techniken der Signalverarbeitung werden aus aufgenommener Sprache bestimmte Parameter errechnet (Analyse). Die Zuordnung von den vorkommenden Lauten (und deren Kontext) zu den dazugehörigen Parametern wird dann mit Hidden-Markov-Modellen (HMMs) modelliert - plakativ gesagt: Das Computerprogramm lernt, welche Parameter für einen Laut passend sind, indem es sich (sehr viele) Beispiele anschaut. Soll nun eine beliebige neue Äußerung erzeugt werden, können die HMMs die entsprechenden Parameter liefern, aus welchen dann durch eine Art Umkehrung der Analyse wieder ein Sprachsignal errechnet werden kann (Resynthese).

Dadurch wird unter anderem die Möglichkeit geschaffen, die Parameter bzw. die Parametermodelle zu modifizieren. So kann zum Beispiel Sprecheradaptierung und -interpolation realisiert werden, um verschiedene Sprechercharakteristika, Sprechstile usw. graduell zu verändern, also das Computerprogramm in einer Weise sprechen zu lassen, die so in den ursprünglichen Sprachaufnahmen nicht vorhanden ist.

Die in dieser Arbeit umgesetzte Interpolation zwischen österreichischem Hochdeutsch und Wiener Dialekt stellte einige neue Herausforderungen, die auf den Unterschieden in der segmentalen Struktur zwischen diesen beiden Varianten des Deutschen beruhen - Wienerisch ist von Hochdeutsch "weiter entfernt" als etwa britisches von amerikanischem Englisch. Die entsprechenden Probleme konnten gelöst werden und eine Studie mit 40 Testhörern hat gezeigt, dass auch tatsächlich eine graduelle Veränderung der Variante wahrgenommen wird.

Diese Diplomarbeit entstand an der Fakultät für Informatik der Technischen Universität Wien, in enger Zusammenarbeit mit dem Forschungszentrum Telekommunikation Wien (FTW).

Weitere Informationen
Über den OCG-Förderpreis
Fakultät für Informatik der TU Wien
Forschungszentrum Telekommunikation Wien (FTW)
Kontakte in der OCG

Presse: Mag. Christinen Haas - 01 512 02 35-51

Wettbewerbe: Elisabeth Maier Gabriel - 01 512 012 35-18

Über die Österreichische Computer Gesellschaft (OCG)

Die Österreichische Computer Gesellschaft (OCG) ist als unabhängige Non-Profit Organisation seit mehr als 10 Jahren das führende Kompetenzzentrum für IT-AnwenderInnen in Österreich. Mit einer Reihe von Veranstaltungen, Auszeichnungen und Zertifizierungen wie dem ECDL sensibilisiert die OCG für Themen und Trends in der IT und unterstützt den Auf- und Ausbau von sozialen Netzwerken. Als Personenzertifizierer liefern wir IT Tests für unterschiedliche Kompetenzniveaus.

(Ende)
Aussender: Österreichische Computer Gesellschaft (OCG)
Ansprechpartner: Mag. Christine Haas
Tel.: 01/512 02 35/51
E-Mail: haas@ocg.at
|