Auf wienerisch durch die Wiener Innenstadt – oder wie wär’s mit einer Kulturführung auf salzburgerisch? Das Projekt AVDS vom FTW Forschungszentrum Telekommunikation Wien macht’s möglich: aus einem beliebigen Text werden mittels adaptiver audio-visueller Sprachsynthese akustische und visuelle Signale für verschiedene österreichische Dialekte erzeugt. Heraus kommen dabei virtuelle 3D-Avatare, die z.B. als Reiseführer, in Kunst, Tourismus oder Bildung eingesetzt werden können.
Das Ziel des Projekts AVDS (Adaptive Audio-Visuelle Sprachsynthese von Dialekten) ist eine audio-visuelle Sprachsynthese durch die akustische und visuelle Signale für verschiedene österreichische Dialekte generiert werden. Die Signale stammen aus einem beliebigen Text und werden dazu benutzt, künstliche Stimmen im österreichischen Dialekt sprechen zu lassen, die dann in der Kommunikationstechnologie oder auch in Computerspielen eingesetzt werden können. Demnächst können wir also die virtuelle Welt auch in der eigenen Mundart erfahren – wenn uns bei den Sims z.B. die Figuren auf vorarlbergerisch ansprechen!
„Der erste österreichische Dialekt, der modelliert wird, ist eine mittelbairische Varietät, die im Salzkammergut gesprochen wird. Als zweiter Dialekt wird eine südbairische Varietät aus Tirol oder der Steiermark modelliert werden.“ So das Projektteam. Die Herausforderung liegt darin, das akustische und das visuelle Signal einer sprechenden Person nicht getrennt voneinander zu modellieren, wie es bisher in der Forschung der Fall war. Menschliche Sprache ist aber multimodal und beide Signale entstammen ein und demselben Artikulationsprozess, daher sollten sie auch gemeinsam betrachtet werden. Die Entwicklung von Methoden, die dies ermöglichen, ist die Hauptaufgabe des Forschungsprojekts. Weitere Methoden sind notwendig, um automatisch zwischen dem Standard und dem Soziolekt graduell zu wechseln, weil viele Sprecher die Hochsprache mit Varianten mischen. Grundlage der ganzen Idee ist die Tatsache, dass in der Interaktion von Mensch und Computern gesprochene Sprache einen wichtigen Bestandteil darstellt und Computer mittlerweile in vielen Bereichen des Alltagslebens eingesetzt werden. Dieses Projekt ist eine Fortsetzung von „Computer sprechen wienerisch“, das bereits beendet wurde. Die „Wiener Stimme“ ist als Vorlesefunktion auf der Homepage der Stadt Wien zu hören. Als Ergebnis gibt es eine österreichische Unit-Selektion Stimme und 3 Wienerische Stimmen, die unter einer open-source Lizenz veröffentlicht wurden.
Als Ergebnis des neuen Projekts AVDS sollen Computer die Möglichkeit haben, in vielen verschiedenen österreichischen Dialekten zu sprechen. Gleichzeitig, wird aber z.B. auch einer englischen Synthese mit Wiener-Akzent gearbeitet. So verfolgt uns die Mundart dann auch in anderen Sprachen und da die Basis eine menschliche Stimme darstellt, klingt das alles dann fast ganz natürlich. Es bleibt spannend wo in Zukunft diese Dialekt-Avatare überall eingesetzt werden – vielleicht gibt’s ja auch bald eine österreichische Sprachsoftware für Zugereiste!?
Antworten