ZHAW und FHNW 26.05.2021, 10:50 Uhr

Forschende sammeln Schweizer Dialekte fürs Computerprogramm-Training

Die beiden Hochschulen rufen zu einer Datensammlung von Schweizer Dialekten in der Deutschschweiz auf. Mit den digitalisierten Dialekten sollen Computerprogramme trainiert werden.
Die Plattform dialektsammlung.ch
(Quelle: Screenshot/PCtipp.ch)
Sprachassistenten wie Siri oder Alexa verstehen bei gesprochenem Schweizerdeutsch oft nur Bahnhof. Einer der Gründe dafür liegt offenbar am Mangel an Audiodateien, die nötig sind, um diese Systeme zu trainieren. Für Techriesen wie Amazon oder Apple ist der Schweizer Markt zu klein, um in eine Digitalisierung zu investieren. Das Entwickeln einer Lösung wollen nun die ZHAW und die FHNW übernehmen, schreiben die beiden Hochschulen in einer gemeinsamen Mitteilung.
Darin rufen sie die Bevölkerung in der Deutschschweiz auf, bei einer Datensammlung von Schweizer Dialekten mitzumachen. «Mindestens 2000 Stunden Aufnahmen von schweizerdeutschen Dialekten sollen zusammenkommen, damit wir eine gute Datenbasis haben», sagt Mark Cieliebak vom ZHAW-Centre for Artificial Intelligence (CAI). Manfred Vogel von der FHNW ergänzt: «Diese Daten werden wir anschliessend verwenden, um einem Algorithmus basierend auf künstlicher Intelligenz beizubringen, schweizerdeutsche Sprache zu verstehen und automatisch in hochdeutschen Text umzuwandeln».

Web-App

Für das Projekt wurde eine Webapplikation entwickelt, mit der die Freiwilligen eigene Audioaufnahmen erstellen können. In der App können die Teilnehmenden sehen, aus welchen Kantonen bereits Sprachaufnahmen vorhanden sind – und welche Kantone und Dialekte noch fehlen.
Wie man sich genau am Projekt beteiligen kann, finden Sie unter So funktionierts, siehe nächste Seite.



Kommentare
Es sind keine Kommentare vorhanden.