Blog

Island und die KI

Julia Frenzel,

Nur ca. 350 000 Menschen sprechen Isländisch als Muttersprache. Die meisten von ihnen beherrschen auch Englisch gut. Zu einem großen Teil liegt das daran, dass Englisch nicht nur ab einem frühen Alter in den Schulen gelehrt wird, sondern das Gelernte auch direkt im Alltag eingesetzt werden kann. Da Tourismus einen der wichtigsten Wirtschaftszweige des Landes darstellt, ist die englische Sprache allgegenwärtig. Zudem ist es, wie auch in anderen skandinavischen Ländern, üblich, dass englische TV-Formate im Original ausgestrahlt werden.

Immer wieder taucht daher die Frage auf, ob Isländisch nicht bald von der englischen Sprache verdrängt und somit aussterben wird. Dieses Risiko ist jedoch im Vergleich zu manch anderer kleinen Sprache erstaunlich gering, denn die Isländerinnen und Isländer lieben ihre Sprache nicht nur, sondern haben vor allem eines begriffen: Damit eine Sprache leben kann, muss sie in allen Bereichen des Alltags anwendbar sein. Im digitalen Zeitalter ist es daher unumgänglich, dass Mensch und Computer auf Isländisch interagieren können.

Damit das funktioniert, hat das kleine Land in den vergangenen Jahren beeindruckende Projekte im Bereich der Sprachtechnologie gestemmt. 2014 wurde das isländische Zentrum für Sprachtechnologie, Almannarómur, gegründet und wird seit 2018 vom Ministerium für Bildung, Wissenschaft und Kultur staatlich gefördert. Almannarómur arbeitet unter anderem mit den zwei Universitäten in Reykjavik zusammen, die beide den Masterstudiengang Sprachtechnologie anbieten und somit für Nachwuchs in der Forschung und Entwicklung sorgen.

Der jüngste Erfolg von Almannarómur ist eine Kooperation mit Microsoft, aus der ein Sprachsynthesizer für Microsoft Edge hervorging. Isländische Texte kann man sich jetzt in diesem Browser in guter Qualität vorlesen lassen.

Eine weitere wichtige Kooperation besteht mit dem Unternehmen Miðeind, das Technologielösungen für die Nutzung und Verarbeitung der isländischen Sprache auf Handys, Computern und anderen Geräten entwickelt. Das Unternehmen schuf mit Embla das isländische Pendant zu Siri und Alexa. Außerdem stellt Miðeind ein eigenes Tool für maschinelle Übersetzung zur Verfügung, in der derzeitigen Version allerdings nur zwischen Isländisch und Englisch.

Dies alles sind großartige Initiativen für den Erhalt der isländischen Sprache. Dennoch sind Sprachtechnologien, gerade mit so komplexen Sprachen wie Isländisch, fehleranfällig und ersetzen nicht die menschlichen Dolmetsch- und Übersetzungsprofis. Manchmal müssen die Sätze nicht einmal kompliziert sein, um die Technologie an ihre Grenzen zu bringen, wie das folgende Beispiel zeigt.

Diskriminierung in der maschinellen Übersetzung

Abb. 1: Maschinelle Übersetzung aus Google Translate, generiert am 13.09.2024

Im Isländischen haben viele Adjektive in der männlichen Form die Endung -ur und sind in der weiblichen Form endungslos. Der Screenshot aus Google Translate veranschaulicht, dass der KI-Algorithmus vorurteilsbehaftet interpretiert, wann von einem Mann die Rede ist und wann von einer Frau. Lässt man Sätze mit positiv belegten Adjektiven ins Isländische übertragen, z. B. „Ich bin stark.“ oder „Ich bin stolz.“, verwendet der Algorithmus meist die männliche Adjektivform. Bezieht sich ein positives Adjektiv jedoch auf das äußere Erscheinungsbild wird häufiger die weibliche Form herangezogen, wie z. B. beim Satz „Ich bin hübsch.“ Sätze mit negativ belegten Adjektiven wie „Ich bin schwach.“ oder „Ich bin gestresst.“ erhalten ebenfalls mit großer Wahrscheinlichkeit die weibliche Form.

Abb. 2: Maschinelle Übersetzung aus dem isländischen Tool Vélþýðing von Miðeind, generiert am 13.09.2024

Interessant ist, dass auch die Expertinnen und Experten von Miðeind noch keine zufriedenstellende Lösung gefunden haben, obwohl man sich dort der Problematik, die im Fachjargon als Gender Bias bezeichnet wird, bewusst ist. Ein Infokasten auf der Website weist darauf hin, dass das Tool sich noch in Entwicklung befindet, dass die Qualität der Übersetzungsergebnisse nicht immer vorhersehbar ist und dass Verzerrungseffekte wie der Gender Bias auftreten können.

Der derzeitige Lösungsansatz von Miðeind besteht darin, dass der Algorithmus – zumindest manchmal – beide Formen zur Auswahl stellt, wie man an den Sätzen „Ich bin stolz.“ und „Ich bin gestresst.“ im Screenshot sehen kann. Im Falle von „gestresst“, das mit „stressuð(ur)“ widergegeben ist, führt das aber zu einem anderen Fehler. Im Isländischen gibt es nämlich diverse von der Wortendung abhängende Vokalwechsel, sodass die korrekte männliche Form nicht „stressuður“ lautet, sondern „stressaður“.

Fazit: Sprachtechnologien bieten enorme Chancen. Sie können unter anderem dazu beitragen, dass eine von nur wenigen Menschen gesprochene Sprache lebendig bleibt, wie das Beispiel von Island und seinem Umgang mit der Sprache im KI-Zeitalter zeigt. Dennoch kann die KI nicht jede Sprachbarriere durchbrechen, denn die Ergebnisse können diskriminierend oder schlichtweg falsch sein und sind daher mit Vorsicht zu genießen. Mehr dazu im nächsten Blogbeitrag.

Zurück