Flucht und Migration

„Capiche“: Digitaler Sprachassistent für Geflüchtete

Webseiten- und Serviceanbieter sehen sich mit einer Vielzahl von Anfragen in unterschiedlichen Sprachen konfrontiert, die die üblichen Sprachassistenten nicht bewältigen können. So bleiben gerade Fragen von Geflüchteten unbeantwortet. „Capiche“ ist ein Übersetzungs- und Suchdienst, der Künstliche Intelligenz mit Crowd-Wissen verbindet. Seine erste Anwendung wurde in Kooperation mit dem Informationsportal für Geflüchtete „Handbok Germany“ entwickelt und am 11. Dezember 2017 auf dem EIT Digital Innovation Day in Berlin vorgestellt.

14.12.2017

Moderne Sprachassistenten und Chatbots sind immer nur so schlau wie die ihnen zugrunde liegenden Datenbanken. Sie verstehen die gängigen westeuropäischen Sprachen und antworten auf Dinge, die sie bereits gelernt haben. Aber die Datenbanken verfügen nicht über Arabisch-, Paschtu- oder Tigrini-Kenntnisse. „Capiche“ ist ein Übersetzungs- und Suchdienst, der Künstliche Intelligenz (KI) mit Crowd-Wissen verbindet und nicht zuletzt die Kommunikation von und mit Geflüchteten in Europa nachhaltig verbessern soll.

„Capiche“ ist ein Spin-Off des Innovationsprojekts European Refugee Information and Communication Service (ERICS) von „EIT Digital“ und wurde gemeinsam mit den EIT-Digital-Partnern TU Berlin, T-Systems Multimedia Solutions GmbH, Deutsches Forschungszentrum für Künstliche Intelligenz, Aalto University sowie der Crowdee GmbH, einer Ausgründung des Quality and Usability Labs der TU Berlin, entwickelt.

„‚Capiche‘ ist das erste KI-System auf dem Markt, das Crowd-Sourcing integriert und die daraus entstehenden Daten für das Anlernen des KI-Systems nutzt“, erläutert Dr. Tim Polzehl, Projektleiter bei EIT Digital, Mitarbeiter der TU Berlin und Mitgründer von Crowdee.

Fehlende Sprachkenntnisse führen zu verlangsamter Integration

Mit einer wachsenden Anzahl geflüchteter Menschen steigt auch die Zahl derer in Europa, die im Alltag aufgrund fehlender Sprachkenntnisse große Hürden zu nehmen haben, sei es beim Verstehen von Webseiten und Informationsbroschüren oder in der Kommunikation mit Behörden. Direkte Nachfrage bei den Absendern sind selten möglich, da nationale Betreiber von Webseiten, Online-Journalen und öffentlichen Verwaltungseinrichtungen meist auf direkte Kommunikation verzichten, wenn sie – zum Beispiel – Arabisch nicht verstehen. So führen fehlende Sprachkenntnisse zu einem Informationsverlust, unbeantworteten Fragen und einer verlangsamten Integration.

„Capiche“

Mit „Capiche“ gibt es nun eine Lösung: Zum einen erleichtert das System Redaktionen, Inhalte auch in nicht üblichen Sprachen anzubieten. Über eine Schnittstelle im Content Management System werden Inhalte über einen cloud-basierten Mikroservice an das KI-System und die Crowd gespielt, mit deren Hilfe übersetzt und in der gewünschten Sprache direkt in das Content Management System zurückgespielt. Der Redakteur muss dann nur noch auf „veröffentlichen“ klicken. „Über Crowdee verfügen wir bereits seit ein paar Jahren über gute Erfahrungen in der Verteilung von Mikrojobs an eine Crowd. Das sind Menschen, die sich online verifizieren müssen, um dann ebenfalls online auf dem Smartphone oder am PC kleine Aufgaben zu erledigen und dabei Geld zu verdienen. Für ‚Capiche‘ steht uns im Rahmen von EIT Digital potentiell eine EU-weite Crowd mit 600.000 Teilnehmern zur Verfügung – wobei die Verifizierungsverfahren für hochqualifizierte Mikro-Jobber hier aufwändiger sind. Die Teilnehmer müssen vorab online ihre Übersetzungsfähigkeiten unter Beweis stellen, bevor sie aktiv teilnehmen können. In einem zweiten Schritt werden alle Übersetzungen in einem sogenannten ‚Proofreading-Prozess‘ gegengelesen“, erläutert Dr. Tim Polzehl das Verfahren.

In einer weiteren Ausbaustufe soll „Capiche“ als multilinguale Echtzeit-Kommunikation in allen wichtigen EU- und Flüchtlingssprachen verfügbar sein, inklusive eines Extremisten- und Fake-News-Filters. Dann geht es nicht nur um Übersetzungen, sondern es soll auch möglich sein, dass ein Nutzer direkt in einem Chat seine Frage, in seiner jeweiligen Landessprache, an ein Informationsportal stellt und die Kombination aus Künstlicher Intelligenz und menschlicher Crowd-Intelligenz die Antwort schnell und unkompliziert in der jeweiligen Sprache findet. „Datenbasierte intelligente Systeme decken rund 80 Prozent des dafür benötigten Wissens ab. Unser Ziel ist es, diese 80 Prozent durch gezielte und geschulte Schwarmintelligenz der Crowd möglichst auf 100 Prozent zu verbessern“, so Dr. Tim Polzehl.

Kontakt

Dr. Tim Polzehl
TU Berlin
Deutsche Telekom Laboratories
Telefon: 030 8353-58227
E-Mail: tim.polzehl@telekom.de

Michael Mast
Communications Lead Germany
EIT Digital Germany
Telefon: 030 34 50 6690 141
E-Mail: michael.mast@eitdigital.eu

Quelle: Technische Universität Berlin vom 12.12.2017

Back to Top