Bergamot Project: Mozilla und Europäische Union bringen maschinelle Übersetzungen ohne Cloud in Firefox
Im Rahmen des von der Europäischen Union geförderten Bergamot Projects arbeitet Mozilla daran, eine Übersetzungsfunktion für Websites in Firefox zu integrieren – und das vollständig ohne Online-Komponente wie Google Translate.
Bergamot Project: Website-Übersetzung im Browser
Warum sollte man eine Webseite an Google senden, um sie zu übersetzen, wenn doch der eigene Computer und Browser alles dafür hätten, die Übersetzung durchzuführen? Diese Frage hat Emma Humphries von Mozilla sinngemäß auf Twitter gestellt und in dem Tweet auf eine aktuelle Stellenausschreibung von Mozilla verwiesen. Darin sucht Mozilla nach einem Ingenieur für neuronale maschinelle Übersetzung.
Hintergrund des Ganzen ist das von der Europäischen Union geförderte Bergamot Project, in dessen Rahmen Mozilla Deutschland mit der University of Tartu (Estland), der University of Sheffield (England), der University of Edinburgh (Schottland) und der Charles University (Tschechien) kollaboriert, um eine vollständig clientseitige Funktion zur maschinellen Übersetzung von Websites für den Browser zu entwickeln.
Die clientseitige Durchführung der Übersetzung soll einerseits der Privatsphäre dienen, da kein Datenriese wie Google involviert ist, andererseits aber auch die Verbreitung von Sprachtechnologie in Europa fördern, und zwar in Bereichen, welche Vertraulichkeit erfordern und wo es dementsprechend keine Option ist, die Übersetzung in der Cloud durchzuführen.
Das Bergamot Project ist mit drei Millionen Euro durch die Europäische Union gefördert und auf drei Jahre ausgelegt. Damit das Projekt auch über die drei Jahre hinaus einen langfristigen Effekt hat, wird die Übersetzungsfunktion in Firefox integriert und alle Technologien, welche im Rahmen des Bergamot Projects entstehen, als Open Source veröffentlicht.
Für Mozilla hat das Ganze noch einen weiteren sehr großen Vorteil: Firefox hat bereits seit Jahren eine Übersetzungsfunktion integriert, konnte diese aber bisher nicht standardmäßig aktivieren. Hierfür muss der Nutzer sich einen API-Schlüssel bei Google, Microsoft oder Yandex besorgen und diesen via about:config hinterlegen. Der Grund dafür dürfte vermutlich simpel sein: Während die Nutzung eines cloudbasierten Übersetzungsdienstes zwar für den einzelnen Nutzer bei durchschnittlicher Nutzung kostenlos ist, entstehen ab einer gewissen Nutzung Kosten. Würde Mozilla dieses Feature nutzungsbereit ausliefern, wäre dies bei der Anzahl an Firefox-Nutzern für Mozilla mit extrem hohen Kosten verbunden. Entfällt diese Abhängigkeit, kann Mozilla ein Übersetzungs-Feature in Firefox anbieten, ohne dafür tief in die eigene Tasche greifen zu müssen.
Das Bergamot Project läuft bereits seit Januar dieses Jahres und der erste Integrations-Meilenstein wurde nun erreicht und der EU präsentiert. Das folgende Video zeigt eine automatisierte Übersetzung eines deutschsprachigen Artikels in das Englische. Optisch ist kein Unterschied zu der bereits in Firefox vorhandenen, aber versteckten Übersetzungsfunktion zu erkennen. Das Interessante ist das, was man nicht sieht: nämlich, dass in dieser Demo die Übersetzung vollständig im Browser stattfindet und weder die Schnittstellen von Google, Microsoft noch Yandex genutzt werden.
Common Voice, DeepSpeech, WebSpeech API, Firefox Voice
Das Bergamot Project ist nicht Mozillas einzige Aktivität im Bereich Sprache. Mit Common Voice stellt Mozilla eine Online-Plattform zur Verfügung, über welche durch die Nutzer der weltweit größte Sprach-Datensatz kostenlos erzeugt wird – als Alternative zu den großen kommerziellen Anbietern Google, Microsoft, Apple und Amazon.
Unter dem Namen DeepSpeech entwickelt Mozilla ein Open Source Sprachmodell, welches nach Angaben von Mozilla bereits in der Lage sein soll, „Sprache mit menschlicher Genauigkeit und in Echtzeit in Text zu konvertieren – und zwar noch während der Ton gestreamt wird.“ DeepSpeech wird bereits in den Assistenten von Mycroft und Leon sowie im Telefonvermittlungssystem FusionPBX verwendet. In Zukunft soll DeepSpeech auch in Smartphones und In-Car-Systemen zum Einsatz kommen.
Außerdem arbeitet Mozilla derzeit an der Unterstützung des Spracherkennung-Parts der WebSpeech API für Firefox, worüber Websites die Möglichkeit erhalten, per Sprache gesteuert zu werden. Und mit Firefox Voice arbeitet Mozilla an einem Experiment, um Firefox per Sprache zu steuern.
Spitze. Super Projekt.
Wird es das auch im Fenix geben?
Sehr coole Nachrichten! Hoffe es finden ein paar der Projekte mittelfristig Einzug in die Produktivversion.
Es dürfte noch zu früh sein, das zu beantworten. Interessant wäre das natürlich auch auf Android.
Das finde ich hervorragend, genau so muss eine derartige Technologie umgesetzt werden. Öffentlich finanziert, entwickelt und lokal eingesetzt. Der Trend zur Cloud ist leider überall stark gestiegen und das gefällt mir absolut gar nicht.
Finde ich mal eine gute Entscheidung. Wann soll das Projekt starten, bzw. verfügbar sein? Es gibt zwar den Übersetzungsdienst von deepl.com/translate — der wirklich gut ist – aber zur Zeit werden dort nur 7 Sprachen übersetzt.
Wie im Artikel steht, ist das Projekt bereits im Januar gestartet und auf drei Jahre ausgelegt.
DeepL bietet überhaupt keine Funktion zur Übersetzung ganzer Websites an.
Wenn die Esten mitarbeiten, dann bin ich guter Hoffnung, dass Finnisch besser übersetzt wird als mit Google. Das ist mitunter sehr grausig. Zum Beispiel:"Es gab eine Rekordzahl von Banden, das Getränk lief in die Gurken – eine Menge Husten, daher war das Bedürfnis nach den Zehen groß."
Nachtrag:
Dass deepl.com keine ganze Webseiten übersetzt, habe ich auch nicht geschrieben oder behauptet, aber man kann ja längere Textpassagen dort durchaus übersetzen lassen (mit Paste & Copy), das geht reibungslos und dies mache ich öfters. Ist aber natürlich nicht das Gleiche, ist mir schon klar.
Genau darum geht es hier aber, daher ist der Hinweis schon richtig gewesen, dass das mit DeepL nicht geht. 😉
Ich finde das Projekt ebenso Klasse. Zudem spart das dann Datenvolumen und Bandbreite (auf die breite Masse gerechnet)wovon alle was haben.
Ist schon klar, welche Sprachen unterstützt werden (sollen)?
Das ist noch nicht bekannt.