14. Dezember 2024

Mozilla veröffentlicht Common Voice Corpus 20.0

Geschätzte Lesedauer: 1 Minute

Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 20.0 seines Datensatzes veröffentlicht.

Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.

Mit dem nun veröffentlichten Common Voice Corpus 20.0 wächst der deutschsprachige Datensatz von 1.436 auf 1.443 Stunden an. Wer bereits den Common Voice Corpus 19.0 besitzt, kann wie immer auch nur ein sogenanntes Delta Segment mit den Unterschieden zur Vorversion herunterladen. Für Deutsch würde das den Download von 33,74 GB auf 138 MB reduzieren.

Insgesamt deckt Mozilla Common Voice mit der neuen Version 131 Sprachen mit insgesamt 33.151 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht.

Zum Download der Mozilla Common Voice Datensätze

Unabhängige Berichterstattung unterstützen.

Unterstütze wirklich unabhängige und Fakten-basierte Berichterstattung zu Mozilla, welche nicht das Ziel hat, Schlagzeilen zu produzieren, sondern objektiv zu informieren.

Dieser Artikel wurde von Sören Hentzschel verfasst.

Sören Hentzschel ist Webentwickler aus Salzburg. Auf soeren-hentzschel.at informiert er umfassend über Neuigkeiten zu Mozilla. Außerdem ist er Betreiber von camp-firefox.de, der ersten Anlaufstelle im deutschsprachigen Raum für Firefox-Probleme aller Art. Weitere Projekte sind firefox.agenedia.com, firefoxosdevices.org sowie sozone.de.

Weitere aktuelle Artikel aus der Kategorie „Mozilla“

24.03.2025Mozilla veröffentlicht Common Voice Corpus 21.0
23.02.2025Mozilla stellt sich auf Führungsebene breiter auf
16.12.2024Mozilla macht Rekordumsatz im Jahr 2023
08.12.2024Neue Mozilla-Marke offiziell vorgestellt
01.12.2024🎄🎁 Weihnachten steht vor der Tür - Produkte von Mozilla als Geschenkidee

2 Kommentare - bis jetzt!

Eigenen Kommentar verfassen

mam
schrieb am 16. Dezember 2024 um 07:48 Uhr:

Mich würde mal total interessieren, wie der Zuwachs die Erkennungsgenauigkeit von Anwendungen beeinflusst, die darauf aufsetzen. Ist dir da ein zeitlicher Verlauf bekannt?
Sören Hentzschel Verfasser des Artikels
schrieb am 16. Dezember 2024 um 08:32 Uhr:

Dazu ist mir leider überhaupt nichts bekannt.

Und jetzt du! Deine Meinung?

Erforderliche Felder sind mit einem Asterisk (*) gekennzeichnet. Die E-Mail-Adresse wird nicht veröffentlicht.

Name*

E-Mail*

Webseite

Kommentar*

E-Mail-Benachrichtigungen erhalten?

Nach Absenden des Kommentar-Formulars erfolgt eine Verarbeitung der von Ihnen eingegebenen personenbezogenen Daten durch den datenschutzrechtlich Verantwortlichen zum Zweck der Bearbeitung Ihrer Anfrage auf Grundlage Ihrer durch das Absenden des Formulars erteilten Einwilligung.
Weitere Informationen

Mozilla veröffentlicht Common Voice Corpus 20.0

Diesen Artikel teilen

Weitere aktuelle Artikel aus der Kategorie „Mozilla“

2 Kommentare - bis jetzt!

Und jetzt du! Deine Meinung?

E-Mail-Benachrichtigungen erhalten?