Common Voice -  wielojęzyczny zbiór danych mowy open source

Common Voice - wielojęzyczny zbiór danych mowy open source

Mozilla
Common Voice to publicznie dostępny zbiór danych głosowych, zasilany głosami ochotników z całego świata. Osoby, które chcą tworzyć aplikacje głosowe, mogą wykorzystać zbiór danych do trenowania modeli uczenia maszynowego.
Obecnie większość zbiorów danych głosowych jest własnością firm, co hamuje innowacje. Zbiory danych głosowych nie reprezentują również: osób nie mówiących po angielsku, osób kolorowych, osób niepełnosprawnych, kobiet i osób LGBTQIA+. Oznacza to, że technologia obsługi głosowej nie działa w ogóle w przypadku wielu języków, a tam, gdzie działa, może nie działać równie dobrze dla wszystkich. Chcemy to zmienić, mobilizując ludzi na całym świecie do dzielenia się swoim głosem.
Można pomóc i nagrać swój głos i dodać go do bazy
Obecnie dla języka polskiego jest 174 godziny tj. 91%
#ai #rozpoznawaniemowy #machinelearning

Komentarze (0)

Zaloguj się aby komentować