Common Voice de Mozilla, el repositorio de datos de voz para desarrolladores.

0
215

Common Voice es una colección de voces de dominio público de Mozilla. Recientemente la firma anunció que ampliaron la base de datos que busca promover los desarrollos libres.

Mozilla menciona que, su intención siempre ha sido construir y promover la web como un recurso público global, accesible para todos. En ese marco, han estado trabajando en el campo del machine learning y el reconocimiento de voz. Parte de ese resultado es Common Voice: gran repositorio de datos de voz de alta calidad.

Esa gran base se ha ampliado con el tiempo y ahora la organización ha lanzado la mayor colección de voces humanas disponibles. La misma se encuentra en 18 idiomas diferentes, incluyendo holandés, esperanto, vasco, español, francés, alemán, chino mandarín y otros.

La colección se compone de 1400 horas de archivos de voz grabados por 42000 contribuyentes. Algunos de ellos son voluntarios, mientras que otros son lingüistas y profesionales que trabajan en tecnologías de voz.

¿Qué sentido tiene todo esto? El objetivo es facilitar a los desarrolladores que no cuentan con los recursos de una empresa grande como Apple o Google, para crear productos que utilicen la voz para funcionar. Los desarrolladores pueden ir a este sitio para ver la base.

Fuente: Fayerwayer.