Google tiene una voz sintética creada por IA, y esta suena casi como una voz real.

0
783

Su nombre es Tacotron 2, y se trata de la nueva arquitectura de redes neuronales desarrollada por Google, arquitectura que lleva esto de las “voces sintéticas” a un nivel superior por sobre lo que ya conocíamos.

El funcionamiento de Tacotron 2 combina funciones de proyectos anteriores de Google, como son WaveNet y Tacotron, cuyo objetivo final es entrenar maquinas para que hablen como los humanos.

La idea con Tacotron 2 es que las tareas que tengan que ver con producir un discurso fluido y natural a partir de texto sean mucho más fáciles de llevar a cabo sin la necesidad de que se requiera un entrenamiento con gran cantidad de metadatos sobre lenguaje y gramática, para que la dinámica funcione correctamente, motivo por el actual en la actualidad las voces sintéticas siguen sonando robóticas, demasiado que aprender para una labor que debería ser mucho mas natural.

El equipo de Google ha compartido una serie de audios en GitHub, donde nos reta a identificar cuál es la voz sintetizada, y la voz humana, ya que los resultados que están logrando con Tacrotron, son asombrosos. Podemos encontrar los audios que corresponden a este estudio en el siguiente enlace.

En los audios notaremos, que si bien, no puede cambiar la expresividad, utiliza muy bien las variantes del texto para cambiar la entonación, por ejemplo, al leer una pregunta, o al cambiar de ritmo con los signos de puntación.

Los avances son notorios y sorprende el parecido de estas voces sintéticas a los de una voz humana, que si, se puede mejorar bastante pero esto está recién comenzando por lo que con el pasar de los meses posiblemente los resultados que hoy pudimos ver en la web anterior, sean superados por mucho, pero para eso queda esperar a ver como lo hace Google, porque estoy casi seguro de que en el mediano plazo podríamos interactuar sin problemas con sistemas -por ejemplo- como los IVR sin darnos cuenta de que es una maquina la que nos habla.

Fuente: Google Blog.
Autor: Elias Villagrán Donaire (Twitter).