La voz sintética de Google generada por inteligencia artificial es increíblemente parecida a la humana

Los avances de Google en materia de inteligencia fabricado no paran, y ahora han diligente técnicas de redes neuronales profundas para desarrollar el llamado Tacotron 2, un sistema que permite repasar textos escritos con una voz sintetizada asombrosa.

Es asombrosa porque como indican sus responsables el parecido con una voz humana es efectivamente increíble. Las muestras que incluimos en el texto dejan claro que esta voz generada por ordenador hace prácticamente indistinguible la voz verdadero de la sintentizada, tanto por entonación como por pausas.

¿Eres capaz de identificar cuál es verdadero y cuál sintetizada?

El sistema de Google se zócalo en una primera red neuronal que traduce el texto a un espectrograma para representar frecuencias de audio a lo espléndido del tiempo. Ese descomposición alimenta al llamado WaveNet, un sistema desarrollado por su división DeepMind que estudia el diagrama y genera los principios de audio correspondientes para ofrecer la voz sintetizada.

“That girl did a video about Star Wars lipstick.”

“She earned a doctorate in sociology at Columbia University.”

“George Washington was the first President of the United States.”

“I’m too busy for romance.”

En las muestras de audio se pueden escuchar tanto la voz sintetizada como la voz verdadero de un empleado de Google, y como indican en Quartz la única pista que tenemos de cuál es cual es que para cada archivo hay uno etiquetado con el término “gen”, que parece apuntar a la muestra generada por inteligencia fabricado. Tacotron 2 es asimismo capaz de modificar su entonación en preguntas o con palabras en mayúsculas que necesitan más vehemencia, y no tiene problemas con los trabalenguas:

“The quick brown fox jumps over the lazy dog.”

“Does the quick brown fox jump over the lazy dog?”

“The buses aren’t the problem, they actually provide a solution.”

“The buses aren’t the PROBLEM, they actually provide a SOLUTION.”

“Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?”

“She sells sea-shells on the sea-shore. The shells she sells are sea-shells I’m sure.”

La aplicación praxis de esta tecnología es evidente: Google Assistant podría mejorar su interacción con los usuarios, como asimismo lo harían otros sistemas que asimismo hacen uso de una voz sintetizada para dar avisos o instrucciones, como ocurre en Google Maps.

La única inconveniente por ahora es que solo han generado la voz en inglés de una mujer: tendrán que retornar a entrenar el sistema para originar una voz masculina, por ejemplo, y hacer lo mismo con otros idiomas.

Vía | Quartz
Más información | Google
En Xataka | Google afirma que su IA ya crea mejores Inteligencias Artificiales que otras creadas por humanos


Source link

deja tu opinion

Seguinos

Tecnoblog en las redes sociales