VALL-E: La Nueva Tecnología de Microsoft Capaz de Imitar Voces Humanas

VALL-E es la nueva tecnología de Microsoft y es capaz de imitar voces humanas. Sí, como lo escuchas, la multinacional estadounidense está apostando fuerte en el mercado de las herramientas basadas en Inteligencia Artificial (IA).

Estas tecnologías basadas en IA se han popularizado en los últimos años alcanzando un auge sin precedentes. En este contexto el gigante tecnológico con sede en Washington desarrolla VALL-E. 

La gran empresa tecnológica tiene varias novedades en el campo de las IA. Entre estos proyectos VALL-E está causando gran expectación recientemente. 

Esta tecnología basada en IA es capaz de aprender, a partir de una grabación de voz de solo tres segundos, como imitar cualquier voz humana en particular. 

Te preguntarás, ¿cómo es esto posible? Pues en este artículo te explicaremos todo sobre esta nueva herramienta de Microsoft

¿Cómo funciona VALL-E?

Según explica la compañía de VALL-E, esta: genera los códigos discretos de códec de audio basados ​​en indicaciones de fonemas y códigos acústicos, correspondientes al contenido de destino y la voz del hablante”. 

Para su desarrollo se le introdujeron datos de entrenamiento de Síntesis de Texto a Voz (TTS) de 60,000 horas de habla en el idioma inglés.

Esto supera el tamaño de los sistemas existentes en la actualidad, según la propia compañía, pues con solo tres segundos de audio es capaz de imitar la voz de la grabación

Otro detalle interesante de VALL-E, según explican sus desarrolladores, es que sería capaz de conservar hasta la emoción que transmite el hablante  y mantener el tono acústico que posee el mensaje.

👉  Aplicaciones Móviles más Peligrosas del 2022

Las potencialidades de esta nueva herramienta basada en la IA están aún por explorarse, más allá de lo propuesto hasta ahora, sin embargo estamos cada vez más cerca de lograr que las máquinas hablen literalmente como nosotros.

¿Qué riesgos implicaría la nueva tecnología IA de Microsoft: VALL-E?

Ahora bien, hablemos de las implicaciones éticas y riesgos potenciales que podría acarrear VALL-E, la nueva tecnología IA de Microsoft. 

Muchos se alarman porque en realidad se trata de una herramienta inteligente capaz de usurpar la identidad de un hablante mediante la clonación de su voz. Es claro que este modelo puede emplearse indebidamente para falsificar la identificación de voz.

Sobre esto Microsoft explica: “Si el modelo se generaliza a hablantes invisibles en el mundo real, debe incluir un protocolo para garantizar que el hablante apruebe el uso de su voz y un modelo de detección de voz sintetizada”.

¿Cuándo se implementará VALL-E?

Microsoft está desarrollando VALL-E con el objetivo de implementarla junto a otros modelos de inteligencia artificial generativa, como los es el GPT-3. De hecho la compañía ha anunciado que implementara el ChatGPT.

Esta es una de sus principales soluciones previstas para llegar a Bing (el motor de búsqueda de Microsoft) en el primer trimestre del 2023. Esto significa que ChatGPT podrá ofrecernos resultados de voz con este modelo.

De todos modos Microsoft ha facilitado una página “Demo” para que el público pueda conocer y probar algunas muestras de lo que es capaz de hacer su aplicación. 

En ella se incluye un breve resumen sobre VALL-E y varios ejemplos que ilustran la capacidad de imitación de esta nueva herramienta. 

Deja un comentario

Twittear
Compartir
WhatsApp
Telegram
Pin