OpenAI ahora puede recrear voces humanas con su plataforma “Voice Engine”. La empresa financiada por Microsoft mantiene el nuevo motor de IA muy cerca de su pecho debido a implicaciones éticas y legales obvias.
Después del éxito masivo de ChatGPT, DALL-E y Sora, OpenAI ahora se ha aventurado en el campo del sonido, en particular, el habla y la voz humana. Voice Engine AI se encuentra actualmente en la fase de prueba beta, pero es posible que los usuarios de Internet no puedan registrarse para obtener una suscripción.
Voice Engine puede recrear voces humanas multilingües con grabaciones de solo 15 segundos
ChatGPT arrasó en el mundo, DALL-E desbloqueó la creatividad de millones y Sora pronto permitirá que los usuarios comunes de Internet se conviertan en creadores de películas. Después de texto, imágenes y videos, OpenAI ha anunciado Voice Engine, una plataforma de inteligencia artificial que puede recrear voces humanas.
Los New York Times Recibimos una demostración de la plataforma Voice Engine. El motor de IA puede según se informa recrear la voz de un humano a partir de una grabación de 15 segundos. Si eso no es lo suficientemente aterrador, después de absorber la información necesaria, Voice Engine puede pronunciar cualquier mensaje de texto en la voz humana recreada.
Compartimos nuestros aprendizajes de una vista previa a pequeña escala de Voice Engine, un modelo que utiliza entrada de texto y una única muestra de audio de 15 segundos para generar un habla con sonido natural que se parece mucho al hablante original. https://t.co/yLsfGaVtrZ
—OpenAI (@OpenAI) 29 de marzo de 2024
Sorprendentemente, el mensaje de texto ni siquiera necesita estar en el idioma nativo del hablante, cuya voz se utilizó para entrenar el motor de IA. En otras palabras, un hablante nativo de inglés podría hablar en español, francés, chino o muchos otros idiomas a través de Voice Engine.
Dados los obstáculos obvios de dicha tecnología, OpenAI ha asegurado que está explorando múltiples controles de seguridad, como marcas de agua. Habría controles que impedirían que Voice Engine cree las voces humanas de ciertos individuos.
#AIabierta El nuevo motor de voz ayuda a un paciente que perdió el habla debido a un tumor cerebral a volver a hablar con fluidez. @OpenskiesX pic.twitter.com/YB0mjKJYew
– RameshR (@rezmeram) 29 de marzo de 2024
Curiosamente, el gerente de producto OpenAI, Jeff Harris, ha según se informa afirmó que la compañía no tiene planes inmediatos para ganar dinero con la tecnología. El objetivo principal del programa es ser útil a las personas que perdieron la voz por enfermedad o accidente, añadió.
¿OpenAI ofrecerá su última creación a los usuarios de Internet como suscripción?
Sora de OpenAI, que permite a los usuarios crear una película de 60 segundos con solo indicaciones de texto, no está disponible para el público en general. Asimismo, la empresa no ha lanzado ninguna versión de Voice Engine.
Voice Engine está actualmente disponible para «un pequeño grupo de empresas». En pocas palabras, algunas empresas, presumiblemente por invitación, tienen acceso limitado a la plataforma.
No hace falta mencionar que existen enormes implicaciones éticas y legales en una plataforma de inteligencia artificial que puede recrear voces humanas, en varios idiomas, basándose en 15 grabaciones.
OpenAI anuncia públicamente su Voice Engine, que permite clonar voz a partir de 15 segundos de audio.https://t.co/zMRViqN5f5
Desarrollado originalmente a finales de 2022, lo probaron con una variedad de socios confiables. Algunas muestras de demostración se comparten en la publicación del blog. No tienen… pic.twitter.com/aGK0ghwlsv
— Tanishq Mathew Abraham, Ph.D. (@iScienceLuvr) 29 de marzo de 2024
Es posible que OpenAI tenga acceso restringido a Voice Engine. Sin embargo, es preocupante observar que la IA se ha metamorfoseado en un gigante.
Además de convencer con imágenes y vídeos profundamente falsos, los estafadores y estafadores han estado utilizando la IA para imitar voces humanas durante bastante tiempo. Varias víctimas han sido víctimas de mensajes de voz profundamente falsos eso sonaba como si sus familiares estuvieran en problemas y estuvieran pidiendo dinero.
OpenAI acaba de lanzar Voice Engine,
Utiliza entrada de texto y una única muestra de audio de 15 segundos para generar un discurso con un sonido natural que se parece mucho al hablante original.
El audio de referencia y el generado son muy parecidos y difíciles de diferenciar.
Más detalles en 🧵 pic.twitter.com/tJRrCO2WZP—AshutoshShrivastava (@ai_for_success) 29 de marzo de 2024
En las manos equivocadas, Voice Engine podría aceptar y recrear las voces de políticos, celebridades, periodistas y otras personalidades destacadas. La plataforma podría utilizarse para crear clips de audio convincentes que difundan información errónea o propaganda. En un escenario igualmente aterrador, los piratas informáticos y los delincuentes podrían comprometer los sistemas de seguridad que dependen de la autenticación por voz.
Por lo tanto, lo más probable es que OpenAI censurar y regular la plataforma Voice Engine. Tendría que formular algunas cerraduras digitales resistentes e inteligentes, así como controles de seguridad estrictos para prevenir su mal uso.
Dejando a un lado las preocupaciones éticas y de seguridad, el motor de voz de OpenAI podría ser de gran ayuda para los productores de películas y series web que necesitan doblar sus creaciones a otros idiomas. De manera similar, los campos de la educación y el entretenimiento también podrían beneficiarse enormemente.