Abierto AI tiene planes de presentar su última generación inteligencia artificial (AI) modelo Sora a finales de este año, según un informe. sora, introducido el mes pasado, es un generador de texto a video impulsado por inteligencia artificial que, según la compañía, puede generar videos de hasta 60 segundos de duración, mucho más que cualquiera de sus rivales de la industria. En una entrevista reciente, el director técnico de la empresa de inteligencia artificial también reveló que Sora puede generar videos en unos pocos minutos dependiendo de la complejidad del mensaje. La entrevista también cubrió temas como la imperfección del modelo, los datos utilizados para entrenarlo y el posible precio de Sora.
en un entrevista Con The Wall Street Journal, la CTO de OpenAI, Mira Murati, sobre la cuestión de cuándo estará disponible el generador de vídeo de IA, dijo: «Espero definitivamente este año, pero podrían ser unos meses». Cuando se le preguntó si las elecciones presidenciales de EE. UU., previstas para noviembre de 2024, influirán en las consideraciones de la empresa sobre cuándo lanzar el modelo de IA, Murati dijo que lidiar con la información errónea y los prejuicios dañinos es importante para la empresa y añadió: » No publicaremos nada que no confiemos en cómo podría afectar las elecciones globales”.
También se le preguntó a Murati sobre la fuente de datos con la que se entrenó a Sora. La cuestión también es de interés al organismo de control de protección de datos de Italia que está investigando posibles violaciones de datos por parte de OpenAI. Los reguladores dieron a la empresa de IA 20 días para proporcionar información sobre el generador de vídeo de IA.
En la entrevista, Murati tampoco pareció revelar ningún detalle y solo afirmó que el modelo de IA se entrenó con datos disponibles en el dominio público y que tenían licencia para la empresa. También dijo que no estaba segura de si se utilizaron datos de YouTube o Facebook, pero confirmó a la publicación que Sora usó contenido de Shutterstock, con quien tienen una asociación.
Sora también es un modelo muy costoso de ejecutar en comparación con otras herramientas OpenAI como ChatGPT y DARLE, explicó Murati. “ChatGPT y DALL-E están optimizados para que el público los utilice, mientras que Sora es en realidad un resultado de investigación. Es mucho, mucho más caro”, dijo el CTO al WSJ. Si bien la compañía no ha fijado un precio para el modelo de video AI, Murati dijo que la compañía está tratando de que el modelo esté disponible, una vez que se lance, a un costo similar al de DALL-E. En la actualidad, el precio base del modelo DALL-E 3 es de 0,040 dólares (aproximadamente 3 rupias) por imagen con una resolución de 1.024 x 1.024 píxeles.
Además, el CTO de OpenAI también destacó que la compañía estaba trabajando para brindar capacidades de audio a Sora, optimizar el tiempo de generación y su rentabilidad, y realizar más mejoras para minimizar las imperfecciones.