TL;DR
- El CTO de OpenAI dice que el generador de texto a video de la compañía estará disponible para el público a finales de este año.
- Eventualmente planea incorporar audio en los videos generados por IA.
- La compañía dice que está intentando que la herramienta esté disponible a costos similares a los de DALL-E.
A principios de este año, ChatGPT El creador OpenAI mostró su nuevo modelo de IA generativa de texto a video llamado Sora. En ese momento, la herramienta de inteligencia artificial solo estaba disponible para los miembros del equipo rojo. Sin embargo, parece que la empresa planea lanzar públicamente la herramienta muy pronto.
En una entrevista con El periodico de Wall Street, la directora de tecnología (CTO) de OpenAI, Mira Murati, habló sobre los planes de la compañía para Sora. Durante esa entrevista, Murati mencionó que la herramienta de inteligencia artificial estaría disponible “este año” y que podría estar lista en unos meses.
El CTO continuó diciendo que OpenAI quiere que los usuarios puedan editar los videos producidos por Sora. Y en el futuro, la empresa también planea incorporar audio en esos videos generados por IA.
Parece que Sora es un modelo de IA costoso de ejecutar, como dijo Murati a la publicación, su funcionamiento es “mucho más caro” que otros modelos. A pesar de eso, se informa que OpenAI pretende que la herramienta esté “disponible a costos similares” a DALL-E, su herramienta de inteligencia artificial de texto a imagen.
Al igual que otras herramientas de inteligencia artificial generativa, Sora necesita recibir capacitación sobre datos para poder producir contenido relevante. Cuando se le preguntó qué datos se utilizaron para entrenar a Sora, el CTO pareció dudar en dar una respuesta. «No voy a entrar en detalles de los datos que se utilizaron, pero estaban disponibles públicamente o estaban autorizados», dijo Murati al WSJ. Si bien confirmó que Sora usa contenido de Shutterstock, con el que OpenAI tiene una asociación, no estaba segura de si Sora también tomó prestado de YouTube, Facebook e Instagram.
En cuanto a las medidas de seguridad para ayudar a prevenir la propagación de desinformación, Murati dice que los videos tendrán una marca de agua y probablemente no podrán generar imágenes de figuras públicas. Queda por ver si esto será suficiente para disuadir la desinformación, pero las marcas de agua ya se han roto antes.