¿Lo que acaba de suceder? Dado que otras empresas lanzan IA generativas de texto a video, no debería sorprendernos saber que la empresa que inició la revolución de la inteligencia artificial generativa, OpenAI, se ha unido al club. Llamada Sora, la herramienta puede generar clips de 60 segundos de 1080p similares a películas a partir de mensajes de texto que en muchos casos parecen bastante realistas.
Sora puede generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. escribe OpenAI. La herramienta también puede crear múltiples tomas dentro de un solo video generado.
Como era de esperar, los ejemplos cuidadosamente seleccionados publicados en la página de anuncios de OpenAI parecen bastante convincentes. Hay una mujer caminando por una calle de Tokio, imágenes históricas de la fiebre del oro de California, un dálmata moviéndose entre los alféizares de las ventanas y otros.
Sora puede tomar videoclips existentes y ampliarlos o completar fotogramas faltantes, lo que suena interesante. También puede generar vídeos en diferentes estilos, como blanco y negro y animados.
Es algo impresionante, pero es posible que notes signos reveladores de que los clips fueron generados por IA al inspeccionarlos de cerca, como la forma en que se mueven las patas del perro o las miradas y movimientos antinaturales de los personajes de fondo.
OpenAI admite que el modelo actual de Sora puede tener problemas con algunos elementos, incluida la simulación precisa de la física y la falta de comprensión de casos específicos de causa y efecto, como una marca de mordisco que queda en la comida después de que alguien muerde. También puede confundir detalles espaciales y tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.
¡Bienvenido al zoológico bling! Este es un video único generado por Sora, cambios de toma y todo. https://t.co/81ZhYX4gru pic.twitter.com/rnxWXY71Gr
– Bill Peebles (@billpeeb) 15 de febrero de 2024
La seguridad es siempre una gran preocupación con este tipo de tecnologías. OpenAI dice que está trabajando con expertos en campos como la desinformación, el odio y los prejuicios para probar el modelo de Sora. La compañía también está creando herramientas, incluido un clasificador de detección, para ayudar a identificar contenido engañoso y determinar cuándo Sora generó un video. OpenAI dijo que planea incluir metadatos C2PA en el futuro si implementa el modelo en un producto.
Hay algunas cuestiones éticas y de derechos de autor sobre qué datos se utilizaron para entrenar a Sora, como siempre es el caso con estas tecnologías. OpenAI no es muy comunicativo con esta información, más allá de señalar que utilizó alrededor de 10.000 horas de vídeo de alta calidad.
Mensaje: «Varios mamuts lanudos gigantes se acercan caminando a través de un prado nevado, su largo pelaje lanudo ondea ligeramente con el viento mientras caminan, árboles cubiertos de nieve y espectaculares montañas cubiertas de nieve en la distancia, luz de media tarde con nubes tenues y un sol alto en la distancia… pic.twitter.com/Um5CWI18nS
–OpenAI (@OpenAI) 15 de febrero de 2024
Sora se encuentra actualmente en la etapa de vista previa de la investigación y está siendo probada por usuarios seleccionados; aún no está disponible al público debido al potencial de uso indebido.
«Involucraremos a formuladores de políticas, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología», escribe OpenAI. «A pesar de investigaciones y pruebas exhaustivas, no podemos predecir todas las formas beneficiosas en que las personas usarán nuestra tecnología, ni todas las formas en que abusarán de ella. Es por eso que creemos que aprender del uso en el mundo real es un componente crítico para crear y lanzar cada vez más sistemas de IA seguros a lo largo del tiempo».
Hemos visto generadores de texto a video en el pasado, incluidos Huir y de google Lumière. Será interesante ver cómo le va a un competidor de ChatGPT/DALL-E-creator OpenAI frente a estas herramientas.
aquí hay uno mejor: https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN
– Sam Altman (@sama) 15 de febrero de 2024
Si bien aún no está disponible de manera generalizada, el jefe de OpenAI, Sam Altman, pidió a la gente de X que sugirieran ideas que se convertirán en videos usando Sora. Algunos de los resultados se han incluido en este artículo.