El nuevo modelo Sora de texto a video de OpenAI puede crear contenido sorprendentemente realista

Abierto AI abre nuevos caminos cuando el gigante de la inteligencia artificial ha revelado su primer modelo de conversión de texto a video llamado Sora, capaz de crear contenido sorprendentemente realista.

Nos hemos estado preguntando cuándo la compañía finalmente lanzaría su propio motor de video como tantos de sus rivales, desde Estabilidad IA a Google, se les han adelantado. Tal vez Abierto AI Quería hacer las cosas bien antes de un lanzamiento adecuado. A este ritmo, la calidad de sus productos podría eclipsar a la de sus contemporáneos. Según la página oficial, Sora puede generar “escenas realistas e imaginativas” a partir de un único mensaje de texto; Al igual que otros modelos de IA de texto a video. La diferencia con este motor es la tecnología que hay detrás.

Contenido realista

Open AI afirma que su inteligencia artificial puede comprender cómo las personas y los objetos «existen en el mundo físico». Esto le da a Sora la capacidad de crear escenas con varias personas, diferentes tipos de movimiento, expresiones faciales, texturas y objetos con una gran cantidad de detalles. Los videos generados carecen del aspecto plástico o de las formas de pesadilla que se ven en otros contenidos de IA, en su mayor parte, pero hablaremos de eso más adelante.

Sora también es multimodular. Según se informa, los usuarios podrán cargar una imagen fija que sirva como base para un vídeo. El contenido dentro de la imagen se animará prestando mucha atención a los pequeños detalles. Incluso puede tomar un vídeo preexistente “y ampliarlo o completar los fotogramas faltantes”.

Aviso: Una camada de cachorros de golden retriever jugando en la nieve. Sus cabezas emergen de la nieve, cubiertas de nieve. pic.twitter.com/G1qhJRV9tg15 de febrero de 2024

Puede encontrar clips de muestra en el sitio web de OpenAI y en X (la plataforma anteriormente conocida como Twitter). Uno de nuestros favoritos presenta a un grupo de cachorros jugando en la nieve. Si miras de cerca, puedes ver que su pelaje y la nieve en sus hocicos tienen una calidad sorprendentemente realista. Otro gran vídeo muestra una paloma con corona de Victoria moviéndose como un pájaro real.

Un trabajo en progreso

Por más impresionantes que puedan ser estos dos videos, Sora no es perfecto. OpenAI admite que su «modelo tiene debilidades». Puede tener dificultades para simular la física de un objeto, confundir la izquierda con la derecha y malinterpretar los «casos de causa y efecto». Puedes hacer que un personaje de IA muerda una galleta, pero la galleta carece de una marca de mordisco.

También comete muchos errores extraños. Uno de los contratiempos más divertidos. Implica a un grupo de arqueólogos desenterrando un gran trozo de papel que luego se transforma en una silla antes de terminar en un trozo de plástico arrugado. La IA también parece tener problemas con las palabras. «Otter» está mal escrito como «Oter» y «Land Rover» ahora es «Danover».

Incluso los errores de Sora son fascinantes pic.twitter.com/OvPSbaa0L915 de febrero de 2024

En el futuro, la compañía trabajará con sus “equipos rojos”, que son un grupo de expertos de la industria “para evaluar áreas críticas en busca de daños o riesgos”. Quieren asegurarse de que Sora no genere información falsa, contenido que incite al odio ni tenga prejuicios. Además, OpenAI implementará un clasificador de texto para rechazar mensajes que violen su política. Estos incluyen entradas que solicitan contenido sexual, videos violentos y retratos de celebridades, entre otras cosas.

No se sabe cuándo se lanzará oficialmente Sora. Nos comunicamos para obtener información sobre el lanzamiento. Esta historia se actualizará más adelante. Mientras tanto, consulte la lista de TechRadar de Los mejores editores de vídeo con IA para 2024.