Una nueva entrevista con el director detrás del clip viral de Sora Cabeza de aire ha revelado que la IA jugó un papel menor en su producción de lo que se afirmó originalmente.
Revelado por Patrick Cederberg (quien hizo la postproducción del video viral) en un entrevista con Fxguideahora se ha confirmado que Abierto AIEl programa de conversión de texto a vídeo estuvo lejos de ser la única fuerza involucrada en su producción. El clip de 1 minuto y 21 segundos se realizó con una combinación de técnicas cinematográficas tradicionales y edición de posproducción para lograr el aspecto de la imagen final.
Cabeza de aire fue realizado por ShyKids y cuenta la historia corta de un hombre con un globo literal por cabeza. Si bien se utiliza voz en off humana, por la forma en que OpenAI estaba promocionando el clip en canales sociales como YouTubeciertamente dejó la impresión de que las imágenes estaban impulsadas exclusivamente por IA, pero eso no es del todo cierto.
Como se revela en el clip detrás de escena, ShyKids realizó un montón de trabajo, tomó la producción sin procesar de Sora y ayudó a limpiarla hasta convertirla en el producto terminado. Esto incluyó rotoscopiar manualmente los fondos, eliminar las caras que ocasionalmente aparecían en los globos y corregir el color.
Luego está el hecho de que Sora necesita mucho tiempo para hacer las cosas bien. Cederberg explica que hubo «cientos de generaciones de 10 a 20 segundos por pieza» que luego fueron editadas minuciosamente en lo que el equipo describió como una proporción «300:1» de lo que se generó frente a lo que se preparó para retoques adicionales.
Dicho trabajo manual también incluía editar la cabeza que aparecería y reaparecería, e incluso cambiar el color del globo, que aparecería rojo en lugar de amarillo. Si bien se utilizó a Sora para generar las imágenes iniciales con buenos resultados, claramente sucedieron muchas más cosas detrás de escena para que el producto terminado se viera tan bien como se ve, por lo que todavía estamos muy lejos de la película generada instantáneamente. producciones de calidad.
Sora permanece en secreto salvo por un puñado de proyectos cuidadosamente seleccionados que se han permitido salir a la luz, con Cabeza de aire entre los más populares. El clip tiene más de 120.000 visitas al momento de escribir este artículo, y OpenAI lo promociona como «experimentación» con el programa, minimizando el trabajo obvio que se realizó en el producto final.
Sora es impresionante pero no estamos convencidos.
Si bien OpenAI ha hecho un trabajo decente al mostrar lo que puede hacer su servicio de texto a video a través del modelo de lenguaje grande, la falta de transparencia es preocupante.
Cabeza de aire Es un clip impresionante realizado por un equipo talentoso, pero estuvo sujeto a mucha edición para llevar el producto final a donde está en el corto.
No es exactamente el enfoque de un clic y listo como lo han representado muchos de los impulsores de la tecnología. Resulta que es simplemente una herramienta que podría usarse para mejorar imágenes en lugar de crear desde cero, algo que ya es bastante común en la producción de videos, lo que hace que Sora parezca menos revolucionario de lo que parecía al principio.