- Los investigadores han desarrollado un nuevo generador de vídeo con IA
- El generador crea varias etapas de baja resolución antes de generar una final de alta resolución.
- El generador de IA se ha vuelto completamente de código abierto para uso individual y comercial.
Un equipo de investigadores de la Universidad de Pekín, Kuaishou Technology y la Universidad de Correos y Telecomunicaciones de Beijing han logrado grandes avances en el campo de la generación de vídeos con IA.
Han desarrollado un nuevo AI modelo, Pyramid Flow, capaz de generar imágenes de vídeo virtuales de alta resolución a 768p.
A diferencia de muchos modelos patentados de IA desarrollados en los últimos años, los creadores de Pyramid Flow hicieron que su modelo fuera de código abierto, brindando a los desarrolladores y usuarios acceso gratuito a la tecnología subyacente.
¿Un gran avance en la generación de vídeos con IA?
El modelo Pyramid Flow adopta un enfoque diferente al de muchos de sus predecesores al generar videos en múltiples etapas de baja resolución antes de producir un resultado final de alta resolución.
Este método reduce la potencia informática necesaria para ejecutar el modelo, lo que lo hace más rentable para los usuarios. El equipo afirma que el modelo puede producir un videoclip de cinco segundos con una resolución de 384p en sólo 56 segundos.
Pyramid Flow también está disponible como software de código abierto Los desarrolladores hacen que el modelo sea de libre acceso bajo la licencia MIT, lo que significa que cualquiera puede descargar, modificar y usar el código para fines personales o comerciales.
Junto con el modelo en sí, los investigadores han publicado varios videos de muestra que demuestran la calidad de la producción de Pyramid Flow. Los resultados muestran imágenes muy realistas y detalladas, incluidos ejemplos como explosiones submarinas que crean burbujas y salpicaduras de agua. Además, los conjuntos de datos utilizados para entrenar Pyramid Flow, que constan de alrededor de 10 millones de vídeos cortos, también están disponibles para el público.
El uso de conjuntos de datos de código abierto en la generación de vídeos de IA ha sido un tema polémico, y algunos críticos afirman que tales prácticas violan los derechos de los titulares de derechos de autor.
El equipo de investigación detrás de Pyramid Flow no ha abordado específicamente estas preocupaciones, pero sí sugiere que el modelo podría ser una herramienta útil para ajustar el material de código abierto, reduciendo potencialmente la necesidad de depender de fuentes de terceros.
A través de Explorar tecnología