Através del espejo: La IA generativa es conocida principalmente por crear texto e imágenes estáticas alarmantemente creíbles, y las herramientas han comenzado a ensamblar videoclips bastante realistas. Las experiencias interactivas, incluidos los juegos, podrían ser uno de los próximos pasos. La investigación de Google podría permitir que la IA tenga un impacto en la construcción de mundos virtuales, utilizando la IA para entrenarla.
Google DeepMind recientemente desvelado Genie, un modelo de IA que puede crear pequeños juegos interactivos a partir de imágenes estáticas. Google dice La base detrás de la tecnología puede facilitar otras aplicaciones, como el entrenamiento de robots impulsados por IA.
Genie recibió capacitación con alrededor de 200.000 horas de imágenes de juego disponibles públicamente (probablemente de YouTube, filial de Google). No está claro si cualquiera que lo use podría tener problemas de derechos de autor con los creadores de esos juegos.
Sorprendentemente, la IA no requiere texto ni etiquetas de acción para interpretar lo que ve. Funciona únicamente a partir de fotogramas de vídeo, descifrando qué elementos deben actuar como terreno y cuáles deben actuar como avatar controlable. Genie también puede interpretar la profundidad tridimensional de las imágenes para emular el desplazamiento de paralaje en el juego resultante.
La herramienta puede crear pequeños niveles de videojuegos a partir de pinturas, bocetos, renderizados, fotografías y otro tipo de imágenes. Como Genie puede trabajar con imágenes que nunca antes había visto, también puede crear entornos a partir de contenido generado por IA, lo que abre la posibilidad de utilizar contenido de una IA para crear algo en otra IA.
Sin embargo, hay espacio para la mejora. Como otros modelos de IA, Genie es capaz de alucinar. Además, esta iteración inicial sólo puede recordar hasta 16 fotogramas, lo que limita gravemente el tamaño de los niveles que puede construir sin dejar de ser consistente. La velocidad de funcionamiento de 1 fps del modelo también deja mucho margen de mejora.
Para garantizar la precisión, la demostración inicial de Genie se centra en replicar juegos de plataformas 2D. Sin embargo, Google sugiere que se le podría entrenar para crear otro tipo de juegos y contenidos virtuales.
Por ejemplo, Google dijo que Genie puede ayudar a entrenar ciertos robots de manera más efectiva. El entrenamiento mediante simulaciones creadas por humanos proporciona una variedad limitada de escenarios, pero Genie puede construir una gama mucho más amplia de entornos y objetos virtuales para que el robot aprenda.
A través de un mayor desarrollo, Genie podría convertir piezas interactivas en el próximo campo importante para la IA generativa. Actualmente, los vídeos se están convirtiendo en un foco central, especialmente desde OpenAI. desvelado Sora el mes pasado, que puede crear clips realistas de 60 segundos a 1080p. Como era de esperar, las imágenes generadas por IA no son perfectas, pero representan un importante avance para la tecnología.