Apple, en colaboración con investigadores de la Universidad de California, ha lanzado su propio modelo de edición de imágenes basado en inteligencia artificial que cualquiera puede probar.
El modelo ha sido denominado «MGIE», que significa edición de imágenes guiada por MLLM y permite a los usuarios editar imágenes basándose en instrucciones en lenguaje natural. Aprovecha los modelos multimodales de lenguaje grande (MLLM), que combinan varios tipos de información, como texto, fotografías y videos, para comprender y generar un lenguaje similar al humano.
Si bien los estudios sobre MLLM han mostrado resultados prometedores en la comprensión y generación de imágenes, todavía no se han implementado ampliamente.
MGIE se presentó en un artículo en la Conferencia Internacional sobre Representaciones del Aprendizaje 2024. El papel muestra cómo MGIE puede mejorar las métricas automáticas y la evaluación humana al mismo tiempo que mantiene la eficiencia de la inferencia competitiva.
MGIE utiliza MLLM para derivar instrucciones expresivas a partir de la entrada del usuario. ritmo de riesgo ofertas un ejemplo: un usuario podría decirle a MGIE que «haga que el cielo sea más azul», y MGIE interpretaría esto como «aumentar la saturación de la región del cielo en un 20%».
Luego, una vez que las instrucciones se derivan de la entrada en lenguaje natural, genera una versión editada de la imagen. Se puede utilizar para crear una amplia gama de ediciones, desde ajustes de color hasta generar o eliminar partes de una imagen.
MGIE es de código abierto y está disponible en GitHub para que cualquiera pueda probarlo. El página de GitHub permite a los usuarios obtener el código, los datos y los modelos previamente entrenados.
La velocidad de generación de imágenes variará significativamente según el rendimiento del hardware. Además, modelos como este consumen muchísimo RAM.
Apple ha estado trabajando entre bastidores en sus funciones asistidas por IA desde hace algún tiempo. En Enero, El código en la versión beta de iOS 17.4 sugirió que Apple está trabajando en una nueva versión impulsada por IA de siri.
Las acciones de Apple han recibido una paliza últimamente, en parte porque los analistas han proclamado en voz alta que la compañía está detrás de Meta, Google y Microsoft en la implementación de IA generativa. No está claro por qué esto no fue un problema cuando no se trataba primero de un teléfono móvil, una tableta, un reloj inteligente o un visor de realidad virtual, sino de la IA generativa.
Quizás para disuadir a esos analistas, el CEO de Apple Tim Cook Recientemente dijo que Apple está dedicando «una enorme cantidad de tiempo y esfuerzo» a funciones de inteligencia artificial que se anunciarán en los próximos meses. Él también notado que Apple ha estado trabajando internamente en IA generativa.