Edgar Cervantes / Autoridad Android
TL;DR
- Google ha registrado una marca registrada para la tecnología RealFill.
- La tecnología permitirá a los usuarios ampliar imágenes basándose en hasta cinco imágenes de referencia.
- Esto debería dar como resultado una expansión de la imagen más precisa en comparación con otras soluciones.
Google ha estado promoviendo agresivamente la IA generativa durante los últimos 18 meses aproximadamente, con el Editor mágico La característica es una de las demostraciones más destacadas de la tecnología. Ahora, parece que la próxima gran función fotográfica habilitada por IA de la compañía podría ser RealFill.
Google presentó discretamente la semana pasada una marca registrada para la llamada tecnología RealFill. La marca fue presentada a través de la Oficina de Propiedad Intelectual de la Unión Europea (EUIPO) y la Oficina Comercial y de Patentes de EE. UU. (USPTO).
“Proporcionar software no descargable que utilice inteligencia artificial (IA) para pintar imágenes; Proporcionar software en línea no descargable para crear modelos generativos”, se lee en una breve descripción de la marca.
RealFill explicado
Resulta que la tecnología RealFill salió a la luz a finales del año pasado en un papel y sitio web por un equipo de investigadores de Google y la Universidad de Cornell. El documento, titulado «Generación basada en referencias para completar imágenes auténticas», describe una forma de expandir y en pintura imágenes.
Más específicamente, RealFill puede expandir y pintar con mayor precisión una imagen existente utilizando hasta cinco imágenes como referencia:
Estas imágenes de referencia no tienen que estar alineadas con la imagen de destino y se pueden tomar con puntos de vista, condiciones de iluminación, aperturas de cámara o estilos de imagen que varían drásticamente.
Primero, el equipo afina un modelo de IA generativa personalizado en las imágenes de referencia y de destino. Este proceso permite al modelo aprender la iluminación, el estilo y el contenido de la escena en las imágenes.
Sin embargo, los resultados hablan por sí solos, como se ve arriba y abajo. Las imágenes a continuación también muestran cómo se comparan las imágenes de RealFill con otras soluciones, como Stable Diffusion.
Al decir esto, el equipo notó algunas limitaciones con RealFill. Una desventaja notable es que necesita someterse a un “proceso de ajuste fino basado en gradientes” en las imágenes de entrada, lo que hace que el proceso sea lento. También puede resultar difícil recuperar la escena en la imagen final si hay una gran diferencia entre las imágenes de referencia y la imagen de destino. Además, los investigadores descubrieron que el texto podría ser un problema al utilizar esta técnica.
¿Veremos esto en el Pixel 9 o en Google Photos?
Las patentes o marcas registradas no son garantía de que RealFill sea una realidad comercial. Sin embargo, es lógico que esto pueda llegar a su fin. futuro teléfono de la serie Pixel y/o Fotos de Google si es que realmente está previsto su lanzamiento comercial.
Suponemos que esto probablemente sería una función basada en la nube en lugar de una opción de edición de fotografías en el dispositivo, especialmente porque el equipo notó que el proceso de ajuste es lento.
Sin embargo, las soluciones actuales de ampliación de fotografías y pintura están lejos de ser perfectas, por lo que una solución que utilice imágenes de referencia aún podría generar resultados mucho mejores. También significa que, en teoría, los usuarios podrían volver a fotografías antiguas en su biblioteca de Google Photos y generar mejores imágenes.
De cualquier manera, esta característica probablemente generará más preguntas sobre la definición de una foto, al igual que el Magic Editor de Google ha provocado un debate sobre el tema.