La mayoría de los intentos de construir un robot humanoide, como Lo mejor de Tesla, se centran en ayudar a los humanos con tareas físicas y manuales. Figura se encuentra entre las nuevas empresas de robótica de IA que no se conforman solo con el movimiento. Figure está intentando llevar sus robots humanoides al siguiente nivel mediante la integración del lenguaje, y los resultados son bastante impresionantes.
El miércoles, Figure publicó un video de dos minutos sobre X para demostrar lo que supuestamente puede hacer su robot humanoide Figure 1 gracias a una combinación de las redes neuronales de la startup y la inteligencia visual y lingüística de OpenAI. Mira el vídeo a continuación.
También: Cómo pueden evolucionar los dispositivos de trabajo para mantenerse al día en la era de la IA
El video comienza con una persona que le pregunta a la Figura 1 qué ve el robot, a lo que la Figura 1 explica en forma conversacional exactamente lo que hay en la mesa frente a él, mostrando el procesamiento avanzado del lenguaje natural, el lenguaje y las capacidades visuales del robot.
Luego, quizás aún más impresionante, cuando la persona le pide algo de comer a la Figura 1, el robot responde eligiendo la manzana entre los elementos que tiene frente a él, destacando la capacidad del robot para razonar a través de una situación y entregarla en base a ese procesamiento.
Cuando se le preguntó, la Figura 1 incluso pudo explicar su elección, como muestra el video, mientras realizaba otra tarea diciendo: «Así que te di la manzana porque es el único artículo comestible que puedo darte de la mesa».
La figura anunció su Asociación abierta AI a finales de febrero con la esperanza de aprovechar la investigación de OpenAI para mejorar las capacidades de sus robots humanoides para procesar y razonar a partir del lenguaje. La startup de robótica espera que la colaboración acelere la rapidez con la que sus robots pueden llegar al mercado.
Si bien es fácil seleccionar una demostración como esta para que sea lo más impresionante posible, sin mencionar editar el metraje resultante, Figure parece estar avanzando hacia su objetivo. Si este vídeo es una representación precisa de lo que puede hacer la Figura 1, la Figura podría estar al borde de un gran avance en el espacio de la robótica: un robot disponible comercialmente que no sólo puede realizar tareas físicas, sino también razonar y hablar.