OpenAI es mejor conocido por sus modelos avanzados de lenguajes grandes (LLM) que se utilizan para impulsar algunos de los más populares. Chatbots de IAcomo ChatGPT y Copiloto. Los modelos multimodales pueden llevar las capacidades de los chatbots a nuevas alturas al liberar una nueva gama de aplicaciones visuales, y OpenAI acaba de poner una a disposición de los desarrolladores.
El martes, a través de un Publicación X (anteriormente Twitter)OpenAI anunció que GPT-4 Turbo con Vision, el último modelo GPT-4 Turbo con capacidades de visión, ahora está disponible de forma general para los desarrolladores a través de la API de OpenAI.
También: Cómo utilizar ChatGPT
Este último modelo mantiene la ventana de 128.000 tokens del GPT-4 Turbo y el límite de conocimiento a partir de diciembre de 2023. La principal diferencia son sus capacidades de visión, que le permiten comprender imágenes y contenido visual.
Antes de que GPT-4 Turbo con Vision estuviera disponible, los desarrolladores tenían que recurrir a modelos separados para texto e imágenes. Ahora, los desarrolladores pueden recurrir a un modelo que puede hacer ambas cosas, simplificando el proceso y abriendo las puertas a una amplia gama de casos de uso.
También: Los mejores generadores de imágenes con IA de 2024: probados y revisados
OpenAI compartió algunas formas en que los desarrolladores ya están usando el modelo y son bastante fascinantes.
Por ejemplo, Devin, un asistente de ingeniería de software de IA, aprovecha GPT-4 Turbo con Vision para ayudar mejor con la codificación. La aplicación de salud y fitness, Healthify, utiliza GPT-4 Turbo con Vision para escanear fotografías de las comidas de los usuarios y brindar información nutricional mediante el reconocimiento de fotografías. Por último, Make Real utiliza GPT-4 Turbo con Vision para convertir el dibujo de un usuario en un sitio web funcional.
Si bien el modelo GPT-4 Turbo con Vision aún no está disponible dentro de ChatGPT ni para el público en general, OpenAI adelantó que pronto estará disponible en ChatGPT. Si es un desarrollador que busca comenzar con GPT-4 Turbo con Vision API de OpenAI, puede aprender cómo comenzar aquí.