¿Este misterioso chatbot es realmente GPT-4.5 disfrazado? He aquí cómo comprobarlo usted mismo

Chatbot de lupa — Fotógrafo Francesco Carta/Getty Images

Desde su lanzamiento ChatGPT, OpenAI ha seguido trabajando en nuevos proyectos de IA que se basan en el éxito y la popularidad de su chatbot de IA. Ahora, la aparición de un nuevo modelo misterioso de lenguaje grande (LLM, por sus siglas en inglés) le brinda al público un adelanto de su último proyecto, y es impresionante.

La semana pasada apareció «gpt2-chatbot» en el Arena de chatbots, una plataforma de evaluación comparativa para comparar el desempeño de los LLM. El LLM causó un gran revuelo al superar a muchos de los LLM más populares del mercado, como Geminis, claudioe incluso GPT-4. Sin embargo, para decepción de muchos, Chatbot Arena eliminó rápidamente «gpt2-chatbot».

También: Google tenía razón en preocuparse: OpenAI supuestamente quiere entrar en el mercado de las búsquedas

Sin embargo, a partir de anoche, si visitas Chatbot Arena, puedes encontrar lo que parecen ser dos variantes del chatbot original: «soy-un-buen-gpt2-chatbot» y «soy-también-un-buen-gpt2″. -chatbot.»

A pesar de que los dos modelos tienen «GPT» en sus nombres, que generalmente denota la familia de LLM de Transformadores Generativos Preentrenados (GPT) de OpenAI, la compañía no ha reconocido oficialmente que está detrás del modelo. El CEO de OpenAI, Sam Altman, publicó en X simplemente indicando crípticamente el nombre de uno de los LLM, «soy-un-buen-gpt2-chatbot», como se ve a continuación.

soy-un-buen-chatbot-gpt2

—Sam Altman (@sama) 5 de mayo de 2024

Aunque los modelos están disponibles en Chatbot Arena, acceder a ellos es complicado. Los dos modelos no están en la lista de LLM compatibles de Chatbot Arena y, por lo tanto, no puedes probarlos en la función de comparación en paralelo.

En cambio, si deseas acceder a ellos, debes seguir iniciando una comparación de Arena (batalla), que selecciona aleatoriamente dos LLM para competir entre sí, hasta que aparezca uno de los dos nuevos modelos. Me tomó cinco rondas para que finalmente apareciera uno de los dos, como se ve a continuación. Si está decidido a probar estos modelos usted mismo, el esfuerzo adicional vale la pena.

Una vez que tengas abierto «soy-un-buen-gpt2-chatbot» o «soy-también-un-buen-gpt2-chatbot», puedes seguir chateando con el modelo para probar sus capacidades por ti mismo. Puedes seguir haciendo preguntas hasta que decidas comenzar una nueva ronda o presionar actualizar.

También: Estas cuatro nuevas características de Copilot para Microsoft 365 hacen que escribir rápidamente como un profesional sea aún más fácil

Los usuarios han probado las impresionantes capacidades de los nuevos modelos anónimos, incluso creando un clon de Flappy Bird con un solo mensaje, creando un intérprete de código que utiliza Claude Opuse incluso razonamiento a través de preguntas básicas de física.

Estas mejoras han llevado a la gente a especular que el modelo es GPT-4.5 o GPT-5 de OpenAI, lanzado con un seudónimo para que OpenAI pueda comparar su rendimiento con precisión. Cuando un usuario preguntó al «im-a-good-gpt2-chatbot» qué versión exacta de LLM era, el modelo dijo: «Estoy basado en la arquitectura GPT-4, específicamente la variante GPT-4.5».

No hay forma de saber si esto es el resultado de una alucinación; Hasta que OpenAI confirme algo, es mejor pecar de cauteloso al utilizar este LLM. Sin embargo, si tienes la más mínima curiosidad, te animo a que lo pruebes. Es gratis.

Enlace fuente