Elon Musk responder a ChatGPT está recibiendo una actualización para mejorarlo en matemáticas, codificación y más. Se lanzó xAI de Musk Grok-1.5 a los primeros evaluadores con «capacidades y razonamiento mejorados» y la capacidad de procesar contextos más largos. La compañía afirma que ahora se compara con GPT-4, Gemini Pro 1.5 y Cerrar 3 Trabajo en varias áreas.
Según los números de xAI, Grok-1.5 parece ser una gran mejora con respecto a Grok-1. Se disparó hasta el 50,6 por ciento en el punto de referencia MATH, más del doble del puntaje anterior. También subió al 90 por ciento y al 74,1 por ciento en GSM8K (problemas matemáticos escritos) y HumanEval (codificación), respectivamente, en comparación con el 62,9 por ciento y el 63,2 por ciento anteriores. Esos números están a poca distancia de Gemini Pro 1.5, GPT-4 y Claude 3 Opus; de hecho, la puntuación de codificación HumanEval supera a todos los rivales excepto a Claude 3 Opus.
También puede procesar contextos largos de hasta 128.000 tokens dentro de su ventana de contexto, lo que significa que puede fusionar datos de más fuentes para comprender una situación. «Esto permite a Grok tener una capacidad de memoria aumentada de hasta 16 veces la longitud del contexto anterior, lo que le permite utilizar información de documentos sustancialmente más largos», dijo la compañía.
Sin embargo, xAI no detalló el progreso de Grok en otras áreas, donde todavía puede estar rezagado (puntuaciones académicas, multimodal y otras). Y es posible que Grok-1.5 no mantenga su posición por mucho tiempo. ChatGPT 5 llegará en algún momento de este verano. prometedor un conjunto de características que «hace que parezca que te estás comunicando con una persona en lugar de con una máquina», según OpenAI.
Actualmente, Grok solo está disponible para usuarios del nivel Premium+ en X (anteriormente Twitter), aunque Elon Musk recientemente prometido para abrirlo a los usuarios Premium habituales de X. La empresa también recientemente de código abierto su chatbot Grok, después de Musk demandó a OpenAI y Sam Altman por supuestamente abandonar su misión sin fines de lucro.