Mistral lanza el modelo de IA de combinación de expertos 8X22B en código abierto, los puntos de referencia revelan grandes actualizaciones

Mistral lanzó su último inteligencia artificial (AI), 8X22B, el miércoles. El modelo de IA con combinación de expertos sigue al modelo 8X7B lanzado en diciembre de 2023 y ofrece un tamaño de parámetro mayor. La compañía conocida por sus modelos de IA de código abierto lanzó el último modelo de manera poco convencional, sin anuncios ni publicaciones de blog que lo acompañen. Si bien no hay puntos de referencia proporcionados por la propia empresa de IA, los usuarios de la comunidad Hugging Face lo probaron y publicaron puntuaciones de referencia del modelo 8X22B. Los resultados parecen cerrar la brecha con los modelos cerrados de AbiertoAI y Google.

La cuenta oficial X (anteriormente conocida como Twitter) de Mistral liberado el modelo de IA 8X22B a través de un enlace magnético de torrent, continuando con su método poco convencional de lanzar modelos de IA sin previo aviso y directamente para que las personas los descarguen. Mistral es también una de las únicas plataformas verdaderamente de código abierto que no solo abre los pesos sino también toda la arquitectura. Sin embargo, cabe señalar que la mayoría de los dispositivos no están equipados para ejecutar potentes modelos de IA en el dispositivo, lo que podría provocar un mal funcionamiento del dispositivo. El tamaño total del archivo es de 262 GB.

El 8X22B de Mistral es un modelo de IA autocompletado. Suelen ser diferentes de las variantes de instrucción o chat de los modelos de IA. OpenAI ChatGPT y de google IA Géminis son modelos de chat, mientras que Meta’s Code Llama 7B y 13B son modelos de instrucción. Los modelos de chat son aquellos que pueden comprender el lenguaje natural y las consultas contextuales para brindar la respuesta correcta. Los modelos de instrucción son utilizados principalmente por desarrolladores que solicitan al modelo de IA que realice una tarea específica. Por el contrario, un modelo de autocompletar completa la oración proporcionada en el mensaje.

Puntajes de referencia iniciales basados en una cara que abraza publicación comunitaria muestran que el último modelo Mistral ofrece mejoras significativas con respecto a sus predecesores y cierra la brecha con otros modelos importantes. En el punto de referencia Hellaswag, Mistral 8X22B obtuvo una puntuación de 88,9, muy cerca de GPT-4 con 95,3, Claude 3 Opus con 95,4 y Gemini 1.5 Pro con 92,5. Sin embargo, supera a GPT-3.5 con 85,5 y Gemini 1.0 Ultra con 87,8.

Comparando los puntos de referencia con los propios modelos de Mistral, el 8X22B se sitúa entre los modelos Mistral mediano y Mistral grande. Con un lanzamiento posterior de una variante de instrucción o chat, incluso podría funcionar de manera similar a Mistral-grande.

Los enlaces de afiliados pueden generarse automáticamente; consulte nuestra Declaración de Ética para detalles.

Comentarios

Para lo último noticias tecnicas y opinionessigue Gadgets 360 en X, Facebook, WhatsApp, Hilos y noticias de Google. Para ver los últimos vídeos sobre gadgets y tecnología, suscríbete a nuestro Canal de Youtube. Si quieres saber todo sobre los principales influencers, sigue nuestro interno. ¿Quién es ese 360? en Instagram y YouTube.

Apple advierte a los usuarios de iPhone sobre un ataque de ‘software espía mercenario’ en 92 países

Motorola Edge 50 Ultra aparece en Geekbench, puede funcionar con el SoC Snapdragon 8s Gen 3