Anthropic mejora su juego de chatbot de IA con Claude 3, rival de ChatGPT y Gemini

La startup de IA Anthropic dijo el lunes que la última versión de su familia Claude de modelos de IA, Claude 3, exhibe una «comprensión similar a la humana», una afirmación audaz, aunque no del todo sin precedentes, de un fabricante de chatbots de IA generativa.

En comparación con versiones anteriores, la familia Claude 3 puede manejar consultas más complicadas con mayor precisión y comprensión contextual mejorada, dijo Anthropic. La última familia de modelos también es mejor en análisis y pronósticos; creación de contenidos; codigo de GENERACION; y conversar en idiomas como español, japonés y francés, dijo la compañía. Sin embargo, vale la pena señalar que si bien los chatbots puede comprender y predecir el contenidono entienden realmente el significado de las palabras como nosotros.

Leer más: Los chatbots de IA llegaron para quedarse. Descubra cómo pueden funcionar para usted

En orden ascendente de potencia, los tres modelos de la familia Claude 3 son: Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus.

El ritmo de actualizaciones y lanzamientos entre las empresas de IA generativa se ha acelerado desde el lanzamiento del modelo de conversión de texto a imagen Dall-E en 2021. En febrero, Google lanzó la última versión de su modeloGéminis 1.0 Ultra y se burló de Géminis 1.5 Pro. Creador de ChatGPT OpenAI debutó su modelo GPT-4 Turbo en noviembre. microsoft anunció su «compañero de IA», Copilot, en septiembre. Todas estas empresas buscan hacerse un hueco en un mercado generativo de IA Se prevé que alcance los 1,3 billones de dólares en 2032..

De todos modos, según Anthropic, Opus supera a sus rivales en puntos de referencia de IA, como conocimiento experto a nivel de pregrado, razonamiento experto a nivel de posgrado y matemáticas básicas. Para ser justos, Google ha dicho que su modelo Gemini 1.5 tiene «la ventana de contexto más larga de cualquier modelo básico a gran escala hasta el momento», refiriéndose a la medida de la «ventana de contexto» de cuánto puede recordar un modelo a la vez. OpenAI, por su parte, calificó su modelo GPT-4 Turbo como «más capaz [and] más barato» que los modelos anteriores, ya que también admite capacidades multimodales como visión, creación de imágenes y conversión de texto a voz.

Anthropic dijo que su familia Claude 3 establece «un nuevo estándar de inteligencia», con modelos más precisos que los modelos anteriores y más capaces de seguir instrucciones de varios pasos.

Por ejemplo, en comparación con Claude 2.1, que salió en noviembre, Opus ha mostrado una mejora doble en la precisión en preguntas abiertas, dijo Anthropic. Además, la empresa pronto habilitará las citas, lo que facilitará a los usuarios de Claude 3 verificar las respuestas dentro del material de referencia.

Los modelos Claude 3 también son «significativamente menos propensos» a negarse a responder indicaciones inofensivas que sus predecesores, ya que tienen «una comprensión más matizada de las solicitudes» y «reconocen el daño real», dijo Anthropic. Eso significa que los usuarios que realizan consultas que no violan ninguna directriz tienen más probabilidades de obtener respuestas de los modelos Claude 3.

A partir del lunes, Sonnet está disponible a través de claude.ai y Opus está disponible para los suscriptores de Claude Pro.

Anthropic no compartió una fecha de lanzamiento para Haiku, y solo dijo que estará «disponible pronto».

Los modelos Claude 3 tienen una ventana de contexto de 200.000 tokens. Una ficha equivale a cuatro caracteres, o aproximadamente tres cuartos de una palabra en inglés.

Piénselo de esta manera: Guerra y paz de León Tolstoi tiene 587.287 palabras. Eso es alrededor de 440.465 tokens. Eso significa que Claude 3 puede recordar aproximadamente la mitad del libro por sesión.

Sin embargo, Anthropic dijo que el modelo es capaz de aceptar entradas de más de 1 millón de tokens y que la compañía «puede ponerlo a disposición de clientes selectos que necesiten una potencia de procesamiento mejorada».

A modo de comparación, los últimos modelos Gemini de Google pueden procesar hasta 1 millón de tokens, mientras que los modelos GPT-4 tienen ventanas de contexto de aproximadamente 8.000 a 128.000 tokens.

Haiku versus Soneto versus Opus

Si bien Anthropic recomienda Haiku para interacciones con clientes, moderación de contenido y tareas como gestión de inventario, Sonnet, dice, «sobresale en tareas que exigen respuestas rápidas, como recuperación de conocimientos o automatización de ventas».

Opus, por otro lado, puede planificar y ejecutar acciones complejas a través de API y bases de datos y realizar tareas de investigación y desarrollo como lluvia de ideas y generación de hipótesis e incluso descubrimiento de fármacos, así como análisis avanzado de tablas y gráficos, finanzas y tendencias del mercado, según la empresa.

Los modelos Claude 3 pueden procesar formatos visuales como fotografías, cuadros y gráficos «a la par con otros modelos líderes», dijo Anthropic.

Claude 3 también muestra menos sesgos que sus predecesores, según Bias Benchmark for Question Answering, una colección de conjuntos de preguntas de académicos de la Universidad de Nueva York que evalúa modelos para detectar sesgos sociales contra personas de clases protegidas.

Anthropic también señaló que cuenta con múltiples equipos enfocados en riesgos que incluyen información errónea, material de abuso sexual infantil, interferencia electoral y «habilidades de replicación autónoma». Esto significa que con Claude 3, es menos probable que veamos el tipo de respuestas inquietantes que los chatbots se sabe que proporcionan de vez en cuando.

Las evaluaciones del equipo rojo, o aquellos que buscan vulnerabilidades en la IA, mostraron que los modelos «presentan un potencial insignificante de riesgo catastrófico en este momento», decía una publicación de blog de Anthropic.

«A medida que ampliamos los límites de las capacidades de la IA, estamos igualmente comprometidos a garantizar que nuestras barreras de seguridad sigan el ritmo de estos avances en el rendimiento», agrega la publicación. «Nuestra hipótesis es que estar en la frontera del desarrollo de la IA es la forma más eficaz de dirigir su trayectoria hacia resultados sociales positivos».

Anthropic dijo que planea «lanzar actualizaciones frecuentes» para los modelos Claude 3 «durante los próximos meses».

Nota del editor: CNET utiliza un motor de inteligencia artificial para ayudar a crear algunas historias. Para más, ver esta publicación.

Enlace fuente