Anthropic asegura que su nuevo modelo de IA supera los chatbots líderes de Google y OpenAI

0
681
Imagen de archiv EFE/EPA/ETIENNE LAURENT

Tegucigalpa.- Anthropic, la empresa de inteligencia artificial (IA) fundada por varios exempleados de OpenAI, dijo este lunes que las distintas versiones de su nuevo modelo, Claude 3, funcionan tan bien o mejor que los modelos GPT-4 y Gemini Ultra, los modelos de los líderes en el mercado, OpenAI y Google.

Hay tres modelos de Claude 3: Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus, siendo Opus el modelo más grande y «más inteligente».

Opus y Sonnet ya están disponibles en 159 países y Haiku saldrá pronto.

Anthropic asegura que sus modelos son capaces de responder a más preguntas, comprender instrucciones más largas y ser más precisos.

«Opus, nuestro modelo más inteligente, supera a sus pares -dijo la compañía haciendo referencia a su competencia- en la mayoría de los puntos de referencia de evaluación comunes para sistemas de IA», indicó Anthropic en un comunicado.

La empresa señala que Opus mostró un mejor razonamiento a nivel de posgrado que el chatbot GPT-4 de OpenAI, al obtener un 50.4 % en esa prueba y GPT-4 un 35.7 %.

También respondió mejor a preguntas de solución de problemas matemáticos, al conseguir el primer puesto al alcanzar un 60.1 % de respuestas correctas, seguido de Gemini Ultra 1.0, con un 53.2 %. Así como en programación, al obtener un 84,9 % en esa prueba, Gemini Ultra 1.0 un 74.4% y GPT-4 un 67 %.

«Todos los modelos Claude 3 muestran mayores capacidades de conversación en idiomas distintos del inglés, como el español, el japonés y el francés», recalca Anthropic.

La empresa también señala que sus modelos anteriores «a menudo hacían rechazos innecesarios que sugerían una falta de comprensión contextual» y que ahora han logrado «avances significativos en esta área, ya que Opus, Sonnet y Haiku tienen muchas menos probabilidades de negarse a responder».

Anthropic afirma que los modelos Claude 3 pueden dar resultados casi instantáneos incluso al analizar material denso como un trabajo de investigación y que Haiku, la versión más pequeña de Claude 3, es «el modelo más rápido y rentable del mercado» y es capaz de leer un denso trabajo de investigación completo con tablas y gráficos «en menos de tres segundos».

Anthropic entrenó sus modelos Claude 3 en una combinación de conjuntos de datos internos y de terceros no públicos y datos disponibles públicamente a partir de agosto de 2023.

Tanto Amazon como Google han invertido en Anthropic, con 4,000 millones y 2,000 millones de dólares, respectivamente. EFE