22/05/2025 19:08:49

Anthropic lanza su modelo de IA "más potente" y entra en la batalla con OpenAI

Anthropic ha presentado en sociedad la próxima generación de modelos Claude (Claude Opus 4 y Claude Sonnet 4), que establecen nuevos estándares para la codificación, el razonamiento avanzado y los agentes de inteligencia artificial (IA). La compañía, fundada por ex ejecutivos de investigación de OpenAI, y respaldada por grandes tecnológicas como Google, Salesforce y Amazon, ha descrito sus nuevos lanzamientos como los "más potentes hasta la fecha".

"Claude Opus 4 es el mejor modelo de codificación del mundo, con un rendimiento sostenido en tareas complejas y de larga duración, así como en flujos de trabajo de agentes. Claude Sonnet 4 es una actualización significativa de Claude Sonnet 3.7, que ofrece una codificación y un razonamiento superiores, a la vez que responde con mayor precisión a sus instrucciones", ha indicado.

Junto con estos modelos, la empresa también ha anunciado cuatro nuevas capacidades en la API Anthropic que permiten a los desarrolladores crear agentes de IA más potentes, como la herramienta de ejecución de código, el conector MCP, la API de archivos y la capacidad de almacenar en caché las indicaciones durante hasta una hora.

De Claude Opus 4, Anthropic dice que "es nuestro modelo más potente hasta la fecha y el mejor modelo de codificación del mundo, con una excelente puntuación en SWE-bench (72,5 %) y Terminal-bench (43,2 %)".

Así, ofrece un rendimiento sostenido en tareas de larga duración que requieren un esfuerzo concentrado y miles de pasos, con la capacidad de trabajar de forma continua durante varias horas, "superando con creces" a todos los modelos Sonnet y ampliando significativamente la capacidad de los agentes de IA.

Claude Opus 4 destaca en la codificación y la resolución de problemas complejos, impulsando productos de agentes fronterizos.

Claude Sonnet 4, por su parte, mejora significativamente las capacidades líderes de la industria de Sonnet 3.7, destacando en codificación con un 72,7% de vanguardia en SWE-bench.

"El modelo equilibra el rendimiento y la eficiencia para casos de uso internos y externos, con una mayor manejabilidad para un mayor control sobre las implementaciones. Si bien no iguala a Opus 4 en la mayoría de los dominios, ofrece una combinación óptima de capacidad y practicidad".

Además del pensamiento extendido con el uso de herramientas, la ejecución paralela de herramientas y las mejoras de memoria, la compañía ha explicado que ha reducido significativamente el comportamiento en el que los modelos utilizan atajos o lagunas para completar tareas.

"Claude Opus 4 también supera considerablemente a todos los modelos anteriores en cuanto a capacidad de memoria. Cuando los desarrolladores crean aplicaciones que permiten a Claude acceder a archivos locales, Opus 4 se vuelve experto en la creación y el mantenimiento de archivos de memoria para almacenar información clave", ha concluido Anthropic.