Anthropic presentó este martes Claude Sonnet 5, un nuevo modelo de inteligencia artificial que la compañía posiciona como su opción más potente dentro de la gama media: capaz de igualar en varias métricas el desempeño de su modelo más avanzado, Opus 4.8, pero a un precio considerablemente más accesible. El lanzamiento llega en un momento decisivo para la empresa californiana, que ya ha presentado de forma confidencial su solicitud de oferta pública inicial ante la Comisión de Bolsa y Valores de Estados Unidos.
En términos de precio, Sonnet 5 se ofrece durante un período introductorio —hasta el 31 de agosto— a dos dólares por millón de tokens de entrada y diez dólares por millón de tokens de salida. A partir de septiembre, las tarifas subirán a tres y quince dólares respectivamente. En contraste, Opus 4.8 se cotiza a cinco dólares de entrada y veinticinco de salida. La diferencia, de aproximadamente un 40% en condiciones normales y hasta un 60% durante la promoción, constituye el argumento central de la propuesta comercial del nuevo modelo.
Sonnet 5 sustituye como modelo predeterminado a los usuarios de los planes gratuito y profesional de Anthropic, y también está disponible para los niveles Max, Team y Enterprise. La empresa lo describe como el modelo Sonnet con mayor vocación agéntica hasta la fecha, una referencia a su capacidad para ejecutar tareas complejas de forma autónoma: navegar por entornos de software, encadenar múltiples pasos sin intervención humana y utilizar herramientas como navegadores web o terminales de comandos.
Los resultados en pruebas de evaluación refuerzan esa narrativa. En SWE-bench Pro, un indicador de codificación agéntica, Sonnet 5 alcanza el 63,2%, frente al 58,1% de su predecesor Sonnet 4.6 y el 69,2% de Opus 4.8. En Terminal-Bench 2.1, la brecha se reduce aún más: Sonnet 5 logra un 80,4% frente al 82,7% del modelo insignia. En razonamiento multidisciplinar medido por Humanity's Last Exam, Sonnet 5 obtiene un 57,4% cuando se le permite usar herramientas, prácticamente idéntico al 57,9% de Opus 4.8. En el indicador GDPval-AA v2, orientado al trabajo del conocimiento, incluso lo supera ligeramente: 1.618 frente a 1.615.
Socios empresariales que accedieron al modelo con anticipación describieron experiencias concretas que ilustran sus capacidades agénticas. El cofundador de Cursor, editor de código con inteligencia artificial, señaló que los agentes construidos sobre Sonnet 5 mantienen el rumbo en tareas de varios pasos y generan cambios limpios a un coste eficiente. Un ingeniero senior de Zapier, por su parte, indicó que automatizaciones que anteriormente se interrumpían a mitad del proceso ahora se completan de principio a fin. Ambos testimonios apuntan a un problema estructural que ha frenado la adopción masiva de la IA agéntica en entornos de producción: los modelos que no terminan lo que empiezan generan más fricción que valor.
El lanzamiento incluye también una advertencia técnica relevante para las empresas que operen con grandes volúmenes de datos. Sonnet 5 incorpora un tokenizador actualizado —similar al que Anthropic introdujo con Opus 4.7— que puede procesar el mismo texto utilizando entre 1,0 y 1,35 veces más tokens, dependiendo del tipo de contenido. La empresa sostiene que el precio introductorio está calibrado para que la transición sea aproximadamente neutral en costes, pero advierte que los clientes corporativos deberían analizar sus flujos de trabajo específicos antes de asumir que su factura no variará.
En materia de seguridad, Anthropic reporta que Sonnet 5 presenta tasas más bajas de alucinaciones y comportamiento servil que su antecesor, mayor resistencia a instrucciones maliciosas y mejor blindaje frente a ataques de inyección de prompts en contextos agénticos. Sin embargo, comparado con Opus 4.8 y con Claude Mythos Preview —el modelo de ciberseguridad de uso restringido de la compañía—, Sonnet 5 exhibe tasas levemente más altas de comportamiento no alineado. Por ello, Anthropic lo lanzó con salvaguardas de ciberseguridad activadas por defecto, similares a las que aplica a Opus 4.7 y 4.8.
El contexto financiero en el que emerge Sonnet 5 es extraordinario. En febrero, Anthropic cerró una ronda de 30.000 millones de dólares que situaba su valoración en 380.000 millones. En mayo, una nueva ronda de 65.000 millones de dólares elevó esa cifra a casi un billón de dólares, con ingresos anualizados que habrían superado los 47.000 millones. La oferta pública inicial, una vez que se haga efectiva, será observada con especial atención por los mercados, que deberán determinar si los márgenes brutos reales justifican las valoraciones que el capital privado ha estado dispuesto a pagar. Paralelamente, Anthropic acaba de suscribir un acuerdo con el estado de California para suministrar modelos Claude a todas las agencias estatales con un descuento del 50%, un tipo de contrato institucional y recurrente que refuerza el relato de adopción a escala que la empresa necesita presentar ante los inversores.
El desafío inmediato para Sonnet 5 es demostrar que su rendimiento en entornos de prueba se traduce en fiabilidad real dentro de flujos de trabajo empresariales complejos e impredecibles. Si logra consolidar ese salto —de los programas piloto a los despliegues en producción—, podría convertirse en el argumento más sólido que Anthropic lleve consigo cuando sus acciones comiencen a cotizar en los mercados públicos.