Anthropic pubblica il system card di Sonnet 5: capacità agentiche, prompt injection e confronto con GPT-5.5 e Gemini 3.5

Anthropic released Claude Sonnet 5, which beats its predecessor Sonnet 4.6 across all benchmarks and even edges past the larger Opus 4.8 on the GDPval-AA v2 knowledge work test…

Meno chatbot, più lavoratori digitali. La sfida si sposta dai benchmark alla produttività: AI che pianificano, usano strumenti e portano a termine il lavoro.

Anthropic pubblica il system card di Sonnet 5: capacità agentiche, prompt injection e confronto con GPT-5.5 e Gemini 3.5

Claude Sonnet 5 ranks fifth in the Artificial Analysis Intelligence Index with 53 points and even beats the pricier Opus 4.8 on some agent-based tasks. But the model chews through…

Anthropic ha annunciato Claude Sonnet 5 il 30 giugno 2026: prestazioni vicine a Opus 4.8 a prezzi più bassi, tokenizer aggiornato, sicurezza migliorata rispetto al predecessore.…