Il 30 giugno Anthropic ha presentato Claude Sonnet 5, il modello di fascia intermedia che diventa da subito il default per i piani Free e Pro di Claude ed � disponibile anche per gli abbonamenti Max, Team ed Enterprise. Il punto attorno a cui ruota l'annuncio � il rapporto fra costo e resa: secondo Anthropic le prestazioni di Sonnet 5 si avvicinano a quelle di Opus 4.8, il modello di punta, ma a prezzi sensibilmente inferiori, con un miglioramento netto rispetto al predecessore Sonnet 4.6 su ragionamento, uso degli strumenti, coding e lavoro di conoscenza. Il modello � gi� utilizzabile in Claude Code, nelle app Claude e sull'API con l'identificativo claude-sonnet-5. Sul fronte prezzi, Anthropic applica una tariffa introduttiva di 2 dollari per milione di token in input e 10 dollari per milione in output, valida fino al 31 agosto 2026; dal 1� settembre si passa ai listini standard di 3 e 15 dollari per milione. � un dettaglio meno lineare di quanto sembri, perch� Sonnet 5 adotta un tokenizer aggiornato: lo stesso testo pu� tradursi in un numero di token fino al 35% in pi� rispetto al modello precedente a seconda del tipo di contenuto, e il prezzo introduttivo � calibrato proprio per rendere la transizione all'incirca neutra sui costi. Il Sonnet pi� agentico finora Anthropic posiziona Sonnet 5 come il modello Sonnet pi� agentico mai realizzato: capace di elaborare piani, usare strumenti come browser e terminali e operare in autonomia a un livello che, fino a pochi mesi fa, richiedeva modelli pi� grandi e costosi. I tester che hanno avuto accesso anticipato lo hanno descritto come nettamente pi� autonomo dei predecessori, in grado di portare a termine compiti complessi dove le versioni precedenti si fermavano e di controllare il proprio output senza che gli venga chiesto esplicitamente. Sui benchmark BrowseComp e OSWorld-Verified, ai livelli di effort pi� alti Sonnet 5 pu� eguagliare Opus 4.8 su alcuni task, mentre a effort intermedio offre un'efficienza di costo sostanzialmente superiore. Gli sviluppatori possono regolare questo livello di effort per bilanciare costo e prestazioni tra Sonnet 5 e Opus 4.8. Per accompagnare il maggior consumo di token ai livelli pi� alti, Anthropic ha aumentato i rate limit su Chat, Cowork, Claude Code e Claude Platform. Sicurezza e limiti su cybersecurity Rispetto a Sonnet 4.6, il nuovo modello mostra tassi pi� bassi di comportamenti indesiderati: meno allucinazioni, meno sycophancy e una migliore resistenza agli attacchi di prompt injection. Su un fronte specifico, per�, Anthropic segnala un arretramento voluto: Sonnet 5 non � stato addestrato per compiti di cybersecurity e ottiene risultati marcatamente peggiori di Opus 4.8 nello sviluppo di exploit. In un test condotto in collaborazione con Mozilla su vulnerabilit� di Firefox 147, gi� corrette in Firefox 148, il modello non ha mai prodotto un exploit funzionante. Il modello � comunque stato rilasciato con i cyber safeguards attivi di default, come si legge nell'annuncio ufficiale di Anthropic, che nella stessa giornata ha anche corretto un grafico su BrowseComp basato su una metodologia semplificata che sottostimava le prestazioni del modello. Il Cyber Verification Program per Sonnet 5 � disponibile su Claude Platform, AWS e Microsoft Foundry, con l'arrivo su Google Vertex annunciato come imminente. Per chi valuta il passaggio, il calcolo pratico resta legato alla finestra introduttiva: fino al 31 agosto il divario di prezzo con i listini standard di settembre � la leva pi� concreta per testare il modello sui propri carichi di lavoro.