La corsa ad avere la gen Ai più performante non si ferma. Anthropic rilancia la sfida nel mondo dell’intelligenza artificiale con Claude Opus 4 e Claude Sonnet 4, l’evoluzione dei suoi collaudati modelli pensati per affrontare i compiti più complessi — dallo sviluppo software alla generazione di contenuti, fino al ragionamento multi-step — segnano un salto in avanti concreto verso l’obiettivo dichiarato: trasformare l’AI in un vero collaboratore virtuale.

Con Claude 4, Anthropic punta in alto: “vogliamo stabilire un nuovo standard di collaborazione uomo-macchina”. E non è solo un claim. I nuovi modelli sono in grado di sostenere attività prolungate, integrare strumenti esterni, mantenere coerenza informativa e risolvere problemi su larga scala. In sintesi: più affidabili, più intelligenti, più utili.

Claude Opus 4: l’AI che programma (meglio di molti umani)

Opus 4 è il modello di punta e, a detta di Anthropic, il miglior modello di coding al mondo. I benchmark parlano chiaro con il 72,5% su SWE-bench Verified e il 43,2% su Terminal-bench, risultati che lo posizionano in vetta alle classifiche internazionali per compiti di programmazione reali. In fase di test, è riuscito a lavorare in autonomia su un progetto complesso per quasi sette ore consecutive. Un’impresa che ha impressionato aziende come Rakuten, Replit e Cursor, che lo descrivono come uno strumento in grado di scrivere codice su più file, correggere bug, seguire istruzioni complesse e mantenere la coerenza su progetti articolati.