Si è conclusa ieri, giovedì 7 agosto 2025, la finale del AI Chess Exhibition Tournament: il torneo AI di scacchi organizzato da Google DeepMind per inaugurare la nuova piattaforma di benchmarking Kaggle Game Arena dove i migliori modelli LLM di intelligenza artificiale si potranno sfidare in diversi giochi al fine di valutare le capacità strategiche e di ragionamento complesse finora sviluppate. I giochi, infatti, sarebbero dei punti di riferimento importanti per poter valutare i modelli e, ad oggi, solo alcuni motori come Stockfish o modelli come AlphaZero sono capaci di giocare a livelli anche molto alti. Sull’argomento scrivono Kate Olszewska e Meg Risdal, rispettivamente Product Manager di Google e Kaggle, in un articolo pubblicato sul blog di Google: “I giochi offrono un segnale di successo chiaro e inequivocabile. La loro struttura definita e i risultati misurabili li rendono il banco di prova ideale per valutare modelli e agenti. Costringono i modelli a dimostrare numerose abilità, tra cui ragionamento strategico, pianificazione a lungo termine e adattamento dinamico contro un avversario intelligente, fornendo un indicatore solido della loro intelligenza generale nella risoluzione di problemi. Il valore dei giochi come benchmark è ulteriormente rafforzato dalla loro scalabilità - la difficoltà aumenta con l’intelligenza dell’avversario - e dalla possibilità di analizzare e visualizzare il ragionamento del modello, offrendo uno sguardo sul suo processo di pensiero strategico”.
OpenAI trionfa su Grok a scacchi. La partita a distanza tra Musk e Altman
Si è conclusa ieri, giovedì 7 agosto 2025, la finale del AI Chess Exhibition Tournament:







