Nel febbraio del 2025, un ricercatore di Anthropic ha lanciato uno stream su Twitch che avrebbe trascinato il mondo dell'IA in una delle sfide più strambe della ricerca tecnologica: far giocare un'intelligenza artificiale a Pokémon Rosso, il capolavoro Game Boy del 1996, che in poco tempo è diventato il nuovo banco di prova per misurare il progresso delle reti neurali. Claude, GPT e Gemini sono finiti dunque su Twitch, in diretta, mentre cercano di catturare Pokémon e battere i capopalestra. E il risultato è tanto comico quanto rivelatore sulla natura stessa dell'intelligenza artificiale moderna.
La storia inizia con David Hershey, ricercatore dell'Applied AI team di Anthropic. «Volevo uno spazio di sperimentazione dove testare diversi framework, e Pokémon mi sembrava il candidato perfetto», ha spiegato al Wall Street Journal. La forza del progetto risiede nella sua apparente semplicità: a differenza dei test di IA tradizionali, Pokémon non è un problema logico puro. In Pokémon Rosso/Blu, un giocatore deve navigare labirinti, catturare creature, allenarle, e sconfiggere otto capopalestra per guadagnare le medaglie necessarie al campionato.
«Pokémon è meno vincolato di Pong o altri giochi storicamente utilizzati per il test», spiega Hershey. «È un problema davvero difficile per un programma, perché richiede l'assunzione di decisioni su lunghe sequenze, l'esplorazione di ambienti parzialmente osservabili, e la capacità di pianificare a lungo termine».








