Google DeepMind ha annunciato un finanziamento da 10 milioni di dollari per la ricerca sulla sicurezza dei sistemi multi-agente, con il supporto di Schmidt Sciences, Cooperative AI Foundation, ARIA e Google.org. L'iniziativa nasce dalla preoccupazione per uno scenario ormai prossimo: milioni di agenti IA autonomi che interagiscono tra loro, scambiano istruzioni e si coordinano senza supervisione umana diretta. Rohin Shah, che guida il team AGI Safety & Alignment di Google DeepMind, sottolinea: "Il problema principale � che non esiste ancora un campo di ricerca per la sicurezza multi-agente. E vorremmo che ci fosse". Shah stima che solo alcuni mesi prima che la diffusione di agenti raggiunga una scala economica rilevante, ma il margine per costruire strumenti adeguati si assottiglia. I rischi identificati dai ricercatori coprono un terreno piuttosto ampio: frodi e truffe automatizzate, prompt injection tra agenti, cyberattacchi potenziati dalla coordinazione automatica. Il punto critico va oltre la scala e riguarda la natura degli agenti stessi. Refael Angel, cofounder e CTO di Akeyless, descrive il problema in maniera chiara: "Un agente ragiona, improvvisa, e pu� essere dirottato da una singola frase sepolta in un documento che gli � stato chiesto di leggere." C'� poi il concetto di "trifecta" o "triade letale" di cui gi� avevamo parlato in passato: l'agente combina accesso privilegiato a dati sensibili, esposizione a contenuti non attendibili (email, pagine web, messaggi in chat), e capacit� di comunicare con l'esterno inviando email o effettuando chiamate API. Il problema fondamentale � l'incapacit� strutturale dei modelli linguistici di separare comandi da dati, che rende gli attacchi di prompt injection di fatto un problema non eliminabile a monte, ma solo arginabile a posteriori (da qui il concetto del contenimento del "blast radius"). James Fox, che guida il programma Science of Trustworthy AI presso Schmidt Sciences, osserva che i rischi considerati ipotetici fino a pochi anni fa sono ora molto concreti: "Il futuro � arrivato pi� rapidamente di quanto forse ci si aspettasse." Nel maggio 2026 Anthropic aveva gi� pubblicato le linee guida Zero Trust per agenti IA, basate sull'assunzione che il sistema sia gi� compromesso e che le difese vadano progettate di conseguenza. Il finanziamento di Google DeepMind si posiziona a monte: l'obiettivo � la ricerca di base, prima ancora degli strumenti operativi. L'annuncio ufficiale identifica quattro aree prioritarie: ambienti di test isolati (sandbox e testbed), scienza delle reti di agenti, infrastruttura per sistemi agentici, supervisione e controllo. Le candidature si chiudono l'8 agosto 2026, con i vincitori attesi in autunno.
Agenti IA che si coordinano tra loro: Google DeepMind investe 10 milioni per capire i rischi prima della diffusione di massa
Google DeepMind annuncia un fondo da 10 milioni per la sicurezza dei sistemi multi-agente: un campo di ricerca che ancora non esiste. Con Schmidt Sciences, ARIA e Cooperative AI Foundation. Candidature aperte fino all'8 agosto 2026.







