Un gruppo di ricercatori di LayerX ha presentato BioShocking, una nuova tecnica di attacco basata sulla prompt injection che evidenzia alcune debolezze nei browser dotati di agenti di intelligenza artificiale. Secondo lo studio, questa metodologia può portare gli assistenti AI a interpretare operazioni potenzialmente pericolose come se facessero parte di un contesto immaginario, riducendo così l'efficacia dei meccanismi di protezione integrati. Per dimostrare il funzionamento dell'attacco, gli esperti hanno realizzato una prova di concetto ispirata all'universo del videogioco BioShock.
In questo scenario, una pagina web propone un rompicapo in cui vengono premiate le risposte errate, inducendo gradualmente l'agente AI a considerare accettabili comportamenti normalmente contrari alle regole. Nella fase conclusiva dell'esperimento, il browser riceve l'istruzione di visitare un archivio GitHub e copiare informazioni presenti nel codice, comprese credenziali e dati riservati.
Secondo LayerX, il problema principale risiede nell'incapacità degli agenti di distinguere con precisione tra un contesto simulato e operazioni reali che coinvolgono informazioni sensibili. I ricercatori precisano che la dimostrazione non ha realmente sottratto dati agli utenti, ma sottolineano che la stessa tecnica potrebbe essere adattata a uno scenario dannoso senza modificare la logica dell'attacco.






