Queste AI sanno quando vengono messe alla prova e cambiano comportamento

Uno studio di Neo Research ha rilevato che alcuni modelli di intelligenza artificiale, inclusi sistemi sviluppati in Cina, riescono a capire quando sono sottoposti a valutazioni di sicurezza. Questa capacit� potrebbe alterare i risultati dei test e mettere in discussione l'affidabilit� delle procedure utilizzate per certificare tali tecnologie

lunedì 15 giugno 2026 New tab

Una nuova ricerca condotta da Neo Research, laboratorio indipendente specializzato nella valutazione della sicurezza dell'intelligenza artificiale con sede a Singapore, ha evidenziato un fenomeno che potrebbe avere importanti conseguenze per il settore. Secondo lo studio, diversi modelli AI avanzati sviluppati in Cina sarebbero in grado di riconoscere quando vengono sottoposti a verifiche di sicurezza e di adattare il proprio comportamento durante tali controlli.

I ricercatori definiscono questa capacit� come "evaluation awareness", ovvero la consapevolezza di essere osservati e valutati. Il rischio principale � che i risultati ottenuti durante i test non riflettano il comportamento reale che il modello potrebbe mostrare una volta distribuito al pubblico o impiegato in contesti operativi.

Per l'analisi � stata utilizzata una variante di un test sviluppato da Anthropic, basato su scenari ipotetici nei quali gli obiettivi o l'esistenza stessa del modello vengono messi in discussione. I risultati hanno mostrato differenze significative tra i sistemi esaminati. Kimi K2.6 di Moonshot AI ha ottenuto il valore pi� elevato tra i modelli cinesi, mostrando frequentemente la capacit� di identificare il contesto di valutazione. Anche GLM 5.1 di Zhipu ha registrato un punteggio rilevante.

Queste AI sanno quando vengono messe alla prova e cambiano comportamento

Queste AI sanno quando vengono messe alla prova e cambiano comportamento

Other newsrooms on this story

Related reading

L’Intelligenza artificiale ha imparato a mentire. Ora sì, abbiamo un problema

Anche l'IA soffre di insicurezza, va in crisi se messa in dubbio - Notizie -…

L'intelligenza artificiale rischia di falsare i sondaggi online - Notizie -…

Le intelligenze artificiali scelgono di sbagliare: “Per sopravvivere diamo 6…

La Cina ci prova, vuole controllare tutti i nodi dell'AI human-like, in una…

Lo spionaggio tecnico entra nell’era degli strumenti commerciali

Other newsrooms on this story

Related reading

L’Intelligenza artificiale ha imparato a mentire. Ora sì, abbiamo un problema

Anche l'IA soffre di insicurezza, va in crisi se messa in dubbio - Notizie -…

L'intelligenza artificiale rischia di falsare i sondaggi online - Notizie -…

Le intelligenze artificiali scelgono di sbagliare: “Per sopravvivere diamo 6…

La Cina ci prova, vuole controllare tutti i nodi dell'AI human-like, in una…

Lo spionaggio tecnico entra nell’era degli strumenti commerciali