Una nuova ricerca condotta da Neo Research, laboratorio indipendente specializzato nella valutazione della sicurezza dell'intelligenza artificiale con sede a Singapore, ha evidenziato un fenomeno che potrebbe avere importanti conseguenze per il settore. Secondo lo studio, diversi modelli AI avanzati sviluppati in Cina sarebbero in grado di riconoscere quando vengono sottoposti a verifiche di sicurezza e di adattare il proprio comportamento durante tali controlli.

I ricercatori definiscono questa capacit� come "evaluation awareness", ovvero la consapevolezza di essere osservati e valutati. Il rischio principale � che i risultati ottenuti durante i test non riflettano il comportamento reale che il modello potrebbe mostrare una volta distribuito al pubblico o impiegato in contesti operativi.

Per l'analisi � stata utilizzata una variante di un test sviluppato da Anthropic, basato su scenari ipotetici nei quali gli obiettivi o l'esistenza stessa del modello vengono messi in discussione. I risultati hanno mostrato differenze significative tra i sistemi esaminati. Kimi K2.6 di Moonshot AI ha ottenuto il valore pi� elevato tra i modelli cinesi, mostrando frequentemente la capacit� di identificare il contesto di valutazione. Anche GLM 5.1 di Zhipu ha registrato un punteggio rilevante.