News

Claude Mythos, l’AI di frontiera di Anthropic è ambivalente per la sicurezza

Il modello è accessibile, ora anche in Italia, tramite Project Glasswing. TrendAI entra a far parte dell’iniziativa.

L’intelligenza artificiale di frontiera, di cui Claude Mythos è esempio, ha bisogno di regole e limiti per arginare i rischi di cybersicurezza connessi al suo utilizzo e ai potenziali abusi. La stessa Anthropic ha ammesso che è necessario definire modalità verificabili per rallentare o mettere in pausa lo sviluppo di modelli AI di frontiera qualora queste tecnologie diventino troppo abili rispetto alla capacità di gestire i rischi associati.

Nel futuro immaginato da Anthropic, a un certo punto l’AI potrà sviluppare la capacità di "ricreare sé stessa", in autonomia, con meccanismi di auto-miglioramento ricorsivo. Questa capacità rappresenterebbe un enorme progresso tecnologico, dalle benefiche ricadute sulla società, sulla scienza, sulla medicina. Ma il rischio è che gli esseri umani perdano il controllo su questi sistemi capaci di trasformare sé stessi e il proprio comportamento.