di

Sergio Donato

Il modello degradava in silenzio alcune risposte sullo sviluppo di IA concorrenti. Dopo le critiche, Anthropic renderà visibili i filtri e il passaggio a Opus 4.8

In Fable 5 c’era una politica di sabotaggio in alcune risposte da parte del modello. Non era nascosta, era anche indicata nella system card, ma Anthropic si è ravveduta soprattutto a causa delle segnalazioni ricevute dalla comunità, e ha modificato quella politica; che a nostro avviso era è resta gravissima.

Fin dal lancio, Fable 5 ha fornito risposte volutamente degradate, senza alcuna segnalazione, a chi lo usava per attività legate allo sviluppo di modelli di intelligenza artificiale concorrenti. Dopo le proteste, l'azienda ha annunciato che i filtri diventeranno visibili e che le richieste intercettate saranno reindirizzate al meno capace Opus 4.8.