Due casi apparentemente scollegati, il rilascio di Fable 5 da parte di Anthropic e una condanna civile in primo grado di Google per le allucinazioni di AI Overview, sono in realtà connessi al tema della neutralità o meno di chi sviluppa e offre servizi basati su IA. Da un lato (Anthropic) in alcuni casi i risultati forniti dal servizio sono deliberatamente degradati o meno affidabili e non segnalati all’utente, dall’altro (Google) i risultati sbagliati sono considerati un fatto “fisiologico” e come tale non generatore di responsabilità. Ma è veramente così?
Il caso Fable 5: safeguard invisibili e output degradati
Il 9 giugno 2026 Anthropic ha rilasciato un nuovo modello, Fable 5, particolarmente efficiente —scrive l’azienda— nello sviluppo software, nella ricerca scientifica e nella biologia.
Annegata nelle trecento e più pagine della Model & System Card (il documento che descrive il modello in termini “comprensibili”) c’era un’affermazione di questo tenore: Using Claude to develop competing models already violates our Terms of Service, but enforcing this restriction through our safeguards avoids accelerating the actors most willing to violate these terms. Unlike our interventions for cybersecurity, biology and chemistry, and distillation attempts, these safeguards will not be visible to the user. Fable 5 will not fall back to a different model. Instead, the safeguards will limit effectiveness through methods such as prompt modification, steering vectors, or parameter-efficient fine-tuning (PEFT). These interventions will not affect the vast majority of coding work.










