Anthropic ha accusato gruppi collegati ad Alibaba e al laboratorio Qwen di aver condotto una campagna sistematica per estrarre informazioni comportamentali dal modello Claude attraverso un volume massiccio di interrogazioni.
Secondo quanto riportato da Reuters, la società avrebbe individuato circa 25.000 account fraudolenti responsabili di oltre 28,8 milioni di interazioni con il sistema. L’obiettivo sarebbe stato ricostruire indirettamente le capacità del modello senza accesso al codice sorgente o ai dati di addestramento, sfruttando invece le risposte prodotte dall’AI durante l’uso ordinario.
Cos’è la model distillation e perché è un problema
La tecnica al centro dell’accusa è nota come model distillation: un modello avanzato viene usato come insegnante involontario e le sue risposte vengono raccolte su larga scala per addestrare un sistema concorrente. Il risultato non replica l’intero processo di training originale, ma può avvicinarne le capacità operative in domini specifici come programmazione, ragionamento agentico e generazione di codice.
Il punto tecnico è nella natura stessa dei large language model: ogni risposta riflette distribuzioni probabilistiche apprese durante l’addestramento. Interrogazioni ripetute e ben strutturate possono quindi trasformarsi in una forma di estrazione distribuita di conoscenza, anche senza accesso ai dati originali. Questo rende il confine tra utilizzo legittimo e appropriazione tecnologica particolarmente difficile da definire sul piano legale e tecnico.










