Milioni di libri comprati, tagliati e dati in pasto all'AI per addestrare Claude e aggirare il copyright: scoppia il caso Anthropic

Il caso Project Panama mostra una cosa semplice: dietro l’intelligenza artificiale ci sono anche libri fisici, tagliati e trasformati in dati

Un libro, prima di diventare un file, è ancora un oggetto. Ha una costa, pagine, colla, peso, polvere. Nel caso Anthropic, la società che sviluppa Claude, questa parte molto concreta è finita dentro una procedura industriale: libri acquistati sul mercato dell’usato, tagliati, scansionati e trasformati in testo digitale. Quel che restava dei volumi veniva poi mandato al riciclo.

Il nome interno del progetto era Project Panama. Dagli atti emersi nella causa sul copyright si capisce il senso dell’operazione: raccogliere una grande quantità di libri fisici per addestrare i modelli di intelligenza artificiale. I libri servivano perché considerati una materia linguistica migliore rispetto al rumore del web. Meno frasi raccolte a caso online, più testi scritti, editati, pubblicati.

Dai libri ai dati

La parte più forte sta nel metodo. I volumi arrivavano da rivenditori dell’usato, venivano preparati per una scansione distruttiva, tagliati lungo la costa e passati in scanner professionali ad alta velocità. Una volta digitalizzati, non tornavano più libri. Restavano dati da una parte, carta da riciclare dall’altra.

Il caso Project Panama mostra una cosa semplice: dietro l’intelligenza artificiale ci sono anche libri fisici, tagliati e trasformati in dati

Dai libri ai dati

Milioni di libri comprati, tagliati e dati in pasto all'AI per addestrare Claude e aggirare il copyright: scoppia il caso Anthropic

Milioni di libri comprati, tagliati e dati in pasto all'AI per addestrare Claude e aggirare il copyright: scoppia il caso Anthropic

Other newsrooms on this story

Related reading

Anthropic avrebbe distrutto milioni di libri per addestrare Claude: che cos'è…

Anthropic ha distrutto milioni di libri cartacei per addestrare Claude

Anthropic, il rogo digitale e la finta morale dei tecno-oligarchi

Anthropic ha accettato di pagare 1,5 miliardi di dollari: per addestrare Claude…

Libri piratati per IA: Anthropic pagherà 1,5 miliardi per chiudere class action

Usa, l'IA potrà essere allenata con libri protetti da copyright - Notizie -…

Other newsrooms on this story

Related reading

Anthropic avrebbe distrutto milioni di libri per addestrare Claude: che cos'è…

Anthropic ha distrutto milioni di libri cartacei per addestrare Claude

Anthropic, il rogo digitale e la finta morale dei tecno-oligarchi

Anthropic ha accettato di pagare 1,5 miliardi di dollari: per addestrare Claude…

Libri piratati per IA: Anthropic pagherà 1,5 miliardi per chiudere class action

Usa, l'IA potrà essere allenata con libri protetti da copyright - Notizie -…