Il caso Project Panama mostra una cosa semplice: dietro l’intelligenza artificiale ci sono anche libri fisici, tagliati e trasformati in dati
Un libro, prima di diventare un file, è ancora un oggetto. Ha una costa, pagine, colla, peso, polvere. Nel caso Anthropic, la società che sviluppa Claude, questa parte molto concreta è finita dentro una procedura industriale: libri acquistati sul mercato dell’usato, tagliati, scansionati e trasformati in testo digitale. Quel che restava dei volumi veniva poi mandato al riciclo.
Il nome interno del progetto era Project Panama. Dagli atti emersi nella causa sul copyright si capisce il senso dell’operazione: raccogliere una grande quantità di libri fisici per addestrare i modelli di intelligenza artificiale. I libri servivano perché considerati una materia linguistica migliore rispetto al rumore del web. Meno frasi raccolte a caso online, più testi scritti, editati, pubblicati.
Dai libri ai dati
La parte più forte sta nel metodo. I volumi arrivavano da rivenditori dell’usato, venivano preparati per una scansione distruttiva, tagliati lungo la costa e passati in scanner professionali ad alta velocità. Una volta digitalizzati, non tornavano più libri. Restavano dati da una parte, carta da riciclare dall’altra.







