Internet Archive e la sua Wayback Machine vedono restringersi sempre pi� l'accesso ai contenuti delle testate giornalistiche: secondo l'aggiornamento di un'inchiesta del Nieman Lab, sono ormai oltre 340 le testate locali statunitensi che limitano la capacit� dell'archivio non profit di conservare i loro articoli. Non � una novit� improvvisa: a gennaio lo stesso Nieman Lab aveva documentato come grandi gruppi editoriali, tra cui New York Times, The Guardian e USA Today Co., avessero iniziato a sbarrare la strada ai crawler dell'archivio. Ne avevamo gi� parlato, e nei cinque mesi successivi il fenomeno si � allargato. Il campione aggiornato conta 382 testate che bloccano almeno un bot riconducibile a Internet Archive, di cui 342 locali; il 93% ha sede negli Stati Uniti, le altre distribuite in dieci paesi. A gennaio i siti erano 241, circa l'80% riconducibili a USA Today Co. (l'ex Gannett); da allora se ne sono aggiunti altri 141. Molte testate appartengono a cinque dei sette maggiori editori locali del paese: oltre a USA Today Co. figurano McClatchy, Advance Local, MediaNews Group e Tribune Publishing. Questi ultimi due sono entrambi controllati da Alden Global Capital, il fondo speculativo noto per acquisire giornali e ridurne le risorse. Le ragioni del blocco La motivazione ricorrente � il timore che le aziende di intelligenza artificiale usino la Wayback Machine come scorciatoia per raccogliere contenuti con cui addestrare i propri modelli. Vale la pena osservare che si tratta di una preoccupazione finora ipotetica: nessun editore ha confermato a Nieman Lab che una societ� di IA abbia effettivamente prelevato i propri articoli dall'archivio. Le posizioni non sono per� omogenee. The Atlantic ha adottato quella che la sua portavoce Anna Bross definisce una politica di blocco "aggressiva", con esclusione come impostazione predefinita, e collabora con Cloudflare dalla scorsa estate; il CEO Nick Thompson ha spiegato che impedire lo scraping serve a mantenere leva negoziale negli accordi di licenza con le grandi aziende di IA. Diverso il caso del Baltimore Banner, che resta aperto alla comparsa dei propri articoli nei chatbot e lascia passare i crawler di ChatGPT e Claude, ma blocca Internet Archive per un'altra ragione. "La minaccia non � di certo Internet Archive", ha dichiarato il responsabile tecnico Biswajit Ganguly: il punto, per il Banner, � assicurarsi che i prodotti basati su IA risalgano alla fonte originale invece di attribuire il contenuto ai siti che lo aggregano. Il blocco non riguarda solo l'editoria locale. Cond� Nast ha esteso le restrizioni a Vogue, The New Yorker, Wired, Pitchfork, Vanity Fair e Bon Appetit, mentre tra le testate internazionali figura anche la brasiliana Folha de S.Paulo. Cosa si perde L'effetto pratico ricade su chi quegli archivi li usa ogni giorno: ricercatori, storici, giornalisti e fact-checker, che spesso si appoggiano alla Wayback Machine per recuperare articoli scomparsi da testate chiuse o riorganizzate. Le perdite non sono teoriche: nel 2024 migliaia di articoli del Daily Hampshire Gazette e del Greenfield Recorder sono svaniti durante un cambio di CMS, mentre nel 2022 l'archivio del settimanale The Hook � andato offline portandosi via oltre 22.000 storie. Le alternative esistono, ma sono a pagamento: gli editori da tempo concedono in licenza i propri contenuti ad archivi commerciali come ProQuest e LexisNexis, accessibili tramite biblioteche, universit� o abbonamento individuale. E questo, ovviamente, rappresenta un possibile incentivo economico dietro la chiusura verso un servizio gratuito. Mark Graham, fondatore della Wayback Machine, ha ricordato che le condizioni d'uso dell'archivio consentono di attingere alle collezioni solo per finalit� di studio o ricerca, e che il dialogo con gli editori resta aperto. Intanto � attiva una petizione che chiede alle testate di tornare a collaborare con l'archivio. La controversia, per�, si appoggia ad una contesa ben pi� "antica". Come osserva Meredith Broussard, docente alla New York University, � "la stessa battaglia che tutti combattono con Internet Archive fin dalla sua nascita", tra chi ritiene che l'informazione debba essere libera e chi ha priorit� diverse; l'IA, in questa lettura, � soltanto "l'innesco dell'ultima schermaglia". La sua conclusione sulla durata degli archivi � piuttosto laconica: "Chiunque vi abbia detto che internet � per sempre vi ha mentito."
Oltre 340 testate locali bloccano Internet Archive: la Wayback Machine perde pezzi
L'inchiesta del Nieman Lab fotografa un fenomeno in crescita: oltre 340 testate locali statunitensi limitano l'accesso di Internet Archive ai loro articoli, per timore che l'IA usi la Wayback Machine come scorciatoia per addestrare i modelli.






