Abbiamo testato Claude Cowork, il primo agente AI che funziona come si deve

Da giornalista di Wired, negli ultimi anni ho testato un sacco di pessimi agenti AI. Le startup di intelligenza artificiale generativa d'altronde tendono a promettere troppo e a mantenere poco quando si parla di questi assistenti “operativi”, programmi progettati per interagire direttamente con il computer ed eseguire incombenze e attività digitali al nostro posto, liberando tempo per cose più importanti. Nella pratica però i bot che ho installato sul mio portatile faticavano a portare a termine anche le operazioni più basilari. Semplicemente, non funzionavano.Questo bilancio poco incoraggiante rende l’ultimo agente di Anthropic, Claude Cowork, una piacevole sorpresa. Quando l'ho messo alla prova, il sistema se l'è cavata piuttosto bene, soprattutto per un software ancora in versione beta. Cowork è in grado di organizzare file in cartelle, convertire formati, generare report e persino prendere il controllo del browser per fare ricerche sul web o riordinare una casella Gmail. Sul fronte della gestione dei file e delle interfacce del computer, questo strumento sembra l’inizio di un'evoluzione positiva dell’esperienza utente.Lo scorso anno Anthropic aveva già coltivato una sorta di seguito “di culto” grazie a Claude Code, un sistema molto apprezzato dagli sviluppatori per la sua capacità di comprendere intere codebase ed eseguire comandi, che si è imposto rapidamente tra gli addetti ai lavori di San Francisco. Va detto però che maggior parte delle persone però non ha le stesse esigenze di un dipendente di una startup sulla cresta dell'onda in Silicon Valley.“Abbiamo provato un po’ di idee diverse per vedere quale fattore di forma avesse senso per un pubblico meno tecnico, che non vuole usare un terminale”, spiega Boris Cherny, responsabile di Claude Code ad Anthropic. Negli ultimi due mesi, Cherny si è sempre appoggiato all'AI per programmare, e lo stesso Cowork è stato sviluppato con l'ausilio di strumenti di intelligenza artificiale.Rilasciato da Anthropic il 12 gennaio come anteprima di ricerca, Cowork riprende le capacità dello strumento dell’azienda pensato per la programmazione e le rende più accessibili. È pensato per un pubblico più ampio, che potrebbe essere interessato a sperimentare un nuovo modo di controllare un computer ma che si sente a disagio davanti a una riga di comando.I primi passi con Claude CoworkReece RogersAl momento Cowork è disponibile solo come anteprima di ricerca per gli abbonati al piano da 100 dollari al mese di Anthropic. È una strategia di lancio piuttosto comune tra le aziende di intelligenza artificiale generativa, che introducono nuove funzionalità in modo controllato, partendo da un primo gruppo di abbonati.Felix Rieseberg, uno dei dipendenti di Anthropic che lavora su Cowork, racconta di usare l'agente AI per gestire le note spese e convertire file. “Se questo pdf è troppo grande, rendilo più piccolo. Trasforma queste 20 immagini jpeg in un unico pdf. Preparami un report su tutte queste cose”, spiega. Rieseberg è incuriosito dal modo in cui gli utenti più esperti stanno già sperimentando applicazioni più complesse, ma preferisce gli utilizzi più semplici e incentrati sui file.Per il momento Cowork è disponibile solo sulla versione di Claude per Mac, anche se in futuro è prevista una distribuzione più ampia. E anche se lo strumento è in grado di interagire con i file presenti sul computer, per usarlo è comunque necessaria una connessione a internet. Nell’app di Claude per macOs, la scheda Cowork compare accanto a Chat e Code, e le sessioni degli utenti vengono indicate come “task” anziché “chat”.I rischi per la sicurezzaIl motivo principale che potrebbe spingere a non provare Cowork è il rischio di sicurezza insito negli agenti AI. Come molti strumenti simili, Cowork è vulnerabile agli attacchi di prompt injection, messaggi nascosti online progettati per ingannare i sistemi di intelligenza artificiale e sabotare il loro comportamento. È sempre meglio non fornire dati sensibili a uno strumento che può essere compromesso in questo modo.“Poiché Claude può leggere, scrivere ed eliminare permanentemente questi file, fai attenzione nel concedere accesso a informazioni sensibili come documenti finanziari, credenziali o record personali”, si legge nella pagina di supporto online di Anthropic. L’azienda suggerisce di salvare copie di backup dei file importanti e di creare una cartella dedicata contenente solo informazioni non sensibili a cui Claude può accedere.“Utilizziamo una macchina virtuale”, spiega Cherny. “Questo significa che dovete indicare le cartelle a cui Claude può accedere. Se non gli concedete l’accesso a una cartella, Claude semplicemente non può vederla”.Se autorizzato, il nuovo agente AI di Anthropic può anche navigare nel browser per cercare informazioni o aiutare nella gestione della posta elettronica. Il bot chiede l’autorizzazione per la maggior parte delle azioni che compie, come la lettura di un sito web, segnalando con un disclaimer esplicito che il codice nascosto nei portali online è in grado di “rubare dati, installare malware nei sistemi o prenderne il controllo”.Cherny dice che Anthropic ha progettato Cowork integrando diverse misure di sicurezza, tra cui il rilevamento di prompt injection, meccanismi pensati per informare gli utenti su ciò che l’agente sta facendo e l’uso della “virtualizzazione” per consentire allo strumento di accedere solo ai file esplicitamente indicati.Prime impressioniIl primo test che ho condotto serviva a verificare se Claude fosse in grado di organizzare un insieme casuale di screenshot sparsi sul desktop, che includevano sia meme imbarazzanti che inviti importanti. Per farlo, ho dovuto concedergli l’accesso a un’intera cartella e permettergli di modificare i file (anche di eliminarli in modo permanente, se necessario).Prima di compiere qualsiasi azione, il chatbot ha chiesto le mie preferenze, suggerendo come opzione predefinita una cartella separata per ogni mese. Poi ha impiegato circa un minuto per elaborare la richiesta ed eseguire i comandi. Al termine del processo, ho trovato tutti gli screenshot correttamente organizzati in tre nuove cartelle sul desktop, etichettate per mese.Reece RogersSuccessivamente ho messo alla prova il sistema con una richiesta un po’ più ampia e complessa, come l’organizzazione di una casella di posta. Dopo avergli concesso l’accesso, Cowork mi ha chiesto quali fossero i miei obiettivi per Gmail e su cosa avrebbe dovuto concentrarsi. Per ciascuna domanda, lo strumento proponeva pulsanti opzionali con risposte generate automaticamente.Quando ho chiesto all'agente di archiviare le email invece di eliminarle, i primi tentativi hanno avuto qualche intoppo, perché il bot ha avuto difficoltà nel gestire l’archiviazione in blocco di alcuni messaggi promozionali. Davanti a questi fallimenti, ho cambiato strategia e ho chiesto a Cowork di eliminare direttamente un migliaio di email non lette. A quel punto lo strumento ha cliccato qua e là e ha cancellato esattamente ciò che gli avevo chiesto di eliminare, senza toccare altro. Ovviamente c'è sempre la possibilità concreta che Cowork possa sbagliare, in una fase in cui Anthropic continua a lavorare sui bug e a perfezionare la novità.Per finire, ho collegato Claude a Google Calendar e ho chiesto a Cowork di trovare due biglietti per una proiezione serale di Marty Supreme in un cinema vicino a me, e di aggiungere poi l’evento al calendario come appuntamento serale. Un’operazione un po’ più complessa, con implicazioni economiche. Il bot ha individuato uno spettacolo alle 21, ma si è fermato prima di acquistare i biglietti per motivi di sicurezza. Una volta che ho completato l’acquisto manualmente, ha aggiornato il calendario.Tirando le fila, Cowork non è perfetto nello stato attuale e i suoi sviluppatori continueranno ad aggiornarlo sulla base dei riscontri degli utenti. Detto questo, posso dire che è il primo agente AI che mi abbia davvero convinto.Questo articolo è apparso originariamente su Wired US.

Abbiamo testato Claude Cowork, il primo agente AI che funziona come si deve

Related reading

Microsoft lancia Copilot Cowork, agente IA basato su tecnologia Anthropic -…

Claude di Anthropic parla: arriva la modalità conversazionale e la ricerca web…

Walter Veltroni intervista l’IA: domande giuste, partner sbagliato

Anthropic, i nuovi modelli Sonnet 4 e Opus 4 possono programmare da soli per ore

Claude di Anthropic unisce smartphone e Pc: così l’IA lavora da sola…

Anthropic sfida ancora OpenAI, lancia un nuovo modello di IA - Notizie - Ansa.it