Isa Fulford ha deciso di sfruttare il nuovo agente ChatGPT per ordinare dei dolcetti. "Sono stata molto specifica su ciò che volevo, ovvero un sacco di cupcake – racconta la responsabile della ricerca dell'ultimo strumento basato sull'intelligenza artificiale di OpenAI –. Ci è voluta quasi un'ora, ma è stato più facile che farlo da sola, considerando che non avevo voglia di farlo".Cosa può fare l'agente ChatGPTL'agente AI di ChatGPT appena lanciato dall'azienda utilizza un browser virtuale per portare a termine i compiti e può generare file scaricabili, in particolare presentazioni PowerPoint e fogli di calcolo Excel. Anche se non sostituisce del tutto la suite di strumenti per il lavoro di Microsoft, le funzionalità incluse in questo agente di OpenAI potrebbero portare alcuni a fare meno affidamento ai software aziendali del colosso. Le due aziende sono peraltro partner da diverso tempo e attualmente sono impegnate in delicate trattative contrattuali legate al futuro accesso di Microsoft ai modelli di OpenAI.La novità rientra nel quadro degli sforzi di OpenAI per trasformare il suo chatbot – in circolazione ormai da quasi tre anni – in un prodotto redditizio. Nonostante i milioni di utenti di ChatGPT, si tratta di un'impresa non da poco considerando i costi legati all'addestramento e al funzionamento dei potenti modelli di intelligenza artificiale, oltre che gli esorbitanti stipendi necessari per attirare e trattenere ricercatori e informatici di alto livello.Un agente AI è un tool basato sull'intelligenza artificiale che (almeno in teoria) è in grado di navigare all'interno di software e siti web esterni e prendere decisioni allo scopo di eseguire una serie di azioni, sulla base delle istruzioni iniziali dell'utente. In questo momento, il termine è diventato la parola d'ordine per le aziende che cercano di vendere strumenti di AI generativa, in primis per quelle che puntano ai clienti aziendali.“Abbiamo cercato di costruire un prodotto che avesse un gran numero di casi d'uso aziendali”, spiega Yash Kumar, responsabile di prodotto dell'agente ChatGPT. Oltre a generare file, il tool è in grado di compilare moduli online, utilizzare un terminale e accedere alle Api pubbliche di servizi online come Google Drive e SharePoint.Non si tratta del primo agente distribuito da OpenAI nel 2025. La novità combina aspetti di Operator, il browser dell'azienda in grado di navigare da solo, e della funzione di ricerca approfondita Deep Research, entrambi lanciati all'inizio dell'anno da OpenAI e presentati come agenti. "Io facevo parte del team di Deep Research mentre Yash era in quello di Operator – afferma Fulford –. Ci siamo resi conto che i due prodotti sono molto complementari e abbiamo deciso di unire i team". L'agente ChatGPT può interagire sia con un browser visivo, cliccando sulle pagine come fa Operator, che con un browser testuale, elaborando diversi siti web in modo simile a Deep Research.OpenAI ha iniziato a distribuire il nuovo agente agli abbonati Pro, Plus e Team, mentre per gli utenti Enterprise ed Education l'accesso dovrebbe arrivare più avanti nel corso dell'estate. Al momento, gli iscritti a Pro hanno un limite massimo di 400 richieste al mese, che scendono a 40 per gli altri. Non è invece chiaro quando la novità sarà disponibile anche per gli utenti che utilizzano la versione gratuita di ChatGPT.La demoCome dimostra l'esempio dei cupcake condiviso da Fulford, durante la fase di test è capitato che lo strumento di OpenAI avesse bisogno di parecchio tempo per completare un compito. E anche se non sarà necessaria un'ora per tutte le richieste, gli utenti devono essere pronti ad aspettare un po' mentre l'agente si muove su internet.In una demo organizzata prima del lancio per Wired US, Kumar ha usato l'agente ChatGPT per automatizzare una serie di attività: da quelle rivolte ai consumatori, come pianificare un appuntamento, ad altre pensate per le aziende, come l'esame di diversi fogli Excel per un analista finanziario o la creazione di una presentazione sui risultati del primo trimestre di Nvidia. Mentre per organizzare una serata all'agente possono bastare anche cinque minuti (per consultare il calendario e trovare un ristorante che abbia ancora disponibilità), la creazione di una presentazione finanziaria è più impegnativa e può comportare un'attesa di circa 25 minuti. “Potete fare quante cose volete in parallelo”, afferma Kumar, secondo cui un'attività media con l'agente ChatGPT richiede circa 10 o 15 minuti.Dalla possibilità di ricordare le ricette preferite del vostro partner sulla base delle chat passate alla creazione di una presentazione con la formattazione che usate di solito, molte di queste attività potrebbero beneficiare dell'accesso alla memoria di ChatGPT. OpenAI ha in programma integrarla nell'agente, ma la funzione non fa parte del lancio iniziale. "Non è che non pensiamo che sia sicuro. Stiamo solo adottando una precauzione in più", commenta Kumar citando il rischio di attacchi di tipo prompt injection come uno dei motivi che hanno spinto OpenAI a prendere tempo per capirne di più.Anche quando l'agente automatizza le attività è fondamentale che l'utente abbia ancora la sensazione di avere il controllo, sottolineano sia Kumar che Fulford. "Abbiamo un elenco di siti web in cui riteniamo sia rischioso andare, come i social media o quelli per le transazioni finanziarie", puntualizza Kumar. Una delle impostazioni del nuovo agente – basata sulla "watch mode" di Operator – richiede all'utente di osservare attivamente lo strumento durante le attività giudicate ad alto rischio, senza uscire dalla pagina web.Il pomeriggio prima del lancio di ChatGPT agent, dopo aver partecipato alla demo, non riuscivo a togliermi dalla testa la nuova funzione "replay". Ho provato a pensare a come fosse la registrazione dello schermo di Fulford quando l'agente si è prodigato per quasi un'ora a cercare i suoi cupcake perfetti. Dove è andato? Dove si è perso? Mi sono immaginato tra cinque anni, quando potrei ritrovarmi a dedicare più tempo ai replay delle azioni del mio agente AI che alla navigazione su internet. Se l'era degli agenti AI si prolungherà nel tempo – cosa tutt'altro che scontata – il modo in cui utilizziamo il web è destinato a cambiare radicalmente.Questo articolo è apparso originariamente su Wired US.