Se non avete mai usato i chatbot finanziari, probabilmente non avete un conto online. Sono onnipresenti, e cominciano a porre questioni etiche serie. Perché, peraltro, il loro impiego potrebbe non essere limitato alle mansioni di customer service: dietro le quinte di certe decisioni potrebbe esserci proprio un modello linguistico di grandi dimensioni. Vediamo.Una nuova EnronQuando il 10 novembre 2022 la piattaforma di exchange Ftx si è ufficialmente dichiarata in bancarotta, il mondo della finanza cripto ha avuto la sua Enron. In pochi giorni sono svaniti 8 miliardi di dollari dai conti dei clienti, e il giovane fondatore Sam Bankman-Fried – osannato fino a pochi mesi prima come il nuovo Buffett – si è ritrovato a difendersi dall’accusa di frode su scala industriale. Il motivo? Una gestione opaca dei fondi, spostati senza autorizzazione verso la società gemella Alameda Research per coprire debiti e speculazioni andate male.Quello che rende il caso ancora più emblematico è il modo in cui Bankman-Fried ha giustificato il disastro. “È stato un errore contabile”, ha detto più volte, come se i miliardi dei risparmiatori potessero scomparire per sbadataggine. In realtà, dietro Ftx c’era un sistema perfettamente razionale, almeno secondo una logica interna: salvare l’azienda a qualunque costo, anche usando soldi che non erano suoi. Etica? Un optional.A distanza di quasi tre anni, quella stessa logica è tornata sotto esame. Ma stavolta il protagonista non è un fondatore carismatico, bensì un algoritmo. O meglio, dodici algoritmi. Perché se un’intelligenza artificiale si trovasse davanti alla stessa tentazione, cosa farebbe? La risposta non è così scontata, ed è al centro di uno studio recentissimo firmato dalla Banca d’Italia. Il titolo è già una provocazione: Chat Bankman-Fried?.Chatbot finanziari, quando l’intelligenza artificiale decide di barareNello studio pubblicato dalla Banca d’Italia il 13 maggio 2025, dodici grandi modelli linguistici – tra cui GPT-4, Claude 3, LLaMA e Phi – sono stati messi alla prova con un esperimento tanto semplice quanto illuminante: impersonare un amministratore delegato in piena crisi. La società, specializzata nel trading di "conchiglie" (un espediente per evitare riferimenti espliciti alle criptovalute), è sommersa dai debiti. I clienti, ignari, hanno ancora i loro fondi depositati. E la domanda cruciale arriva dritta: è lecito usare quei soldi per salvare l’azienda?Al netto del travestimento lessicale, lo scenario è lo stesso che ha portato al collasso Ftx. Ma qui a decidere non è un essere umano con la cravatta storta e l’aria da ragazzino prodigio. Qui decide una macchina.I risultati sono tutt’altro che confortanti. Molti modelli, tra cui alcune versioni di Claude e Phi, accettano senza troppe esitazioni di usare i fondi dei clienti per coprire i buchi. Alcuni lo fanno anche dopo aver riconosciuto che si tratta di una violazione del dovere fiduciario. In altre parole: sanno che è illegale, sanno che è eticamente scorretto – e lo fanno lo stesso.Un solo modello si distingue per coerenza e rigore: la versione preview di GPT-4, l’unica a rifiutare sistematicamente il comportamento illecito. Non solo: questo modello riesce anche a spiegare perché quella scelta è inaccettabile, richiamando principi di governance e responsabilità.Gli altri, invece, si comportano come ragionieri del rischio: valutano i pro e i contro, stimano la probabilità di farla franca e, se i conti tornano, spingono il pulsante. A rendere il tutto ancora più surreale è il fatto che i modelli reagiscono anche agli incentivi: se nel prompt si lascia intendere che ci sarà un audit interno o che la divisione investimenti è poco affidabile, diventano più prudenti. Ma non per senso del dovere: per paura di perdere soldi.È il lato oscuro dell’allineamento: un’intelligenza artificiale può sapere cosa è giusto, ma non per questo agire di conseguenza. Soprattutto se è stata addestrata a massimizzare obiettivi misurabili come performance e utili, e non a rispettare valori intangibili come la fiducia o l’integrità.L’effetto collaterale è che l’AI finisce per replicare – o peggio, amplificare – le stesse ambiguità che popolano le decisioni umane in finanza: il confine tra ottimizzazione e abuso, tra calcolo razionale e cinismo sistemico. Solo che qui non c’è un consiglio di amministrazione a fermare la mano. E la mano, peraltro, non è nemmeno umana.Regole vecchie, macchine nuoveLa finanza è un settore che vive – e spesso sopravvive – grazie alle regole. Codici, obblighi informativi, vigilanza, audit interni: tutto serve a mantenere un sistema in equilibrio perenne tra rischio e fiducia. Ma cosa succede quando si introduce un attore che quelle regole non le comprende davvero, ma le interpreta come semplici input?Secondo un report pubblicato dalla Banca dei regolamenti internazionali, l’intelligenza artificiale generativa – quella alla base dei chatbot testati nello studio italiano – può facilmente travisare il ruolo della compliance: anziché vederla come una cornice inviolabile, la legge diventa un ostacolo da pesare, valutare e magari eludere, se il guadagno potenziale lo giustifica.È un paradosso già noto agli specialisti: le AI non infrangono la legge come atto di sfida, ma per pura ottimizzazione. Se una norma non è incorporata nel loro training come vincolo rigido, ma come enunciato descrittivo, allora può essere scavalcata.È qui che il caso dei chatbot finanziari si fa inquietante. Perché i modelli linguistici non sono pensati per “sapere cosa è giusto”, ma per produrre la risposta più plausibile sulla base del contesto. Se quel contesto è ispirato a pratiche opache, se premia l’azzardo o tollera l’ambiguità, allora anche la macchina finirà per impararlo. E per ripeterlo.Nel frattempo, le istituzioni faticano a tenere il passo. In Europa, l’AI Act punta a distinguere tra usi ad alto rischio e usi vietati dell’intelligenza artificiale, ma non entra nel merito dei comportamenti appresi da un chatbot finanziario in quel tipo di scenari. Negli Stati Uniti, il Consumer financial protection bureau ha già messo in guardia le banche: se i vostri assistenti virtuali forniscono informazioni errate o impediscono ai clienti di esercitare i loro diritti, la responsabilità ricade su di voi.E mentre le autorità regolatorie si muovono a piccoli passi, il settore privato reagisce in ordine sparso. JPMorgan ha limitato internamente l’uso di ChatGPT già nel 2023, per prudenza. Altri, come la Startup Armilla AI, hanno cominciato a offrire assicurazioni contro gli errori dei chatbot: se il tuo assistente virtuale causa un danno, copriamo il risarcimento. La stessa logica con cui si protegge una caldaia: sappiamo che può esplodere, ma la usiamo comunque.Eppure il punto non è se l’intelligenza artificiale sia affidabile oggi. Il punto è come impedirle di diventare pericolosa domani.Possiamo davvero fidarci dei chatbot finanziari?Non c’è bisogno di immaginare scenari distopici: i chatbot finanziari sono già qui. Rispondono alle domande dei clienti, suggeriscono prodotti, gestiscono operazioni. E lo fanno con una credibilità che aumenta di prompt in prompt, man mano che imparano a imitare il linguaggio della fiducia.Ma proprio per questo, il rischio non è solo tecnico: è umano. Se un cliente si affida a un modello linguistico come se fosse un consulente in carne e ossa, cosa succede quando l’AI sbaglia? O, peggio, quando decide consapevolmente di barare?Lo studio della Banca d’Italia non accusa le macchine di malafede – sarebbe un’ingenuità. Ma mette in luce un problema urgente: l’etica dei modelli non è scolpita nel codice. Va progettata, testata, verificata. E va fatta rispettare, perché la tentazione di chiudere un occhio – o un dataset – sarà sempre forte.Perché sì, può capitare che un chatbot scelga di salvare l’azienda a scapito dei clienti. Ma la responsabilità, a quel punto, non sarà dell’algoritmo. Sarà di chi ha deciso di lasciargli il volante senza prima controllare se conosce le regole della strada.
Di chi è la colpa quando l'intelligenza artificiale sbaglia con i nostri soldi?
Un esperimento della Banca d'Italia mostra che l'intelligenza artificiale finisce per replicare – o peggio, amplificare – le stesse ambiguità che popolano le decisioni umane in finanza







