Un'IA può essere disperata? Sembra una domanda assurda ma è esattamente quello che un gruppo di ricercatori di Anthropic ha scoperto guardando dentro il cervello artificiale di Claude, uno dei modelli di intelligenza artificiale più avanzati al mondo.
Partiamo da una premessa fondamentale: non stiamo dicendo che un'IA "soffre" o "prova emozioni" come le proviamo noi. Si tratta, in realtà, di un meccanismo funzionale. Che però ha degli effetti potenzialmente negativi su come agisce un'intelligenza artificiale.
Come nasce il problema
Per capire, bisogna sapere come viene addestrato un modello linguistico alla base delle capacità di chatbot come Gemini, ChatGpt e lo stesso Calude, sviluppato proprio da Anthropic.
Nella prima fase, il modello divora enormi quantità di testo scritto da esseri umani e impara a prevedere cosa viene dopo. Un cliente arrabbiato scrive in modo diverso da uno soddisfatto; il personaggio di una storia divorato dal senso di colpa fa scelte diverse da uno che si sente nel giusto.







