Entro il 2028 il costo dei token consumati da un singolo sviluppatore per alimentare gli agenti di coding potrebbe superare quanto quello stesso sviluppatore guadagna in un mese. � la previsione di Gartner, che fissa il termine di paragone in un salario medio mensile globale di circa 2.000 dollari. Il riferimento � alla media globale, non agli stipendi a sei cifre annue tipici degli sviluppatori statunitensi, che restano ben oltre la portata dei costi token. Il motore dell'escalation, secondo Gartner, � il passaggio dei fornitori dal modello di licenza a posto (seat-based) a quello a consumo (consumption-based): si paga per quanto si usa, e l'uso degli agenti cresce in fretta. Da cento dollari a cinquemila I costi mensili per sviluppatore stanno passando da una fascia di 20-100 dollari a una di 2.000-5.000 dollari, con casi estremi che arrivano fino a 20.000 dollari al mese. Sono numeri che spostano la voce di spesa degli agenti AI dal capitolo degli strumenti a quello, ben pi� pesante, del personale. I dati raccolti da Gartner Peer Insights danno la misura di dove siamo gi� oggi: il 23% dei responsabili tecnici spende tra 200 e 500 dollari al mese per sviluppatore in token per agenti come Claude Code, Cursor e OpenAI Codex, mentre il 6% supera i 2.000 dollari mensili. Il punto critico � che la spesa non si traduce automaticamente in lavoro fatto. Nitish Tyagi, senior principal analyst di Gartner, � netto: "Non esiste una relazione diretta tra l'aumento del consumo di token e l'aumento dei guadagni di produttivit�". Eppure i fornitori, osserva Gartner, non hanno ancora messo a disposizione funzioni mature di ottimizzazione dei costi, e tendono anzi a incoraggiare il tokenmaxxing, l'idea che pi� token equivalgano a pi� produttivit�. Dove il sorpasso � gi� avvenuto In alcuni mercati la previsione � gi� realt�. In India i costi dei token per il coding superano oggi il salario di uno sviluppatore con quattro-sei anni di esperienza. Il problema si accentua perch� il prezzo dei token non varia in base alla collocazione geografica di chi li consuma: la stessa cifra pesa in modo molto diverso su una busta paga di Bangalore e su una della Silicon Valley. Le contromisure che Gartner suggerisce vanno nella direzione del governo della spesa pi� che del taglio netto. Tra le indicazioni pratiche ci sono l'introduzione di soglie di consumo, il monitoraggio automatizzato dei token, la context engineering per ridurre il contesto inviato ai modelli, e il model routing: modelli piccoli per i compiti semplici e ricorrenti, modelli di frontiera solo per i lavori complessi e ad alto valore. A questo si aggiunge una classificazione dei compiti in tre regimi operativi, da quello guidato dallo sviluppatore a quello affidato interamente all'agente, scegliendo il grado di autonomia in base alla complessit�. Cambia anche il modo di misurare il risultato. La vecchia metrica delle linee di codice scritte perde senso quando un agente pu� generare un'intera libreria Python quasi all'istante. Tyagi stima che lo sviluppo assistito di base, senza agenti autonomi, possa gi� portare fino al 20% di guadagno di produttivit�. E un costo alto non � di per s� uno spreco: cita il caso di uno sviluppatore di un'azienda IT indiana che bruciava 20.000 dollari di token al mese, finch� l'analisi interna ha mostrato che lavorava alla modernizzazione di sistemi legacy, giustificando la spesa. Resta la condizione che Tyagi pone come dirimente: "Senza un modello operativo di engineering governato, i costi possono crescere pi� in fretta dei guadagni di produttivit� che questi strumenti promettono di offrire".