Negli anni scorsi si è spesso detto che “l’AI è limitata solo dalla nostra immaginazione”; oggi suona meno vero. Anche con idee brillanti e modelli all’avanguardia, senza la potenza di calcolo necessaria l’AI non scala. Tra 2024 e 2025, la domanda di hardware AI – specialmente GPU per training e inferenza – è esplosa a livelli tali da superare la capacità produttiva globale.Un rapporto del dicembre 2025 evidenziava un fatto sorprendente: sia AMD che Nvidia (tradizionali rivali) concordavano pubblicamente che la domanda di capacità di calcolo AI supererà strutturalmente l’offerta almeno fino al 2026. Questo non è un normale ciclo di mercato, ma un’asimmetria persistente dovuta all’appetito quasi insaziabile degli hyperscaler (i grandi cloud provider e aziende AI) a fronte di tempi lunghi per costruire nuova infrastruttura.In altri termini, abbiamo raggiunto un punto in cui la limitazione non è sapere come fare un modello migliore, ma avere abbastanza risorse per eseguirlo.Una testimonianza concreta: nel 2025 OpenAI ha ritardato il rilascio di un suo modello video (Sora) citando capacità computazionali limitate per gestire l’accesso pubblico. Allo stesso modo, Google ha inizialmente reso disponibile il modello video Veo 2 solo a un gruppo selezionato, per motivi simili.Sono segnali di quanto perfino i leader debbano razionare l’uso delle proprie “macchine” AI.Indice degli argomenti: