Ad AMD non dev'essere andata giù l'ingresso in pompa magna di NVIDIA nel settore delle CPU server con il progetto Vera, né tantomeno il modo in cui l'azienda ha diffuso i primi test prestazionali. Morale della favola? Ha deciso di replicare con la stessa moneta, pubblicando un'analisi che mette al centro le proprie architetture EPYC - l'attuale Turin e la prossima Venice - su scenari progettati per rispecchiare le esigenze dei moderni sistemi AI agentici. E lo ha fatto, ovviamente, confrontandosi direttamente con le proposte di Intel e NVIDIA.

Il racconto dominante del ciclo di investimenti AI degli ultimi anni ha ruotato quasi esclusivamente attorno alle GPU. AMD, tuttavia, sottolinea un punto infrastrutturale spesso sottovalutato: i sistemi AI agentici in produzione non si esauriscono nell'inferenza dei modelli. Ogni agente in esecuzione dipende da un insieme articolato di servizi di supporto - orchestrazione, database transazionali, frontend web, API endpoint, cache in memoria, middleware - che sono prevalentemente legati alla CPU e scalano in funzione del numero di agenti concorrenti, non delle dimensioni del modello.

Questa premessa sposta l'unità di misura rilevante dal singolo processore all'intero rack: la domanda pertinente non è quante operazioni esegue un socket, ma quanta capacità di servizio si riesce a ospitare entro un budget fisso di alimentazione e raffreddamento.