L'accelerazione dell'intelligenza artificiale nei datacenter sta entrando in una nuova fase. d-Matrix ha annunciato che Corsair, soluzione progettata specificamente per i carichi di lavoro di inferenza AI a bassa latenza, è entrata in piena produzione e che le prime forniture in volumi significativi raggiungeranno nei prossimi mesi hyperscaler, operatori cloud di nuova generazione e laboratori impegnati nello sviluppo dei modelli AI più avanzati.

Secondo l'azienda, la crescente diffusione di applicazioni AI agentiche, strumenti di coding assistito e assistenti vocali in tempo reale sta mettendo sotto pressione le infrastrutture basate esclusivamente su GPU. In questi scenari il fattore determinante non è soltanto la potenza di calcolo complessiva, ma soprattutto la rapidità con cui il sistema riesce a generare i token e a rispondere alle richieste degli utenti.

Per questo motivo sta emergendo un approccio sempre più diffuso nei grandi datacenter: la disaggregazione dei carichi di lavoro. Invece di affidare tutte le operazioni alle GPU, le infrastrutture combinano CPU, GPU e acceleratori specializzati, assegnando a ciascun componente le attività per cui risulta più efficiente. In tale schema le GPU continuano a gestire prevalentemente la fase di prefill, caratterizzata da elevata intensità computazionale, mentre Corsair viene utilizzato per accelerare il decode, cioè la fase di generazione dei token.