d-Matrix avvia la produzione di Corsair: l'acceleratore AI che punta a superare i limiti delle GPU nell'inferenza

L'accelerazione dell'intelligenza artificiale nei datacenter sta entrando in una nuova fase. d-Matrix ha annunciato che Corsair, soluzione progettata specificamente per i carichi di lavoro di inferenza AI a bassa latenza, è entrata in piena produzione e che le prime forniture in volumi significativi raggiungeranno nei prossimi mesi hyperscaler, operatori cloud di nuova generazione e laboratori impegnati nello sviluppo dei modelli AI più avanzati.

Secondo l'azienda, la crescente diffusione di applicazioni AI agentiche, strumenti di coding assistito e assistenti vocali in tempo reale sta mettendo sotto pressione le infrastrutture basate esclusivamente su GPU. In questi scenari il fattore determinante non è soltanto la potenza di calcolo complessiva, ma soprattutto la rapidità con cui il sistema riesce a generare i token e a rispondere alle richieste degli utenti.

Per questo motivo sta emergendo un approccio sempre più diffuso nei grandi datacenter: la disaggregazione dei carichi di lavoro. Invece di affidare tutte le operazioni alle GPU, le infrastrutture combinano CPU, GPU e acceleratori specializzati, assegnando a ciascun componente le attività per cui risulta più efficiente. In tale schema le GPU continuano a gestire prevalentemente la fase di prefill, caratterizzata da elevata intensità computazionale, mentre Corsair viene utilizzato per accelerare il decode, cioè la fase di generazione dei token.

d-Matrix avvia la produzione di Corsair: l'acceleratore AI che punta a superare i limiti delle GPU nell'inferenza

Other newsrooms on this story

Related reading

D-Matrix sfida NVIDIA con un chip AI più veloce e meno energivoro?

D-Matrix launches Corsair AI inference platform, challenging Nvidia's GPU…

D-Matrix claims Corsair chip outperforms Nvidia GPUs in AI inference

d-Matrix Corsair Inference Accelerator Wins 2026 AI Breakthrough Award

Non è la GPU il vero collo di bottiglia dell'AI? Intel scommette tutto sulla…

AMD e Cerebras uniscono Helios e Wafer-Scale Engine: fino a 5 volte più token…