di

Sergio Donato

Non è l’unico, ma la lentezza nelle risposte resta uno dei limiti più sentiti dei modelli linguistici, specie a livello di data center. DSpark la riduce su DeepSeek-V4, e DeepSpec ne porta il metodo anche sui modelli terzi

DeepSeek ha pubblicato DSpark, un sistema che velocizza la generazione di testo dei suoi modelli senza cambiare ciò che il modello scrive. L'azienda cinese lo ha rilasciato con licenza MIT (tra le più permissive) insieme a DeepSpec, il codice per addestrare e valutare componenti di questo tipo anche su altri modelli IA. Ma in che senso DSpark “velocizza la generazione di testo”?Indovinare, poi controllare

Per capire a cosa serve bisogna partire dal problema che vuole sistemare. Un modello linguistico produce testo una parola alla volta, o meglio un "token", che può essere una parola, un pezzo di parola o un segno di punteggiatura, e ogni token richiede un calcolo completo sull'intera rete. È un sistema accurato ma lento, come un redattore che approva una singola parola prima di passare alla successiva.