Deepseeks DSpark beschleunigt KI-Antworten pro Nutzer um bis zu 85 Prozent

Deepseek steigert mit DSpark die Antwortgeschwindigkeit seiner KI-Modelle pro Nutzer um 60 bis 85 Prozent. Das Verfahren nutzt Speculative Decoding: Ein kleines Modell schlägt Token-Kandidaten vor, die das große Modell gebündelt prüft. Die Effizienzgewinne könnten Chinas Abhängigkeit von US-Hochleistungschips weiter verringern.

martedì 30 giugno 2026 New tab

Deepseek hat mit DSpark ein neues Verfahren vorgestellt, das die Antwortgeschwindigkeit seiner KI-Modelle pro Nutzer um 60 bis 85 Prozent steigern soll.

Herkömmliche KI-Modelle erzeugen Text Wort für Wort, was bei langen Antworten zu langsamer GPU-Auslastung und Wartezeiten führt. DSpark nutzt ein sogenanntes "Speculative Decoding": Dabei schlägt ein kleines, schlankes Modell Antwort-Kandidaten vor, die dann gebündelt vom großen Modell geprüft werden. Zusätzlich erzeugt es kleine Wortgruppen statt einzelner Wörter. Ein Konfidenz-basiertes System passt die Prüftiefe je nach Rechenlast dynamisch an. Es reduziert so verschwendete Rechenkapazität bei der Prüfung von Token-Vorschlägen.

Vergleich von Durchsatz und Generierungsgeschwindigkeit (TPS) bei Deepseek-V4-Flash und Deepseek-V4-Pro unter Live-Traffic. Der Einsatz von DSpark (grün) verbessert die Leistungsgrenze für Durchsatz und Interaktivität im Vergleich zur MTP-Baseline (blau) deutlich. | Bild: Deepseek

Deepseek testete DSpark auch mit offenen Modellen von Google Deepmind (Gemma) und Alibaba (Qwen), was auf eine breite Einsetzbarkeit hindeutet. Das gemeinsam mit der Peking University entwickelte Framework samt Deepseek-V4-Pro-Modell ist auf Hugging Face unter der offenen MIT-Lizenz verfügbar. Technische Details stehen im Paper.

Deepseek hat mit DSpark ein neues Verfahren vorgestellt, das die Antwortgeschwindigkeit seiner KI-Modelle pro Nutzer um 60 bis 85 Prozent steigern soll.

Deepseeks DSpark beschleunigt KI-Antworten pro Nutzer um bis zu 85 Prozent

Deepseeks DSpark beschleunigt KI-Antworten pro Nutzer um bis zu 85 Prozent

Other newsrooms on this story

Related reading

Deepseek's DSpark boosts AI speed by up to 85 percent, a strategic win under…

Faster AI, lower costs: DSpark eases bottlenecks and chip strain, says DeepSeek

DeepSeek unveils DSpark for 60% to 85% faster inference optimization

DeepSeek's DSpark complicates Nvidia's latest hardware deals

DeepSeek lancia DSpark, la tecnica che accelera le risposte dei modelli…

DeepSeek DSpark: AI Più Veloce E Meno Costosa Senza Nuovo Modello

Other newsrooms on this story

Related reading

Deepseek's DSpark boosts AI speed by up to 85 percent, a strategic win under…

Faster AI, lower costs: DSpark eases bottlenecks and chip strain, says DeepSeek

DeepSeek unveils DSpark for 60% to 85% faster inference optimization

DeepSeek's DSpark complicates Nvidia's latest hardware deals

DeepSeek lancia DSpark, la tecnica che accelera le risposte dei modelli…

DeepSeek DSpark: AI Più Veloce E Meno Costosa Senza Nuovo Modello