Google bringt 12-Milliarden-Parameter-Modell auf den Laptop

Google DeepMind hat mit Gemma 4 12B ein neues offenes KI-Modell vorgestellt, das multimodale Agenten direkt auf handelsüblichen Notebooks ermöglichen soll. Das Modell mit 12 Milliarden Parametern verarbeitet Text, Bilder und als erstes Modell dieser Größe auch Audio nativ – und benötigt dafür lediglich 16 GByte Arbeits- oder Grafikspeicher. Veröffentlicht unter der Apache-2.0-Lizenz steht es Entwicklern und Unternehmen frei zur Verfügung.

Damit senkt Google die Einstiegshürde für seine lokale KI-Agenten. Während Googles eigene On-Device-KI Gemini Intelligence auf Android-Smartphones hohe Hardwareanforderungen stellt zielt Gemma 4 12B bewusst auf die breite Masse.

Architektur ohne separate Encoder

Eine zweite Stärke des Modells liegt in seiner vereinheitlichten Architektur. Wie Google in seinem Blog erläutert, verzichtet Gemma 4 12B vollständig auf separate Vision- und Audio-Encoder. Herkömmliche multimodale Modelle von Google nutzen typischerweise eigene Encoder-Module, die Bilder und Audiodaten erst übersetzen, bevor das Sprachmodell sie verarbeitet. Gemma 4 12B geht einen anderen Weg: Hier soll der Input direkt vom LLM-Backbone verarbeitet werden.

Leistung nahe am doppelt so großen Modell

Google bringt 12-Milliarden-Parameter-Modell auf den Laptop

Other newsrooms on this story

Related reading

Google Deepmind's Gemma 4 12B squeezes multimodal AI onto a laptop with just 16…

Other newsrooms on this story

Related reading

Google Deepmind's Gemma 4 12B squeezes multimodal AI onto a laptop with just 16…

Gemma 4 12B: Googles neues KI-Modell läuft direkt auf deinem Notebook | t3n

Google's new open source Gemma 4 12B analyzes audio, video — and runs entirely…

Gemma 4 12B: Google's encoder-free multimodal AI now runs on a laptop

Google brings local AI agents to laptops with Gemma 4 12B

Google's new Gemma 4 open AI model is sized for your laptop