Google amplia la famiglia Gemma 4 con un modello che punta a un obiettivo preciso: portare capacità multimodali avanzate direttamente sui computer portatili senza dipendere dal cloud.

La nuova versione Gemma 4 12B, annunciata il 3 giugno 2026, si colloca tra i modelli edge della serie E e le varianti più potenti da 26 miliardi di parametri. Google sostiene che il modello permetta ragionamento avanzato, elaborazione multimodale e capacità agentiche su dispositivi dotati di appena 16 GB di memoria unificata o VRAM, una configurazione presente in molti notebook moderni e nei computer Apple Silicon di fascia media.

Architettura encoder-free e audio nativo

La caratteristica tecnica più rilevante di Gemma 4 12B è l’architettura encoder-free.

Nei modelli multimodali tradizionali, immagini e audio vengono elaborati da componenti separati prima di essere convertiti in rappresentazioni utilizzabili dal modello linguistico, con costi computazionali aggiuntivi e maggiore consumo di memoria.