Storia in 18 fonti

DiffusionGemma: How Google's New Open LLM Hits 1,000 Tokens/sec and Changes Inference Economics

DiffusionGemma generates text up to 4x faster than autoregressive LLMs, hits 1,000+ tokens/sec on a single H100, and runs on a consumer RTX 4090. Here is what changed, what the trade-offs are, and how to deploy it today.

Raccontata da

newsbytesapp.com+6 altre

Confronto fonti

6 prospettive sulla stessa storia

AI · summaries

dev.toStai leggendo1 mese fa

DiffusionGemma: How Google's New Open LLM Hits 1,000 Tokens/sec and Changes Inference Economics

originale

Timeline cronologica

mercoledì 10 giugno 2026·cryptobriefing.com
DiffusionGemma offers 4x faster output with simultaneous text generation
DiffusionGemma generates text up to 4x faster than traditional models by producing entire blocks simultaneously, achieving roughly 1,479 tokens per second.
mercoledì 10 giugno 2026·blogs.nvidia.com
NVIDIA Accelerates Google DeepMind’s DiffusionGemma for Local AI
The new DiffusionGemma open model generates text in parallel — not one token at a time — and is optimized to run on the NVIDIA RTX PRO platform, NVIDIA DGX Spark systems and…

DiffusionGemma: How Google's New Open LLM Hits 1,000 Tokens/sec and Changes Inference Economics

Confronto fonti

DiffusionGemma: How Google's New Open LLM Hits 1,000 Tokens/sec and Changes Inference Economics

Timeline cronologica

DiffusionGemma offers 4x faster output with simultaneous text generation

NVIDIA Accelerates Google DeepMind’s DiffusionGemma for Local AI

Google's DiffusionGemma AI Hits 1,000 Tokens Per Second—And It's Free - Decrypt

Google AI Releases DiffusionGemma, a 26B MoE Open Model Using Text Diffusion for Up to 4x Faster Generation

Google's new open model DiffusionGemma generates text from noise instead of word by word

Google launches DiffusionGemma open model for faster local AI workflows

Google open-sources speedy DiffusionGemma text diffusion model - SiliconANGLE

Run DiffusionGemma on NVIDIA for Developer-Ready, High-Throughput Text Generation | NVIDIA Technical Blog

DiffusionGemma: 4x faster text generation

Google launches DiffusionGemma open model for faster local AI workflows

Google AI Releases DiffusionGemma, a 26B MoE Open Model Using Text Diffusion for Up to 4x Faster Generation

Google's new open model DiffusionGemma generates text from noise instead of word by word

Google's latest DiffusionGemma open AI model comes with a 4x speed boost

Google's DiffusionGemma AI Hits 1,000 Tokens Per Second—And It's Free - Decrypt

Gemini Diffusion

谷歌推出DiffusionGemma开源模型-36氪

Google open-sources speedy DiffusionGemma text diffusion model - SiliconANGLE

Google's latest AI model creates text like an image generator

DiffusionGemma sfida gli LLM tradizionali: generazione parallela e fino a 4 volte più veloce su GPU

Google Releases DiffusionGemma: Parallel Block Decoding

Google rilascia DiffusionGemma, il modello open che genera testo “come le immagini”

Google's DiffusionGemma runs text 4x faster

Google unveils DiffusionGemma, an AI model that breaks free of left-to-right processing

Google tiene una nueva IA que escribe texto mucho más rápido: así funciona DiffusionGemma

DiffusionGemma: How Google's New Open LLM Hits 1,000 Tokens/sec and Changes Inference Economics