Google DeepMind ha rilasciato da alcuni giorni Veo 3, un nuovo modello di intelligenza artificiale capace di generare video ultra-realistici partendo da semplici descrizioni testuali.

Ma la vera novità è un’altra: per la prima volta, nell’era dell’IA generativa, questi filmati sono accompagnati da un audio sincronizzato che include dialoghi, effetti sonori e rumori ambientali.

Come il passaggio dal muto al sonoro rivoluzionò il cinema negli anni ’20, così Veo 3 promette di trasformare la narrazione visiva generata dall’intelligenza artificiale.

Finora, i modelli text-to-video riuscivano a produrre clip brevi e visivamente credibili, ma senza suono. Ora quel limite è stato superato.

Cos’è Veo 3