Google DeepMind ha rilasciato da alcuni giorni Veo 3, un nuovo modello di intelligenza artificiale capace di generare video ultra-realistici partendo da semplici descrizioni testuali.
Ma la vera novità è un’altra: per la prima volta, nell’era dell’IA generativa, questi filmati sono accompagnati da un audio sincronizzato che include dialoghi, effetti sonori e rumori ambientali.
Come il passaggio dal muto al sonoro rivoluzionò il cinema negli anni ’20, così Veo 3 promette di trasformare la narrazione visiva generata dall’intelligenza artificiale.
Finora, i modelli text-to-video riuscivano a produrre clip brevi e visivamente credibili, ma senza suono. Ora quel limite è stato superato.
Cos’è Veo 3










