di
Sergio Donato
Il nuovo modello audio di Gemini traduce mentre si parla, anche in ambienti rumorosi, e mantiene intonazione e ritmo. Debutta su Android, iOS, e Google Meet per le aziende
Proprio in tempo per le vacanze estive, Google ha presentato Gemini 3.5 Live Translate, un modello audio per la traduzione vocale simultanea che riconosce automaticamente più di 70 lingue e genera una voce tradotta conservando intonazione, ritmo e tono di chi parla. Funziona anche in Google Traduttore per iOS e Android.
A differenza dei sistemi turno per turno, che attendono la fine della frase prima di rispondere, il modello produce parlato in modo continuo e resta pochi secondi dietro all'oratore. Google ha dichiarato anche una buona resa negli ambienti rumorosi, e l'audio generato porta la filigrana SynthID, non percepibile all'ascolto.










