Tu parli in italiano e chi ascolta sente la tua voce in inglese, e viceversa, come se avessi un interprete. Questa nuova funzione di Google Meet, che verrà lanciata prima per gli utenti consumer e successivamente su quelli enterprise è qualche cosa di nuovo. Non si limita a tradurre in tempo reale quello che diciamo mentre siamo in videoconferenza. Imita la nostra voce, il tono e l’espressione. Il risultato è una conversazione autentica e naturale, anche un po’ inquietante perché sembri tu ma non sei tu. Ho provato in anteprima questa novità di Google appena è stata attivata la possibilità di tradurre dall’intaliano all’inglese e viceversa.

Come funziona?

Si basa su Audio LM che è un modello di intelligenza artificiale sviluppato da Google che si concentra sulla generazione di audio di alta qualità e coerente. La sua innovazione principale sta nell’approccio che adotta, che è simile a quello dei modelli linguistici (come GPT-3) per la generazione di testo. Tramite Audio LMSI i può conservare tutto quello che è il contesto della comunicazione, cioè viene preservato il tono, le emozioni e il parlato della persona e questo appunto, permette di avere delle conversazioni che siano più ricche, più empatiche, e più chiare anche nel caso in cui ci sono più voci. Un aspetto importante.