Cannes - World model. Modelli di AI in grado di “comprendere il mondo esterno”, spiega Yann LeCun, “nello stesso modo in cui lo fanno esseri umani e animali, che è molto efficiente”. Lo scienziato, fuoriuscito da Meta dopo 12 anni e oggi a capo della startup Ami Labs, lancia la sua visione sul futuro dell’intelligenza artificiale dal palco del Worl AI Cannes Festival (Waicf), un evento sulla tecnologia del momento che si svolge nella città francese del cinema.Venerdì 13 febbraio vento salmastro e pioggia battente fustigano la Croisette, mentre in una sala del centro congressi dove il gotha del cinema si raduna a fine maggio, l'ex scienziato capo in materia di AI di uno dei colossi mondiali della tecnologia, che conta di spendere solo quest’anno tra i 115 e i 135 miliardi di dollari per accelerare lo sviluppo dell’intelligenza artificiale, racconta a una platea di oltre duecento persone perché non creda che il futuro del settore sia in mano agli Llm, i grandi modelli linguistici che fanno funzionare ChatGPT, Gemini o Claude.“Abbiamo bisogno di sistemi che abbiano una memoria persistente, sistemi in grado di pianificare sequenze complesse di azioni, sistemi che sappiano ragionare e che siano capaci di fare lo sforzo necessario per trovare una soluzione a un problema. E poi che siano controllabili e sicuri”, osserva LeCun.Cosa sono i world modelNegli ultimi tempi lo scienziato francese tornato in patria, dopo le dimissioni da Meta a novembre 2025, dà voce a una visione dell’AI che fa a pugni con gli oracoli della Silicon Valley. LeCun, per esempio, non freme all’idea di indovinare la data entro cui gli algoritmi saranno in grado di pensare come un essere umano.“Com’è possibile che un diciassettenne [età in cui si può prendere la patente in Francia, ndr] impari a guidare un’auto con circa 20 ore di pratica, mentre noi abbiamo milioni di dati di addestramento, milioni di ore di guida registrate e nonostante questo non riusciamo ad addestrare un sistema, solo tramite imitazione, a guidare in modo affidabile quanto un essere umano? - si interroga l’esperto al summit francese - Abbiamo sì molte auto che riescono a superare certi test, ma in una certa misura sono soluzioni fragili e, soprattutto, richiedono molto più di 20 ore di pratica”.La risposta che si è dato LeCun è che benché gli Llm siano stupefacenti e riescano a svolgere attività complesse (come complicati calcoli matematici o sfide di programmazione), manca ancora un pezzo importante. “Esiste un grande divario tra le capacità di apprendimento che osserviamo negli esseri umani e negli animali e il tipo di efficienza che riusciamo a riprodurre nelle macchine”, osserva.Secondo i suoi calcoli, un bambino di quattro anni ha elaborato solo attraverso la vista molti più dati di quanto ne abbiano digeriti i grandi modelli di AI. E insiste che gran parte dell’intelligenza umana si forma attraverso informazioni non verbali, che sono invece l’ingrediente principale dei grandi modelli linguistici. Per LeCun il futuro non sono tanto gli Llm, ma i world model. Sistemi in grado di raggiungere quel livello di astrazione e percezione che ha l’essere umano del mondo e che sono necessari per consentire ai robot umanoidi di agire in maniera strutturata nel mondo.L'alba di un nuovo businessNon è l’unico a pensarla così. Anche Fei Fei Li, la scienziata che ha costruito ImageNet, il dataset principale per il training dei sistemi di computer vision, ha costituito una startup nel settore dei world model, World Labs. Dopo il lancio del primo prodotto, Marble, per la costruzione di mondi 3D, la società viaggia a una valutazione di 5 miliardi.La creatura di LeCun, invece, Ami Labs (dove Ami sta per Advanced machine intelligence), ha appena sollevato il sipario sulla sua missione e raccolto finora 500 milioni di euro di investimenti. “Le architetture generative addestrate tramite apprendimento auto-supervisionato per prevedere il futuro hanno avuto un successo straordinario nella comprensione e nella generazione del linguaggio - si legge sul sito -. Tuttavia, gran parte dei dati provenienti dai sensori del mondo reale è imprevedibile e gli approcci generativi non funzionano bene in questi contesti. Ami Labs sta sviluppando world model che apprendono rappresentazioni astratte dei dati sensoriali del mondo reale, ignorando i dettagli imprevedibili, e che formulano previsioni nello spazio delle rappresentazioni”.La società sta reclutando talenti. La competizione inizia a surriscaldarsi anche lungo questo sentiero ancora poco battuto dagli imprenditori. Non ci sono proiezioni di mercato che stimino il giro d’affari dei world model. Se rimaniamo all’esempio di LeCun, ossia all’automazione applicata alle vetture, il centro studi Markets&Markets stima che si possa passare dai 10 miliardi di dollari a livello globale del 2024 ai 27 del 2032. E questa è solo una delle tante declinazioni delle capacità di questi modelli.La discesa in campo dei world model scompagina la narrazione che aveva appiattito la corsa all’oro dell’AI solo sugli Llm. Corsa che l’Europa, nonostante alcuni campioni locali, come la francese Mistral, guarda dalle retrovie. Spostare l’orizzonte della gara dai grandi sistemi linguistici a una nuova categoria di intelligenze artificiali riaccende la competizione.Perché se il traguardo è quell’AI fisica, incorporata nei robot umanoidi, sull’altare della quale Elon Musk ha sacrificato le linee produttive di alcuni modelli di Tesla e che la Cina sta spingendo nelle sue fabbriche, allora c’è ancora tanto lavoro da fare per arrivare ai modelli giusti con cui farla funzionare.Al Forum economico mondiale il numero uno di Nvidia, Jensen Huang, ha ammonito l’Europa: l’AI fisica è il sentiero che l’industria continentale deve percorrere per tornare a competere. “Noi dobbiamo guardare ai limiti della tecnologia attuale e lì troviamo opportunità per un vero sviluppo”, chiosa alla presentazione del piano industriale dell’Istituto italiano dell’intelligenza artificiale (AI4I) Alberto Sangiovanni Vincentelli, una lunga carriera nel design dei semiconduttori e oggi, tra le altre cose, presidente della Fondazione Chips.it, l’ente nazionale italiano deputato allo sviluppo del settore. Né i colossi statunitensi né quelli cinesi stanno alla finestra. I world model interessano a tutti. Anche Google Deepmind e Meta ci stanno lavorando.Pensare in piccoloSe i world model inducono a pensare in grande, l’altro approccio con cui l’Europa può smarcarsi dalla stretta di Stati Uniti e Cina è farlo in piccolo. Think small, come recitava la memorabile campagna pubblicitaria del Maggiolone della Volkwagen nel 1959, quando la casa automobilistica tedesca cercava nuovi linguaggi per recuperare vendite sul mercato statunitense.La parola magica in questo caso è Small language model, Slm. Se non puoi battere i campioni a stelle e strisce sulla dimensione, sfidali sulla specializzazione, con modelli concentrati su materie specifiche, allenati con un volume inferiore di dati (ma più verticali). Meno cari quando arriva la bolletta dell'energia e più semplici da inserire nei processi di lavoro in azienda.“Quello che abbiamo visto in questi ultimi due anni è che i grandi modelli non ti risolveranno tutti i problemi - spiega a Wired Filipe Teixeira, ad di AltermAInd, startup specializzata in sistemi di AI per i processi aziendali -. Anzi, ti portano problemi di costi, scalabilità, stabilità del dato. Avere modelli più specifici, quindi più efficienti e più mirati su casi d'uso, processi e obiettivi del problema da risolvere è un campo sul quale noi europei ci possiamo concentrare”.Teixeira risponde alle domande di Wired nello stand della sua società al festival di Cannes, dove ritorna a un anno e qualche mese dalla fondazione, dopo la vendita a fine 2024 del 52% dello newco da parte della banca digitale Illimity. “Oggi il discorso è molto legato ai grandi modelli, ma rispetto al mercato consumer - osserva l'ad - che non è quello del B2B o delle aziende. Le aziende non devono affrontare solo la digital transformation ma anche la legacy modernization di blocchi tecnologici che hanno 20-30 anni. Le aziende stanno affrontando una realtà completamente diversa da quella di cui si parla quando ci si riferisce agli Llm”. “Oggi con investimenti molto contenuti puoi portare un cambiamento dell'azienda rispetto a uno specifico business case e con un ritorno incredibilmente elevato”, aggiunge.“Gli small language model richiedono meno risorse finanziarie, tecniche, computazionali e anche meno dati. Caratteristiche che li rendono più accessibili di sicuro per le startup o le piccole aziende ma anche per le grandi che vogliono investire una cifra ragionevole per farsi un modello da usare all'interno dei propri sistemi”, gli fa eco Alexio Cassani, fondatore della startup milanese Fairmind, specializzata in agenti.Pochi giorni prima di arrivare in Costa Azzurra, Cassani e la sua azienda hanno lanciato sul mercato BankGPT. Un caso scuola di Slm. È un modello verticale per il settore bancario, che opera attraverso agenti specializzati nel gestire il flusso di lavoro in finanza. Fairmind, che ha avuto il supporto della banca Crédit Agricole nell’ambito di un programma europeo, è partita da un modello open source attraverso cui ha addestrato il suo Slm.“Creare un modello verticale significa che costa meno addestrarlo e soprattutto costa meno farlo funzionare - spiega Cassani -. Ed essendo piccolo, lo puoi installare sulle tue macchine. Questo vuol dire che hai in locale tutti i dati e che puoi usare questi strumenti anche quando non c’è connettività”. “La ricetta della carbonara non te la dice benissimo - ironizza l’imprenditore -. Però se gli passi un documento bancario e gli chiedi di fare un raffronto, lo fa con una qualità molto alta, paragonabile a quella che potrebbe avere un modello di frontiera. Con la differenza, però, che quel modello è tuo”.La strada europea alla specializzazionePer quanto piccoli nelle dimensioni dei parametri e nel fabbisogno di energia, gli Slm sono un boccone ghiotto per l’industria tech. Secondo il centro studi Grand view research il mercato arriverà a valere 20 miliardi di dollari a livello mondiale nel 2030, con un tasso di crescita annuale del 15%. D’altronde, secondo uno studio di Nvidia, una quota che va dal 40% al 70% delle operazioni quotidiane che oggi affidiamo all’AI può essere eseguita da Slm senza perdere efficacia. Tant’è che gli stessi big del settore stanno valorizzando i loro grandi modelli con formule più verticali.Specializzarsi conta. “Per alcuni casi d’uso la discussione si sia spostando dal semplice ‘qual è il modello più grande?’ a ‘qual è il modello giusto?’" - osserva Edward Crook, vicepresidente alla strategia e all’operatività di DeepL, startup tedesca di AI specializzata in traduzione -. Molte imprese stanno capendo che non vogliono un modello linguistico “tuttofare”, ma strumenti specialistici su cui poter contare per svolgere un compito specifico in modo eccellente. Ed è proprio qui, a mio avviso, che l’Europa ha un’ottima posizione da cui competere”.Fondata nel 2017 a Colonia, DeepL è oggi uno degli unicorni europei dell’intelligenza artificiale. In un campo affollato, quale quello della traduzione, e dove c’è un coinquilino ingombrante, per dimensione e diffusione: Google. Per Crook è un problema relativo: “Se devo tradurre il menù di un ristorante, Google Translate va benissimo. Però ci sono alcuni casi, soprattutto in ambito business, in cui non basta. È necessario essere davvero certi che precisione e accuratezza siano elevate, e bisogna anche avere la sicurezza che i dati, spesso sensibili, siano crittografati e protetti, e che i clienti possano fare affidamento su di te”.Intervenendo a Cannes sul futuro del settore, il manager elenca tutta una serie di servizi legati alla traduzione in cui la partita è tutt’altro che conclusa. Come suggerimenti sul tono o sulle stile. In questo caso servono “sistemi consapevoli del contesto”, attraverso l’addestramento su dataset specializzati e sul gergo aziendale. Fatto per esempio di acronimi, di un lessico tecnico e di abbreviazioni comprensibili solo se mastichi quella materia. O ancora, servizi vocali. DeepL ha appena lanciato un’app di trascrizione in tempo reale. “In questo caso conta la latenza - dice Crook -. Vuoi qualcosa che traduca velocemente. Ma se ti affidi a un grande modello linguistico i dati devono fare il giro del mondo per essere elaborati, allora ci sarà un ritardo nei tempi di risposta”.Vista da una Cannes fuori stagione, in un palazzo dove al posto degli abituali defilée del jetset internazionale robot umanoidi di Unitree improvvisano coreografie dozzinali (anche con qualche incidente di percorso), l’Europa può ancora colmare tanti settori negletti nell’AI oltre ai famigerati Llm. E il festival, sviluppato dall’Istituto EuropIA, un centro di promozione dell’intelligenza artificiale presieduto da Marco Landi, ex presidente di Apple, vuole diventare un momento in cui questa comunità si incontra. Nei corridoi del Palais des festivals et des congrés è forte la retorica di non arrendersi agli Stati Uniti. Di rispondere come industria. È stata persino confezionata una carta di Cannes per difendere i valori europei.Il secondo tempo dell'EuropaValori che devono tradursi in leve business per non soccombere al potere straordinario dei titani della Silicon Valley. “L'approccio Silicon Valley funziona fino a un certo punto”, chiosa Michele Laurelli, fondatore di Algoretico, una startup che sviluppa algoritmi specializzati. Per l’imprenditore quell’approccio può funzionare fino a un certo punto in Europa, dove ci sono “aziende che hanno know-how ad altissimo valore aggiunto” e che spesso sono diverse le une dalle altre. Alle quali servono, dice Laurelli, “modelli che ricalchino quel know-how, small nel senso che sappiano fare cose molto specifiche”.“In Europa abbiamo molto a cuore il concetto della privacy e della riservatezza del dato - chiosa Laurelli -. Non solo del dato sensibile ma anche del dato privato, cioè il fatto che il mio know-how aziendale non venga assorbito. Perciò la dimensione del modello deve stringersi per forza. È una direzione naturale”.Dopo essere rientrati da Cannes, Laurelli ha condiviso con Wired un documento per raccontare di un progetto sviluppato in azienda, il Talent-conditioned transformer (Tct), ossia un profilo di preferenze strutturali che influenzano la maniera in cui il modello “generalista” elabora le informazioni. Facendolo lavorare come se avesse un “talento” specifico. “L'abbiamo provato su chimica, fisica e coding e il risultato è sempre di performance maggiori della media”, osserva Laurelli.Insomma, torniamo sempre alla specializzazione. Trovare il modello più adatto per risolvere un problema. Vale per le rampanti startup del settore. Vale per le aziende più grandi di digitalizzazione. “Il tema non è solo individuare quale sia la tecnologia migliore per risolvere un problema ma è soprattutto risolvere il problema stesso. Significa identificare le aree di business che possono diventare più efficienti o, ancora meglio, generare nuove opportunità di business”, osserva Giuseppe Di Franco, amministratore delegato di Lutech, dal suo stand al Waicf.Il gruppo, che conta seimila persone e un miliardo di fatturato, guarda a proiettare questa strategia a livello continentale. “Stiamo scommettendo in maniera significativa sulla Spagna, dove abbiamo già 400 persone e un business in fortissima crescita - dice l’ad -. Faremo un secondo secondo importante investimento dell'Europa centrale. Poi stiamo utilizzando come piattaforma di near shore l'Albania”. E chiosa: “Noi abbiamo l'ambizione di essere una piattaforma europea, quindi noi ci crediamo in maniera ferma nel fatto che il futuro dell'Europa sarà sul digitale”.La partita non è ancora terminata. Se il primo tempo, quello degli Llm, lo hanno vinto a mani basse Stati Uniti e Cina, siamo al fischio di inizio di un secondo tempo il cui esito è da scrivere. “Se vi interessa solo generare testo e codice”, dice LeCun, sono sufficienti i modelli esistenti. Ma attenzione, avverte: “Ci sarà molta competizione”. “Ma se siete davvero interessati a fare il passo successivo”, ossia avvicinarsi all’efficienza del ragionamento umano, che poi è la strada della sua Ami Labs, “allora probabilmente dovreste seguire queste raccomandazioni e queste condizioni”, ammonisce davanti a una slide che riepiloga i processi che sta studiando per i world model. “Credo che questo porterà forse alla prossima rivoluzione nel mondo - chiosa -. Non abbiamo ancora finito”.
Perché i world model e i piccoli modelli linguistici sono la nuova speranza dell'Europa per dire la sua nel grande business dell'intelligenza artificiale
Nel primo caso parliamo di una tecnologia tutta da scrivere, a cui lavora Yann LeCun per trovare un'AI che sappia comprendere il mondo. Nel secondo della specializzazione degli algoritmi per funzionare meglio nelle imprese. Due strade che ridanno fiato alla corsa tecnologica del secolo nel Vecchio continente








