AlphaFold, il sistema di intelligenza artificiale sviluppato da Google DeepMind, ha appena spento cinque candeline. In questi ultimi anni ve ne abbiamo raccontato, periodicamente, i successi: se nel 2020 dicevamo che “potrebbe cambiare il mondo della biologia”, poco più tardi il condizionale è diventato indicativo, e infine, lo scorso anno, è arrivato il Nobel. Sebbene sia difficile individuare il momento preciso in cui la biologia ha smesso di essere una disciplina puramente sperimentale per diventare, almeno in parte, computazionale, certo è che il debutto di AlphaFold, nel novembre 2020, ha segnato un punto di svolta fondamentale. Fino ad allora, DeepMind era famosa soprattutto per aver insegnato a un’intelligenza artificiale a battere i campioni umani nell’antico gioco del Go. Poi, improvvisamente, ha cominciato a giocare a qualcosa di più serio: gli stessi algoritmi di apprendimento profondo usati per spostare le pedine sulla scacchiera sono stati puntati contro uno dei problemi più ostici della scienza moderna, ossia il ripiegamento delle proteine. Il risultato è stato AlphaFold2, un sistema capace, per l’appunto, di prevedere la forma tridimensionale delle proteine con accuratezza atomica, il cui lavoro è culminato nella compilazione di un database che a oggi contiene oltre 200 milioni di strutture predette, essenzialmente l’intero universo proteico conosciuto, ed è utilizzato da quasi 3 milioni e mezzo di ricercatori in 190 paesi del mondo. L’articolo di Nature pubblicato nel 2021 contenente la descrizione dell’algoritmo è stato a oggi citato 40mila volte, e a differenza di altri lavori che hanno raggiunto gli stessi picchi (per esempio molti dei paper relativi al Covid-19), i numeri non sono mai calati nel tempo. Ciliegina sulla torta, come dicevamo, l’assegnazione del Nobel per la Chimica 2024, da parte dell’Accademia reale svedese, a David Baker, Demis Hassabis e John Jumper, due delle menti dietro questa rivoluzione. Sempre lo scorso anno è arrivato AlphaFold3, che ha esteso le capacità dell’intelligenza artificiale anche a dna, rna e farmaci: una transizione che non è priva di sfide (come per esempio le “allucinazioni strutturali” nelle regioni disordinate delle proteine, studiate con attenzione dall’Università di Padova) ma che segna il passo verso il futuro. Per capire cosa ci aspetta nei prossimi cinque anni abbiamo chiesto delucidazioni a Pushmeet Kohli, vicepresidente di ricerca a DeepMind e architetto della divisione Ai for Science. Ecco cosa ci ha raccontato.Pushmeet KohliBen Peter CatchpoleDottor Kohli, l’arrivo di AlphaFold2, cinque anni fa, è stato definito “il momento iPhone” per la biologia. Ci racconta il passaggio dalle sfide al gioco del Go a un problema scientifico fondamentale come il ripiegamento delle proteine, e qual è stato il suo ruolo in questo passaggio?Fin dal primo giorno, la scienza è stata centrale nella nostra missione. Demis Hassabis ha fondato Google DeepMind con l’idea che l’intelligenza artificiale potesse essere il migliore strumento mai inventato per accelerare la scoperta scientifica. I giochi sono sempre stati un terreno di prova, e un modo per sviluppare tecniche che sapevamo sarebbero poi state utile anche per affrontare problemi del mondo reale. Il mio ruolo è stato quello di identificare e perseguire problemi scientifici in cui l’intelligenza artificiale può avere un impatto trasformativo, delineare gli ingredienti chiave (modelli, dati, eccetera) necessari per sbloccare il progresso e riunire un team multidisciplinare per lavorare su queste grandi sfide. Ciò che AlphaGo ha mostrato è che le reti neurali, combinate con la pianificazione e la ricerca, potevano padroneggiare sistemi incredibilmente complessi, proprio come il protein folding. La differenza cruciale stava nel fatto che risolvere questo problema avrebbe “sbloccato” scoperte in biologia e medicina che potevano migliorare concretamente la vita delle persone. Ci concentriamo su quelli che chiamo “problemi nodo-radice” [root node problems], aree per cui la comunità scientifica è concorde nel pensare che le soluzioni sarebbero trasformative e non raggiungibili in tempo utile con approcci “convenzionali”. Pensatelo come un albero della conoscenza: se risolvete questi problemi alla radice, sbloccate interi nuovi rami di ricerca. Ecco: il protein folding era uno di questi. Ciò che mi emoziona di più, però, è quello che verrà dopo. Siamo ancora ai primi capitoli della scoperta scientifica guidata dall’intelligenza artificiale. Guardando in avanti, vedo tre aree chiave: costruire modelli più potenti che possano veramente ragionare e collaborare con gli scienziati come partner di ricerca, mettere questi strumenti nelle mani di tutti gli scienziati del pianeta, e affrontare ambizioni ancora più audaci, come creare la prima simulazione accurata di una cellula umana completa, il che potrebbe rivoluzionare la medicina.Parliamo di allucinazioni. Ha sostenuto più volte l’importanza di un’architettura “imbracata” [harness], per accoppiare un modello generativo creativo a un verificatore rigoroso. È questo che avete provato a implementare in AlphaFold 3, specialmente alla luce del fatto che, rispetto al suo predecessore, fa uso di modelli più “immaginativi” ed è quindi più incline alle allucinazioni?La filosofia centrale non è cambiata. Accoppiamo ancora la generazione creativa alla verifica rigorosa. Ciò che si è evoluto è come applichiamo questo principio a problemi più ambiziosi. In questo senso, il passaggio ai nuovi modelli di diffusione di AlphaFold 3 è derivato dalle richieste della scienza: avevamo bisogno di prevedere come proteine, dna, rna e piccole molecole interagiscono insieme, non solo il comportamento delle singole strutture proteiche. Il problema delle allucinazioni con modelli di diffusione più “immaginativi” è reale, e quindi la verifica diventa un punto ancora più critico. Abbiamo integrato nuovi punteggi di confidenza che ci segnalano quando le previsioni potrebbero essere meno affidabili, il che è particolarmente importante, per esempio, con le cosiddette proteine intrinsecamente disordinate. Ma ciò che convalida davvero l’approccio è che, in oltre cinque anni, gli scienziati hanno più volte testato le previsioni di AlphaFold nei loro laboratori. E si fidano perché funziona.L’arrivo di AlphaFold 3 ha segnato anche un cambiamento strategico: prima del rilascio “accademico” a novembre 2024, l’accesso al codice è stato ristretto per proteggere gli interessi commerciali di Isomorphic Labs [la spin-off di Google che si occupa di scoperta di nuovi farmaci, il cui Ceo è Demis Hassabis]. Crede che l’era della open science stia per finire, nel momento in cui strumenti come questo sono in grado di progettare farmaci dal valore di miliardi di euro? Come bilanciamo la conoscenza pubblica con gli interessi privati?L’impatto di AlphaFold 3 è legato alla capacità dei biologi di usarlo facilmente. Ecco perché abbiamo dato priorità allo sviluppo di AlphaFold Server. A questo è seguito il lavoro per rendere disponibili i pesi del modello online, cosa che ci ha richiesto un po’ di tempo. Ora, il modello e il codice di AlphaFold 3 sono disponibili per consentire ai ricercatori accademici di beneficiare delle sue piene capacità per uso non commerciale, in particolare abilitando le cosiddette previsioni ad alto rendimento. Non vediamo l’ora di scoprire come faranno avanzare la scoperta scientifica.State lanciando anche il programma Ai Co-scientist, un sistema basato su agenti che propongono e discutono ipotesi, premiando le migliori. È come avere tanti agenti-scienziati in un chip. Cosa succederà in futuro? Pensa sia plausibile uno scenario in cui il primo ricercatore di un progetto sia un’Ai?Certamente sta cambiando il modo in cui gli scienziati impiegano il proprio tempo. Finora hanno sempre svolto un ruolo doppio: pensare a quale problema necessita di soluzione e poi capire come risolverlo. Ora l’intelligenza artificiale aiuta sempre più nella parte del come, e gli scienziati avranno più libertà (e tempo) di concentrarsi sul cosa, o su quali domande valga davvero la pena porre. L’intelligenza artificiale può accelerare la scoperta di nuove soluzioni, a volte quasi autonomamente, ma la decisione di quali problemi siano importanti rimane fondamentalmente umana. Tra cinque anni, l’intelligenza artificiale giocherà un ruolo importante in quasi ogni svolta scientifica, ma non farà scoperte da sola. Le priorità di ricerca continueranno a essere modellate da ciò che accade nel mondo, che si tratti di combattere la prossima pandemia più efficacemente o trovare nuovi approcci alla resistenza agli antibiotici. Co-scientist è progettato con questa partnership in mente: è un sistema multi-agente costruito con Gemini 2.0 che agisce come un collaboratore virtuale, identificando lacune nella ricerca, generando ipotesi e suggerendo approcci sperimentali. Ma sono sempre gli scienziati umani a progettare gli esperimenti di validazione e a coglierne il significato per la salute globale. Il punto veramente importante è comprendere questi strumenti correttamente, sia i loro punti di forza che i loro limiti. Quella comprensione è ciò che abilita gli scienziati a usarli responsabilmente ed efficacemente.È intrigante pensare a uno scenario in cui questi “agenti-scienziati virtuali” siano in disaccordo. È mai capitato?Il modo in cui funziona il sistema è piuttosto interessante. Come dicevo, abbiamo molteplici modelli Gemini che agiscono come agenti diversi che generano idee, poi dibattono e criticano le ipotesi l’uno dell’altro. L’idea è che questo botta e risposta interno, esplorando diverse interpretazioni delle prove, porti a proposte di ricerca più raffinate e creative. Per esempio, i ricercatori all’Imperial College stavano indagando come certi “fagi pirata”, virus in grado di “dirottare” altri virus, riescano a irrompere nei batteri. Comprendere questi meccanismi potrebbe aprire modi interamente nuovi di affrontare le infezioni resistenti ai farmaci, che è ovviamente un’enorme sfida per la salute globale. Ciò che Co-scientist ha portato a questo lavoro è stata la capacità di analizzare rapidamente decenni di ricerca pubblicata e arrivare indipendentemente a un’ipotesi sui meccanismi di trasferimento genico batterico che corrispondeva a ciò che il team dell’Imperial aveva impiegato anni a sviluppare e validare sperimentalmente. Abbiamo visto risultati simili nel riposizionamento dei farmaci: il sistema ha suggerito un uso nuovo per trattare la fibrosi epatica, che ha mostrato risultati promettenti sia negli esperimenti computazionali che in quelli di laboratorio. Ciò che stiamo vedendo realmente è che il sistema può accorciare significativamente la fase di generazione delle ipotesi, sintetizzando vasti quantitativi di letteratura velocemente, mentre i ricercatori umani progettano ancora gli esperimenti e capiscono cosa significhino realmente le scoperte per i pazienti.Guardando ai prossimi cinque anni, oltre alle proteine e ai materiali, qual è il “problema irrisolto” che spera di vedere risolto con l’aiuto di questi strumenti?Ciò che mi entusiasma più di tutto è comprendere come le cellule funzionino come sistemi completi, e decifrare il genoma è fondamentale per questo. Il dna è il ricettario della vita, e le proteine sono gli ingredienti. Se riusciamo davvero a capire cosa ci rende diversi geneticamente e cosa succede quando il dna cambia, sblocchiamo nuove straordinarie possibilità. Non solo medicina personalizzata, ma potenzialmente nuovi enzimi per affrontare il cambiamento climatico e altre applicazioni che si estendono ben oltre la sanità. Detto questo, simulare un’intera cellula è uno degli obiettivi maggiori della biologia, ma è ancora un po’ lontano. Come primo passo, dobbiamo capire la struttura più interna della cellula, il suo nucleo: quando viene letta ogni parte del codice genetico, come vengono prodotte le molecole di segnalazione portando infine all’assemblaggio delle proteine. Una volta esplorato il nucleo, possiamo lavorare dall’interno verso l’esterno. Ci stiamo provando, ma ci vorranno ancora diversi anni. Se potessimo simulare affidabilmente le cellule, potremmo trasformare medicina e biologia. Potremmo testare candidati farmaci ancora prima della sintesi, capire i meccanismi della malattia a livello fondamentale e progettare trattamenti personalizzati. Questo è davvero il ponte tra simulazione biologica e realtà clinica: muoversi dalle previsioni computazionali a terapie reali che aiutano i pazienti.
AlphaFold compie cinque anni. Pushmeet Kohli, VP di DeepMind: “Tra cinque anni l’Ai in ogni ricerca scientifica, ma mai da sola”
Dalla soluzione del folding proteico al Nobel per la Chimica, una breve storia dell’algoritmo che sta trasformando la biologia in una disciplina digitale. E ora punta a una simulazione completa della cellula







