Segui tutte le inchieste del Fatto Quotidiano

Ultimo aggiornamento: 11:52

Una nuova frontiera si apre per la biologia grazie a Evo 2, il più potente modello di intelligenza artificiale generativa applicato allo studio della genetica. Paragonabile a una versione di ChatGPT addestrata non sul linguaggio umano ma sul Dna, il sistema è in grado di analizzare e riscrivere sequenze genetiche, individuare mutazioni all’origine di malattie e progettare nuovi genomi, lunghi quanto quelli di semplici batteri.

Il modello è stato sviluppato dall’Arc Institute insieme a Nvidia, con la collaborazione della Stanford University e delle Università della California di Berkeley e San Francisco. Il progetto, rilasciato inizialmente un anno fa, è stato ora descritto anche in uno studio pubblicato sulla rivista scientifica Nature. Evo 2 è stato addestrato su una quantità senza precedenti di dati genetici: circa 9 mila miliardi di “lettere” del Dna – i nucleotidi – provenienti da 128 mila genomi appartenenti a specie diverse, sia viventi sia estinte. Questa enorme base di conoscenza permette al sistema di interpretare il linguaggio della genetica e di elaborare sequenze complesse.

Rispetto al suo predecessore, Evo 1, presentato nel 2024, il nuovo modello compie un salto di qualità. Se la prima versione era stata addestrata esclusivamente su genomi di organismi unicellulari, Evo 2 include anche quelli di organismi pluricellulari, tra cui esseri umani e piante. In questo modo è in grado di analizzare contemporaneamente sequenze genetiche molto più lunghe, fino a un milione di nucleotidi, individuando anche relazioni nascoste tra parti lontane del genoma.