Si apre una nuova era per la biologia con Evo2, il più potente modello di intelligenza artificiale generativa applicato alla genetica.
E' una sorta di ChatGpt addestrato a comprendere il Dna piuttosto che il linguaggio umano: può analizzare e riscrivere intere sequenze di codice genetico, identificare mutazioni all'origine di malattie e progettare nuovi genomi (lunghi quanto quelli di semplici batteri).
Istruito con 9 mila miliardi di 'lettere' del Dna (nucleotidi) provenienti da 128mila genomi di specie diverse, vive ed estinte, è stato sviluppato dall'Arc Institute e da Nvidia, insieme alla Stanford University e all'Università della California a Berkeley e San Francisco. Il risultato del loro lavoro, rilasciato un anno fa, è ora pubblicato anche sulla rivista Nature.
Se il modello precedente Evo 1 (presentato nel 2024) era stato addestrato interamente su genomi di organismi unicellulari, Evo 2 si basa anche su genomi di organismi pluricellulari, compresi esseri umani e piante. In questo modo può elaborare sequenze genetiche fino a 1 milione di nucleotidi contemporaneamente, arrivando a comprendere anche le relazioni nascoste che intercorrono tra parti distanti di un genoma.
"Il nostro sviluppo di Evo 1 ed Evo 2 rappresenta un momento chiave nel campo emergente della biologia generativa, perché ha permesso alle macchine di leggere, scrivere e pensare nel linguaggio dei nucleotidi", osserva Patrick Hsu, co-fondatore dell'Arc Institute. "Evo 2 ha una comprensione generalista dell'albero della vita che è utile per una moltitudine di compiti, dalla previsione di mutazioni che causano malattie alla progettazione di potenziali codici per la vita artificiale".






