La secuenciación genómica ha revolucionado el diagnóstico de enfermedades raras, pero la mayoría de pacientes sigue sin obtener una respuesta a tiempo o concluyente. Cada genoma contiene miles de variantes y encontrar cuál de ellas está causando una patología es, en palabras de la investigadora Mafalda Dias, “como buscar una aguja en un pajar”. Para afrontar este reto, el equipo de la científica del Centre de Regulació Genòmica (CRG) ha desarrollado popEVE, presentado en Nature Genetics, un modelo computacional que prioriza las variantes genéticas más relevantes a partir de su evolución biológica.Estudiar el árbol de la vidaMafalda Dias es investigadora en el Centre de Regulació Genòmica (CRG) de Barcelona, donde codirige un laboratorio de genómica computacional y modelos de aprendizaje. Doctora en Física Teórica por la Universidad de Sussex, ha trabajado en el Sincrotrón Alemán de Electrones (DESY) y en la Escuela de Medicina de Harvard. Inició su carrera en cosmología teórica y física del universo temprano, antes de trasladar su interés hacia la biología computacional. Actualmente trabaja en el desarrollo de métodos de aprendizaje automático para interpretar la variación genética y entender sus implicaciones en evolución y enfermedad.¿Qué hereda popEVE del modelo anterior, EVE?La idea era crear un modelo útil para el diagnóstico genético, capaz de identificar entre miles de variantes cuáles son las pocas que realmente causan una enfermedad, algo especialmente importante en enfermedades raras, donde muchos pacientes tardan años en obtener un diagnóstico. Con EVE aprendimos a detectar patrones conservados en proteínas a lo largo del árbol de la vida, comparando especies muy distintas, desde gusanos hasta ballenas. Si una variante rompe uno de esos patrones preservados durante millones de años de evolución, probablemente afecta a la función de la proteína y puede estar asociada a enfermedad. El límite de EVE era que analizaba proteína por proteína y no permitía comparar la severidad entre variantes; popEVE nace precisamente para eso: ordenarlas según su gravedad analizando el proteoma completo.¿Cómo funciona popEVE?El modelo combina dos tipos de información: la observada en especies animales y la observada en población humana. El objetivo es capturar la severidad de una variante. En la práctica, cuando un paciente llega al hospital, el médico ya tiene sospechas sobre ciertos genes implicados según los síntomas. PopEVE no sustituye el diagnóstico clínico, pero sí puede agilizarlo ofreciendo una evidencia adicional.“Observamos lo que la naturaleza ha seleccionado y eso nos enseña muchísimo”¿Por qué es importante analizar el proteoma completo?Porque muchas veces no sabes de antemano qué gen está implicado. Es casi un trabajo de detective. En enfermedades raras puede que solo existan diez casos descritos en el mundo o que ese sea el primero. Si se analizan únicamente los genes ya conocidos, pueden pasarse por alto variantes relevantes. Una visión completa del proteoma permite identificar incluso genes que nunca antes se habían relacionado con una enfermedad. Estamos observando millones de años de evolución para diagnosticar enfermedades raras.¿Cómo corrigen el sesgo por la mayor presencia de datos de personas blancas y europeas?La clave está en que el modelo aprende del árbol de la vida. Observa qué funciones proteicas han sido seleccionadas en especies muy distintas, no en una población humana concreta. Además, no analizamos la frecuencia exacta de las variantes, sino simplemente si están presentes o no. Esto evita que el modelo haga sobreajuste sobre una población específica.Ya están trabajando con hospitales en Senegal. ¿Cómo surgió esta colaboración?Existe un vacío enorme de información genética en África. Estamos colaborando con el médico Pedro Rodríguez en Dakar y estamos viendo que, incluso en patologías compartidas con pacientes europeos, la base genética puede ser completamente distinta. Es un mundo genético todavía muy poco explorado.En el estudio mencionan el caso de un niño con una enfermedad neuromuscular.Con modelos anteriores no conseguían encontrar la variante que provocase claramente la enfermedad. Con popEVE identificaron una que destacaba como mucho más patogénica que el resto. Y, de manera excepcionalmente positiva, se trataba de una enfermedad con tratamiento muy sencillo: una suplementación vitamínica.“popEVE puede ayudar a hacer el diagnóstico genético más justo y democrático”¿popEVE es accesible para hospitales con pocos recursos?Absolutamente. Nuestra idea es desarrollar conocimiento abierto y útil para la práctica clínica real. Creo que este tipo de herramientas puede ayudar a hacer el diagnóstico genético más justo y democrático.¿De dónde salen los datos de los que se nutre popEVE?Utilizamos recursos públicos que contienen secuencias completas de organismos muy diversos. Ahora estamos entrando en proyectos que quieren secuenciar todas las especies eucariotas del planeta. Estamos analizando la diversidad del ADN y usando esta información para comprender enfermedades humanas. Es un recordatorio de la importancia de proteger la biodiversidad. Observamos lo que la naturaleza ha seleccionado y eso nos enseña muchísimo.¿En qué etapa se encuentra el proyecto?Estamos mejorando su aplicación clínica junto a hospitales como Sant Joan de Déu y nuestros colaboradores en Senegal. Queremos ampliar el modelo hacia enfermedades complejas, donde intervienen muchas variantes y factores de riesgo. También nos interesa entender no solo si una variante es patogénica, sino en qué órgano afecta, en qué etapa de la vida y mediante qué mecanismo. Eso podría ayudar muchísimo tanto al diagnóstico como al desarrollo de terapias más precisas.