Hay un momento, en cualquier disciplina, en el que una idea deja de ser la ocurrencia de un grupo y empieza a parecer inevitable. Una de las señales más claras de que eso está pasando es cuando dos equipos que no se conocen, que no se citan y que trabajan en ciudades distintas, llegan casi al mismo tiempo a la misma conclusión. Cuando dos personas tienen la misma idea por separado, suele ser porque la idea ya estaba "madura" en el aire. Esta semana ocurrió algo así en uno de los rincones más activos de la inteligencia artificial: cómo razonan los modelos de lenguaje.

Dos grupos independientes —uno en la Universidad del Sur de California (USC) y otro en Carnegie Mellon (CMU)— propusieron, casi en paralelo, la misma manera de entender el razonamiento de una IA: pensar no como una búsqueda, sino como una caída hacia un punto de equilibrio. Para entender por qué eso es interesante, primero vale la pena ver de dónde venimos.

El problema: hacer que una IA "piense más" es caro

Cuando hoy le pedimos a un modelo que resuelva algo difícil, el truco más común es dejarlo "pensar más". Y "pensar más", en la práctica, casi siempre significa lo mismo: generar muchas respuestas distintas y quedarse con la mejor. Es fuerza bruta. Funciona sorprendentemente bien, pero tiene dos problemas. Es caro —cada intento cuesta cómputo, es decir, dinero y energía— y no garantiza nada: gastar el doble no te da una respuesta el doble de buena. Es como buscar las llaves probando puertas al azar: con suficientes intentos quizá aciertas, pero nadie te asegura que vas mejorando.