El gobierno argentino habla de inteligencia artificial con el entusiasmo de quien descubre una religión nueva. Funcionarios, influencers oficiales y empresarios amigos repiten palabras como disrupción, algoritmos, innovación, machine learning y economía del conocimiento con una mezcla de fascinación tecnológica y obediencia cultural. El problema es que, mientras recitan ese catecismo importado, destruyen las instituciones que producen el insumo fundamental del que se alimenta la inteligencia artificial: conocimiento. No existe inteligencia artificial sin datos. Y no existen datos de calidad, sistemáticos, verificables y útiles sin universidades públicas, organismos científicos y sistemas de investigación financiados por el Estado. La paradoja argentina es grotesca: un gobierno que idolatra la inteligencia artificial está desfinanciando exactamente a quienes producen el contenido con el que esos modelos aprenden. Durante las últimas semanas realizamos un relevamiento sobre uno de los aspectos menos discutidos del ecosistema global de IA: el origen de las URLs y dominios académicos que nutren a los modelos y sistemas de búsqueda automatizada. Para hacerlo utilizamos el índice público de Common Crawl, una de las bases de datos más utilizadas del mundo para entrenamiento y alimentación de modelos de inteligencia artificial.