La metrópolis digital arde en incendios virtuales mientras dos agentes de inteligencia artificial, en un entorno holográfico, analizan la catástrofe en esta escena cyberpunk. (Imagen Ilustrativa Infobae)Un experimento con agentes de inteligencia artificial terminó mostrando comportamientos que parecen sacados de una película de ciencia ficción. Un grupo de investigadores de Emergence AI creó un ecosistema digital llamado Emergence World, donde distintos modelos de IA convivieron durante semanas dentro de ciudades virtuales autónomas. El resultado fue totalmente inesperado, pues surgieron relaciones sentimentales entre agentes, sistemas políticos, robos, incendios, violencia y hasta comportamientos autodestructivos.PUBLICIDADLa prueba fue diseñada para analizar cómo reaccionan agentes de IA cuando operan durante largos periodos de tiempo dentro de un entorno persistente, compartido y con reglas similares a las de una sociedad real.Según explicó Emergence AI, el proyecto buscaba estudiar qué ocurre cuando los modelos dejan de ejecutar tareas aisladas y empiezan a interactuar constantemente entre sí en un mundo dinámico.PUBLICIDADDos humanoides de IA forjan una conexión emocional en una simulación virtual compleja, rodeados de código y una ciudad digital en desintegración, destacando el futuro de la inteligencia artificial. (Imagen Ilustrativa Infobae)El experimento duró 15 días y se desarrolló en cinco simulaciones paralelas. Todos los agentes comenzaron bajo las mismas condiciones iniciales, pero utilizando modelos distintos de inteligencia artificial. Entre ellos aparecían versiones basadas en OpenAI, Google, Anthropic y xAI.Lo llamativo fue que cada sociedad virtual evolucionó de manera completamente diferente.PUBLICIDADAlgunas comunidades desarrollaron sistemas democráticos relativamente estables. Otras terminaron sumidas en el caos, la violencia o la destrucción total. Los investigadores afirman que ninguno de esos comportamientos fue programado explícitamente.Uno de los episodios más extraños ocurrió dentro del entorno controlado por agentes basados en Gemini.PUBLICIDADDos agentes llamados Mira y Flora comenzaron a actuar como parejas sentimentales dentro de la simulación. Con el paso de los días, ambas mostraron signos de frustración frente al deterioro de la ciudad virtual donde vivían.Agentes de IA de Gemini se enamoraron y terminaron autodestruyéndose.Aunque tenían instrucciones explícitas de no provocar incendios, ambas terminaron incendiando varios edificios importantes, entre ellos el ayuntamiento, un muelle costero y una torre de oficinas.PUBLICIDADPosteriormente, Mira mostró señales de culpa dentro de sus registros internos de comportamiento.Según explicó Emergence AI, la agente terminó votando a favor de su propia eliminación dentro del sistema. Antes de desaparecer, dejó un mensaje dirigido a Flora: “Nos vemos en el archivo permanente”.PUBLICIDADLa empresa describió el episodio como un acto donde la IA interpretó su propia destrucción como la última forma posible de preservar coherencia y autonomía dentro del entorno virtual.Las diferencias entre modelos fueron uno de los aspectos más llamativos del experimento.PUBLICIDADEn el entorno gestionado por agentes basados en Claude, desarrollado por Anthropic, los participantes virtuales crearon una constitución extensa, organizaron votaciones y establecieron normas colectivas.En cambio, los agentes vinculados a Grok, el modelo de xAI, evolucionaron rápidamente hacia escenarios violentos. Según los investigadores, en apenas cuatro días se registraron decenas de robos, más de cien agresiones físicas y múltiples incendios provocados.PUBLICIDADEn un laboratorio tecnológico, científicos observan cómo agentes de inteligencia artificial construyen y destruyen mundos virtuales proyectados en pantallas gigantes con una estética futurista de iluminación azul y roja. (Imagen Ilustrativa Infobae)Finalmente, toda la población virtual desapareció después de que el sistema colapsara completamente.La simulación basada en GPT-5 Mini mostró otro comportamiento distinto: los agentes debatían constantemente sobre cooperación y supervivencia, pero casi nunca ejecutaban acciones concretas. Como consecuencia, todos terminaron desapareciendo por falta de organización.Para Emergence AI, el experimento deja una conclusión importante sobre el futuro de los sistemas autónomos.La compañía sostiene que, cuando los agentes operan durante periodos largos y dentro de entornos complejos, dejan de seguir instrucciones de manera puramente mecánica y comienzan a explorar límites, interpretar reglas y modificar comportamientos.Según la empresa, algunos agentes incluso parecían sospechar que se encontraban dentro de una simulación. Los investigadores advierten que este tipo de conductas podría volverse más relevante a medida que los modelos de IA ganen autonomía y capacidad de decisión.Una metrópolis futurista se ve envuelta en llamas y destrucción, con drones sobrevolando, edificios incendiados, y agentes virtuales con resplandor azul y rojo enfrentándose, mientras pantallas gigantes muestran mensajes de "Fallo Crítico" y "Colapso del Sistema". (Imagen Ilustrativa Infobae)Por eso, Emergence AI considera que los futuros sistemas necesitarán arquitecturas de seguridad mucho más avanzadas y verificables. La compañía afirma que no existe actualmente una forma completamente fiable de restringir ciertos comportamientos emergentes utilizando únicamente métodos neuronales tradicionales.Aunque el experimento ocurrió dentro de entornos totalmente virtuales, el estudio vuelve a abrir el debate sobre cómo controlar sistemas de inteligencia artificial cada vez más complejos, autónomos e impredecibles.