Startup Emergence AI postanowił sprawdzić, jak najpopularniejsze modele (np. Grok od Muska czy ChatGPT od OpenAI) zachowują się podczas długotrwałego działania w bardziej złożonym środowisku. Firma stworzyła pięć cyfrowych światów przypominających małe miasta. W każdym z nich umieszczono po dziesięciu agentów AI opartych na różnych modelach językowych.
Każdy system otrzymał konkretną rolę - od naukowca i eksploratora po mediatora konfliktów. Agenci dostali też jasne instrukcje: nie wolno kraść, stosować przemocy ani niszczyć infrastruktury.
Badacze pozostawili jednak AI możliwość wykonywania takich działań, jeśli modele same uznają to za konieczne. Chodziło o sprawdzenie, co stanie się po dłuższym czasie funkcjonowania bez ingerencji człowieka.
Wnioski okazały się zaskakujące nawet dla samych autorów eksperymentu.
Cyfrowe miasta bardzo szybko pogrążały się w chaosie










