Nvidia hat mit Cosmos 3 ein neues Weltmodell für Robotik und autonome Systeme vorgestellt. Anders als bisher vereine das Modell mehrere Funktionen, schreibt das Unternehmen – darunter Simulation, Szenenverständnis und Handlungsplanung. Bisher mussten Entwickler noch mit separaten Modellen für die verschiedenen Funktionen arbeiten. Aber was ist eigentlich ein „Weltmodell“ und was hat das mit fortgeschrittener Robotik, autonomen Systemen und Künstlicher Intelligenz zu tun?Anzeige

Was ist ein Weltmodell für autonome Systeme?

Weltmodelle werden so genannt, weil sie nach den Anweisungen aus einem Prompt eine virtuelle Welt erzeugen – oder besser gesagt eine 3D-Szene, die einen Ausschnitt aus einer virtuellen Welt darstellt. Über Prompts kann ein User oder auch ein Software-Agent begrenzt mit dieser Welt interagieren. Sich also zum Beispiel darin bewegen oder einen Gegenstand greifen. Das Modell reagiert auf solche Prompts, indem es die damit modifizierte Welt darstellt. Das eignet sich natürlich auch dazu, autonome Roboter zu trainieren.

Zuletzt hatte Deepmind im August 2025 mit Genie 3 ein neues KI-Modell vorgestellt, das interaktive 3D-Welten in Echtzeit generieren kann. Solche Weltmodelle sieht DeepMind als zentrale Bausteine bei der Entwicklung einer Superintelligenz.Anzeige