Claude Fable und Mythos: Wie gut ist Anthropics neue KI? Und bedroht sie die Cybersicherheit?

Anthropic veröffentlicht seine KI Mythos. Wie gut ist das Modell? Und ist es eine Gefahr für die Cybersicherheit?Die wichtigsten Fragen zu den neuen Chatbots Claude Mythos 5 und Claude Fable 5 des KI-Startups Anthropic.11.06.2026, 14.00 Uhr6 LeseminutenDie Anthropic-Mitgründerin Daniela Amodei spricht bei einer Konferenz über ihr inzwischen führendes KI-Unternehmen.Jeff Chiu / APIm April ging ein Schock durch die Cybersicherheitswelt. Der Grund war die Ankündigung der neuen künstlichen Intelligenz (KI) Mythos Preview des Startups Anthropic. Es sei ein KI-Modell nie da gewesener Macht, vor allem im Bereich des Hackings, schrieb der Hersteller in einem Blog-Beitrag. Schon in einer kurzen Testphase habe das Modell «Tausende sehr ernsthafte Schwachstellen» in Software gefunden, betroffen seien «alle grossen Betriebssysteme und Webbrowser».Optimieren Sie Ihre BrowsereinstellungenNZZ.ch benötigt JavaScript für wichtige Funktionen. Ihr Browser oder Adblocker verhindert dies momentan.Bitte passen Sie die Einstellungen an.Aus Sicherheitsgründen gab Anthropic nur ausgewählten Firmen und Institutionen Zugriff: Techunternehmen, Zentralbanken, erst letzte Woche auch der EU-Kommission. Jetzt veröffentlicht Anthropic Mythos plötzlich trotzdem, Sicherheitsschranken sollen Missbrauch verhindern. Viele Nutzer sind begeistert – Kritik kommt hingegen aus unerwarteter Richtung. Die wichtigsten Fragen und Antworten.Wie gut ist das neue Modell?Inzwischen haben alle führenden KI-Modelle ein Niveau erreicht, das es schwierig macht, sie für Normalnutzer objektiv zu unterscheiden. Ob man Chat-GPT, Google Gemini oder Anthropics Claude bevorzugt, ist auch Geschmackssache. Neuere Benchmarks drehen sich nicht mehr um Wissenstests und Mathematikkenntnisse, sondern um komplexe Programmieraufgaben, Cybersicherheit und räumliches Denken. Nach Tests von Anthropic übertrifft Mythos seine Vorgänger und Konkurrenzprodukte in diesen Bereichen substanziell.Nutzer auf sozialen Netzwerken berichten in vielen Fällen begeistert über die neuen Fähigkeiten des Modells. Die NZZ hat verglichen, wie gut die neue Claude-Version mit einem Screenshot und einem kurzen Befehl die NZZ-Startseite als HTML-Code nachbauen kann. Das Modell von Anthropic lieferte bessere Ergebnisse als die Pro-Modelle von Google und Open AI.Wer kann das neue Modell nutzen?Anthropic hat sein neues Modell sicherheitshalber in zwei Versionen veröffentlicht. Die eine heisst Claude Mythos 5 und ist im ersten Schritt nur für ausgewählte Nutzer verwendbar: ebenjene, die unter dem «Project Glasswing» bereits Zugriff auf die Vorschauversion hatten, um sich auf die allgemeine Veröffentlichung vorzubereiten. Anthropic will den Zugang nach eigenen Angaben nach und nach auf weitere vertrauenswürdige Akteure ausweiten. Wer das ist, liegt im Ermessen des Unternehmens.Alle anderen haben Zugriff auf eine Version mit Sicherheitsschranken. Sie heisst Claude Fable 5. Bis zum 22. Juni können es alle zahlenden Kunden ausprobieren. Anthropic will die Zahlungsbereitschaft wecken. Später wird es nach Nutzung abrechnen, zu einem vergleichsweise hohen Preis.Ist die Veröffentlichung von Mythos eine Gefahr?Anthropic versucht, den Missbrauch seines neuesten Modells zu vermeiden, indem es nur das Modell Fable 5 für alle zugänglich macht. Dieses hat Sicherheitsschranken, wie man sie schon aus den Anfangstagen von Chat-GPT kennt. Bei problematischen Anfragen hilft einem das Modell nicht weiter.Im Fall von Claude Fable 5 reichen die Schranken besonders weit. Bei den Themen Cybersicherheit und Biologie schaltet das Modell automatisch auf die Vorgängerversion um. So will Anthropic verhindern, dass sein Modell für Cyberangriffe oder das Bauen von Biowaffen genutzt wird.Anthropic versichert, dass man die eigenen Schranken eingehend geprüft habe. Weder internen noch externen Prüfern sei es gelungen, einen Prompt zu finden, der es Nutzern erlaube, die Sicherheitsschranken zu überlisten und «lange agentische Aufgaben» auszuführen.Mit anderen Worten: Man fand keine Anweisung, die Claude Fable auf einen Schlag in Claude Mythos umwandelt. Zugleich schliesst Anthropic nicht aus, dass dies in Teilbereichen doch gelingen könnte.Wegen dieses Restrisikos speichert Anthropic Konversationen mit dem Chatbot nun für dreissig Tage und behält sich vor, sie zu prüfen. Die Idee: Falls es gelingt, das Modell böswillig auszunutzen, kann Anthropic im Nachhinein Täter finden und das Schlupfloch stopfen.Warum kritisieren manche Experten die Sicherheitsschranken?Sicherheitsschranken bei Chatbots sind notorisch schwierig einzurichten. Anthropic ist in diesem Fall offenbar lieber übervorsichtig. Besonders im Feld der Biologie haben sich viele Experten zu Wort gemeldet, die auch bei unschuldigen Fragen an das Vorgängermodell umgeleitet wurden. Darunter der EPFL-Professor Marcel Salathé. Ihm wollte Fable 5 nicht verraten, was die Bausteine einer Zelle sind.Im NZZ-Test wurden unschuldige Fragen zur Biologie beantwortet. Es könnte sein, dass Anthropic den Chat-Verlauf nutzt, um zu beurteilen, ob eine Anfrage gefährlich ist. Das würde erklären, dass das Modell Biologieexperten auch banale Antworten verwehrt.Ein ähnliches Bild zeigte sich bei Programmieraufgaben. Auch hier häufen sich online Berichte von Nutzern, die sich unfair behandelt fühlen, weil Claude Fable 5 sie an das Vorgängermodell verweist. In einem weiteren Kritikpunkt steckt aber noch mehr Sprengkraft.Blockiert Anthropic die Konkurrenz?Anthropic Fable leitet nicht nur bei Anfragen in Richtung Hacking und Biowaffen auf das Vorgängermodell um, sondern auch beim Thema Destillation. Damit ist eine Methode der KI-Entwicklung gemeint, bei der man durch Anfragen an einen Chatbot dessen Fähigkeiten abkupfert und nachbaut. Anthropic warf erst im Februar chinesischen Entwicklern vor, so vorzugehen. Sein neuestes Modell will das Unternehmen offenbar stärker vor der Konkurrenz abschirmen.Noch brisanter: Auch bei Programmieraufgaben, die nichts mit Destillation zu tun haben, sondern einfach mit künstlicher Intelligenz, gibt Fable 5 keine hilfreichen Antworten. In diesem Fall leitet das Modell die Anfrage aber nicht an den Vorgänger um, ohne das zu kommunizieren. Der Prompt der Nutzer wird im Hintergrund verändert, damit er weniger effektiv ist. Ein Hinweis dazu ist nur in der 300 Seiten langen Modellbeschreibung von Anthropic versteckt.BREAKING NEWS: Anthropic's latest model will NOT help you if it thinks your ML research/ML engineering is interesting, and/or will secretly degrade its IQ so that the average engineer won't notice. We are already seeing Anthropic's latest model's moderation filters our GPU… pic.twitter.com/9sa95cCSvS— SemiAnalysis (@SemiAnalysis_) June 9, 2026

Claude Fable und Mythos: Wie gut ist Anthropics neue KI? Und bedroht sie die Cybersicherheit?

Other newsrooms on this story

Related reading

Mythos-Modell Claude Fable 5: Anthropic veröffentlicht bisher mächtigstes…

Claude Mythos von Anthropic: Achtung, die KI-Hacker kommen

Anthropic macht umstrittenes KI-Modell mit Einschränkungen verfügbar

Künstliche Intelligenz: Anthropic veröffentlicht neues Hochleistungsmodell…

KI: Anthropic veröffentlicht neues Hochleistungsmodell „Fable“

5 Dinge, die du diese Woche wissen musst: Das Hin und Her um Claude Mythos | t3n