Prometía mayor seguridad: Claude Fable 5 fue hackeado antes de cumplir dos días en el mercado

Claude Fable 5 fuel vulnerado pese a que Anthropic había dicho que era su modelo de IA más seguro. (Anthropic)El lanzamiento de Claude Fable 5 como uno de los modelos de inteligencia artificial más avanzados y seguros de Anthropic ha quedado bajo escrutinio. Menos de 48 horas después de su debut, un investigador conocido en la comunidad de IA como “Pliny the Liberator” aseguró haber vulnerado las barreras de seguridad del sistema mediante una serie de técnicas de jailbreak que permitieron eludir los filtros diseñados por la compañía.La información fue difundida por el propio investigador a través de una publicación en la red social X. Según explicó, consiguió “liberar” a Claude Fable 5 apenas un día después de que Anthropic pusiera a disposición del público este modelo, presentado como una alternativa más accesible a Mythos y equipado con mecanismos de protección reforzados para impedir respuestas relacionadas con actividades potencialmente peligrosas.PUBLICIDADAnthropic había destacado que Claude Fable 5 incorporaba uno de los sistemas de seguridad más sofisticados desarrollados hasta ahora. Entre sus mecanismos figuraban clasificadores capaces de detectar solicitudes relacionadas con ciberseguridad, química, biología e intentos de extracción del conocimiento interno del modelo.12/06/2026 Imagen de Anthropic

Prometía mayor seguridad: Claude Fable 5 fue hackeado antes de cumplir dos días en el mercado

Other newsrooms on this story

Related reading

Hackean la nueva IA de Anthropic, inspirada en Mythos, en menos de 48 horas:…

Anthropic lanza una versión más segura de Mythos, el modelo de IA que ha puesto…

Anthropic lanza Claude Fable 5 y Mythos 5, sus dos modelos de IA más potentes

Anthropic lanza Claude Fable 5, su IA más potente, con bloqueos

Anthropic lanza al público una versión de Mythos, su IA más peligrosa

Anthropic abre al p�blico su modelo m�s potente pero con un freno de seguridad