O Claude Mythos, o mais poderoso modelo de inteligência artificial da Anthropic, cujo mero anúncio provocou fortes reacções nos sectores da cibersegurança e da banca, poderá estar prestes a ser disponibilizado de forma mais ampla. Referências directas a uma versão denominada “claude-mythos-1-preview” foram recentemente detectadas no código-fonte da empresa e na interface de segurança da plataforma Claude, indiciando que a tecnológica se prepara para lançar esta ferramenta através dos seus serviços de programação e diagnóstico de sistemas.Até ao momento, a empresa liderada por Dario Amodei tinha recusado disponibilizar o modelo ao grande público, justificando a decisão com os riscos evidentes de uma utilização indevida. Aquando da revelação inicial, a direcção da startup alertou que os sistemas com capacidades avançadas de intrusão informática apresentam riscos de dupla utilização, defendendo que a introdução destas tecnologias na sociedade deve ser feita de forma gradual e com salvaguardas robustas. Contudo, os novos vestígios descobertos em plataformas de computação na nuvem da Google e da Amazon sugerem que o calendário para este lançamento poderá ter sido antecipado.Muralha digital contra falhas humanasA decisão original de restringir o acesso inseriu-se no Projecto Glasswing, uma iniciativa controlada na qual o modelo foi partilhado apenas com um grupo restrito de parceiros institucionais e empresas tecnológicas para fins exclusivamente defensivos. Desde o início dos testes em Abril, a Anthropic revelou, em comunicado, que a ferramenta foi capaz de identificar mais de dez mil vulnerabilidades de gravidade alta ou crítica no software mais importante e utilizado em todo o mundo.Num relatório recente, a tecnológica sublinhou que o progresso na segurança dos programas costumava estar limitado pela rapidez com que se encontravam novas falhas, passando agora a estar dependente da velocidade com que as equipas humanas conseguem verificar e corrigir o imenso volume de erros identificados pela inteligência artificial.A capacidade deve-se ao facto de o modelo conseguir compreender a arquitectura dos programas em profundidade e raciocinar sobre o comportamento dos sistemas, superando a esmagadora maioria dos especialistas humanos na detecção de pontos fracos. Numa das demonstrações práticas, o sistema localizou uma falha de segurança com 27 anos no sistema operativo OpenBSD, uma plataforma reconhecida globalmente pela sua fiabilidade e segurança e utilizada para gerir barreiras de protecção em infra-estruturas digitais críticas. O mais surpreendente é que a Anthropic garante não ter treinado especificamente o modelo para tarefas de pirataria informática. As capacidades terão surgido naturalmente como consequência do aperfeiçoamento das competências gerais de raciocínio, planeamento e autonomia da máquina.A possibilidade de o Claude Mythos chegar ao mercado pode levar a uma mudança profunda na forma como nos relacionamos com a segurança dos dados pessoais. Se, por um lado, a tecnologia permite antecipar ataques e blindar as aplicações de telemóveis, computadores e redes bancárias contra investidas criminosas, por outro lado, a sua eventual replicação sem os devidos controlos tornaria as ferramentas de intrusão acessíveis a agentes mal-intencionados. A própria liderança da Anthropic reconheceu em comunicações anteriores que nenhuma empresa desenvolveu ainda salvaguardas totalmente eficazes para evitar o desvio destes sistemas, realçando a urgência de criar barreiras de protecção antes de uma distribuição em larga escala.
Anthropic deverá disponibilizar modelo de IA que era “perigoso demais” para ser lançado
Referências ao modelo Claude Mythos no código da Anthropic sugere que a tecnologia capaz de detectar vulnerabilidades informáticas será disponibilizada em breve.













