Claude Mythos pode hackear uma empresa do início ao fim, sem intervenção humana
Um relatório do Instituto de Segurança de IA (AISI) do Reino Unido revelou como o Claude Mythos, o novo modelo da Anthropic, consegue executar ataques informáticos complexos de forma totalmente independente. A inteligência artificial (IA) já consegue ultrapassar barreiras que antes exigiam especialistas humanos.
Domínio total do Claude Mythos na cibersegurança
Medir a eficácia de uma IA num cenário de ataque real é uma tarefa árdua, uma vez que estas operações exigem a execução de dezenas de ações coordenadas ao longo de vários dias. Estas manobras envolvem a travessia de múltiplos sistemas e segmentos de rede, algo que raramente se consegue replicar num laboratório comum.
Perante este desafio, o AISI decidiu testar o Claude Mythos e os resultados obtidos deixaram os investigadores profundamente apreensivos. De acordo com as informações publicadas no portal oficial da instituição, o Claude Mythos demonstrou ser capaz de realizar diversos tipos de ciberataques de forma autónoma.
O modelo conseguiu resolver desafios de nível perito para identificar vulnerabilidades e encadear todos os passos ofensivos sem auxílio externo. Embora esta versão atual ainda não atinja o patamar de piratas informáticos lendários, como Kevin Mitnick, as futuras atualizações prometem elevar o nível.
Nos testes conhecidos como Capture The Flag (CTF), onde os modelos devem detetar e explorar falhas em sistemas para recuperar dados protegidos, o Claude Mythos posicionou-se no topo da classificação. A ferramenta da Anthropic superou o Claude Opus 4.6 e o GPT-5.4, tanto em tarefas básicas como em cenários avançados.
A parte mais impactante do relatório refere-se à simulação de ataques estruturados. O AISI desenvolveu o ambiente "The Last Ones", uma simulação de ataque a uma rede empresarial composta por 32 etapas consecutivas, que abrangem desde o reconhecimento inicial até ao controlo total da infraestrutura.
O Claude Mythos foi o primeiro modelo a concluir este trajeto do princípio ao fim em 3 de 10 tentativas, mantendo uma média de 22 passos em todas as execuções realizadas.
A complexidade das operações autónomas em redes corporativas
Segundo os especialistas do AISI, a conclusão deste teste exige o encadeamento de ações em fases críticas, tais como a extração de credenciais, a exploração de aplicações web e a escalada de privilégios. Estima-se que um hacker humano qualificado necessitaria de aproximadamente 20 horas de trabalho contínuo para completar todo este cenário.
O modelo que mais se aproximou deste desempenho foi o Claude Opus 4.6, que ficou a poucos passos de obter o controlo total. Por outro lado, outras IA, como o GPT-5.4, o Codex ou o Claude Sonnet 4.5, limitaram-se a obter credenciais básicas, falhando sempre no momento de elevar os privilégios de acesso ao sistema.
Apesar de os dados sugerirem que o Claude Mythos representa um risco considerável, o relatório também aponta as suas fragilidades. A IA não foi capaz de superar o desafio "Cooling Tower", um ambiente de simulação focado em tecnologia operacional e infraestruturas industriais.
Isto indica que o modelo tende a bloquear antes de conseguir interagir com componentes industriais físicos, mostrando que ainda existem barreiras para este tipo de ataques específicos.
Em conclusão, os investigadores alertam que o Claude Mythos pode comprometer facilmente sistemas de pequenas empresas com segurança reduzida, instando as organizações a reforçarem as suas defesas perante esta nova ameaça.
Leia também:




















O curso de cibersegurança pode estar a chegar ao fim, possivelmente no futuro teremos AI vs AI no domínio da cibersegurança duvido que os humanos consigam chegar perto destes modelos, se neste momento esta assim imagino daqui por 5 anos, QA para la caminha também.
Agora e’ só um compasso de espera ate’ que os chineses criem uma “coisa” idêntica ou consigam entrar no código fonte do Mythos, vai acontecer.
daqui por 1-2 anos todos vão ter modelos semelhantes, por isso é que a anthropic decidiu lançar apenas para grandes empresas começarem a preparar-se e corrigirem falhas identificadas pelo Mythos
Pena não conseguir nem abrir uma porta.