com Vlad Ionescu Ariel Herbert Voss, cofundador segurança cibernética começar runcivirquando eles ficaram momentaneamente confusos. IA A ferramenta Sybil alertou os clientes sobre fraquezas em seus sistemas em novembro passado.
Sybil usa uma combinação de diferentes IAs modelo– Além de alguns truques técnicos exclusivos, ele verifica os sistemas de computador em busca de problemas que os hackers possam explorar, como servidores sem correção ou bancos de dados mal configurados.
Neste caso, Sybil sinalizou problema Isso é usado quando os clientes implantam GraphQL federado, uma linguagem usada para especificar como os dados são acessados na web por meio de interfaces de programação de aplicativos (APIs). O problema significava que o cliente havia vazado acidentalmente informações confidenciais.
O que intrigou Ionescu e Herbert-Voss foi que a identificação do problema exigia um conhecimento muito profundo de vários sistemas diferentes e de como eles interagem. RunSybil diz que desde então descobriu o mesmo problema com outras implantações do GraphQL. Antes que alguém o lançasse, “procuramos na Internet e não existia”, diz Herbert-Voss. “Descobrir isso foi um passo no raciocínio e uma mudança radical em termos de como o modelo funcionava.”
Esta situação representa um risco acrescido. À medida que os modelos de IA se tornam mais inteligentes, a sua capacidade de descobrir bugs de dia zero e outras vulnerabilidades continua a melhorar. A mesma inteligência que pode ser usada para detectar vulnerabilidades também pode ser usada para explorar vulnerabilidades.
canção do amanhecerUm cientista da computação da Universidade da Califórnia, em Berkeley, especializado em IA e segurança, diz que avanços recentes em IA produziram modelos que são melhores na detecção de falhas. O raciocínio de simulação, que divide os problemas em partes componentes, e a IA do agente, como pesquisas na web e instalação e execução de ferramentas de software, aprimoram as capacidades cibernéticas do modelo.
“As capacidades de segurança cibernética do Frontier Model melhoraram significativamente nos últimos meses”, diz ela. “Este é um ponto de viragem.”
No ano passado, Song foi coautor dos seguintes benchmarks: academia cibernética Determine quão bem os modelos de linguagem em larga escala podem detectar vulnerabilidades em grandes projetos de software de código aberto. CyberGym contém 1.507 vulnerabilidades conhecidas encontradas em 188 projetos.
Em julho de 2025, Claude Sonnet 4 da Anthropic conseguiu descobrir aproximadamente 20% das vulnerabilidades em seu benchmark. Em outubro de 2025, um novo modelo, o Claude Sonnet 4.5, conseguiu distinguir 30 por cento. “Os agentes de IA podem encontrar o dia zero a um custo muito baixo”, disse Song.
Song disse que esta tendência aponta para a necessidade de novas medidas, como o uso de IA para auxiliar os profissionais de segurança cibernética. “Precisamos pensar em como podemos realmente tornar a IA ainda mais útil no lado defensivo e podemos considerar diferentes abordagens”, diz ela.
Uma ideia é que as empresas de IA de ponta compartilhem seus modelos com pesquisadores de segurança antes do lançamento, para que possam usá-los para encontrar bugs e proteger sistemas antes do lançamento público.
Outra solução, segundo Song, é repensar como o software é construído. Seu laboratório mostrou que a IA pode ser usada para gerar código mais seguro do que o código que a maioria dos programadores usa atualmente. “A longo prazo, acreditamos que esta abordagem segura desde o design realmente ajudará o defensor”, disse Song.
A equipe RunSybil afirma que as habilidades de codificação do modelo de IA podem dar aos hackers uma vantagem no curto prazo. “A IA pode gerar ações em um computador e gerar código. Essas são duas coisas que os hackers fazem”, diz Herbert Voss. “À medida que essas capacidades aceleram, o mesmo acontece com as nossas operações ofensivas de segurança.”
Esta é uma edição de Cavaleiros Boletim Informativo do Laboratório de IA. Leia boletins informativos anteriores aqui.


















