Na segunda-feira, a Anthropic anunciou a versão mais recente de seu modelo carro-chefe, Opus 4.5. Este é o último modelo da série Anthropic 4.5 a ser lançado, após o lançamento do Sonnet 4.5 em setembro e do Haiku 4.5 em outubro.

Como esperado, a nova versão do Opus oferece desempenho de última geração em uma variedade de benchmarks, incluindo benchmarks de codificação (banco SWE e banco de terminal), uso de ferramentas (banco tau2 e MCP Atlas) e resolução de problemas gerais (ARC-AGI 2, GPQA Diamond).

Notavelmente, o Opus 4.5 é o primeiro modelo a pontuar acima de 80% na validação SWE-Bench, um benchmark de codificação popular.

A Anthropic também lançou uma série de produtos paralelos para destacar o uso do computador e os recursos de planilhas do Opus e demonstrar o desempenho do modelo nessas configurações. Com Opus 4.5, Antrópico cromo claude e Cláudio para Excel Os produtos que anteriormente estavam em fase piloto estarão agora mais amplamente disponíveis. A extensão do Chrome está disponível para todos os usuários do Max, e o modelo focado no Excel está disponível para usuários do Max, Team e Enterprise.

O Opus 4.5 também inclui melhorias de memória para operações de contexto longas, o que exigiu mudanças significativas na forma como os modelos gerenciam a memória.

“O treinamento com o Opus 4.5 melhorou a qualidade de contextos longos comuns, mas as janelas de contexto por si só não são suficientes”, disse Dianne Na Penn, chefe de gerenciamento de produtos de pesquisa da Anthropic, ao TechCrunch. “Saber os detalhes certos para lembrar é muito importante como um complemento para simplesmente ter uma janela de contexto mais longa.”

Essas mudanças também permitem um recurso de “bate-papo sem fim” há muito solicitado para usuários pagos do Claude, permitindo que o bate-papo continue ininterrupto quando um modelo atinge a janela de contexto. Em vez disso, o modelo compacta a memória de contexto sem avisar o usuário.

evento de crise tecnológica

São Francisco
|
13 a 15 de outubro de 2026

Muitas das atualizações foram feitas pensando em casos de uso de agentes, especificamente cenários em que o Opus atua como agente líder, dirigindo um grupo de subagentes movidos pelo Haiku. Gerenciar essas tarefas requer fortes comandos de memória de trabalho, e é aqui que as melhorias de memória que Penn descreve têm valor real.

“Fundamentos como memória são realmente importantes aqui porque Claude precisa ser capaz de explorar bases de código e documentos grandes, e ele precisa saber quando voltar e olhar algo novamente”, diz Penn.

O Opus 4.5 enfrentará forte concorrência de outros modelos Frontier lançados recentemente, particularmente o GPT 5.1 da OpenAI (lançado em 12 de novembro) e o Gemini 3 do Google (lançado em 18 de novembro).

Source link