A IA já está tendo um grande impacto na forma como o software é escrito, e grande parte do trabalho pesado da programação é agora realizada por enxames de agentes e subagentes. Mas à medida que os desenvolvedores experimentam novas interfaces e formatos para a colaboração entre humanos e IA, mesmo os laboratórios de IA mais avançados têm dificuldade em acompanhar.
A tendência atual é o desenvolvimento de software de agente (sistemas que permitem que agentes de IA trabalhem de forma independente em tarefas de codificação), como exemplificado pelos aplicativos Claude Code e Cowork. Enquanto isso, a OpenAI vem desenvolvendo gradualmente suas ferramentas Codex. ferramentas de linha de comando em abril passado e Estender para interface web 1 mês depois.
Agora, a OpenAI está dando grandes passos para se atualizar. Na segunda-feira, a empresa lançou um novo serviço. aplicativos macOS O Codex integra muitas das práticas dos agentes que se tornaram populares no ano passado. O novo aplicativo foi projetado para funcionar em paralelo com vários agentes e habilidades do agente fluxos de trabalho de ponta, como O lançamento também ocorrerá dentro de 2 meses. Iniciando GPT-5.2-CodexModelo de codificação mais poderoso da OpenAI, a empresa espera que isso seja suficiente para atrair usuários do Claude Code.
“Se você realmente deseja fazer um trabalho sofisticado em coisas complexas, o 5.2 é o modelo mais poderoso que já tivemos”, disse o CEO Sam Altman a repórteres em entrevista coletiva. “Mas está ficando mais difícil de usar, então achamos que será muito importante construir esse nível de funcionalidade do modelo em uma interface mais flexível”.
A confiança de Altman no GPT-5.2 é compreensível, mas os benchmarks de codificação contam uma história mais complicada. GPT-5.2 é válido Primeiro lugar no TerminalBench (um teste que mede quão bem uma IA pode lidar com tarefas de programação de linha de comando), pelo menos a partir deste artigo. No entanto, os agentes Gemini 3 e Claude Opus pontuaram quase de forma idêntica. A pontuação é inferior, mas dentro da margem de erro do benchmark. resultados de Banco SWEoutro benchmark de codificação que testa a capacidade da IA de corrigir bugs em software do mundo real, também não mostra nenhuma vantagem clara para o GPT-5.2. No entanto, os casos de uso de agentes são difíceis de avaliar de forma eficaz e os modelos de última geração podem proporcionar experiências de usuário muito diferentes.
O aplicativo Codex também vem com uma variedade de novos recursos, e a OpenAI afirma que pode igualar e, em alguns casos, superar os vários aplicativos Claude. O aplicativo Codex permite que você configure automações para serem executadas em segundo plano em uma programação automática, e os resultados são enfileirados e disponíveis para revisão quando o usuário retornar. Os usuários também podem escolher diferentes personalidades para seus agentes, desde realistas até empáticos, dependendo de seu estilo de trabalho.
Mas o maior argumento de venda da empresa é a velocidade de desenvolvimento possibilitada pela IA. “Você pode usar isso a partir de uma folha de papel em branco para criar software muito sofisticado em questão de horas”, disse Altman. “A capacidade de inserir novas ideias o mais rápido possível é o limite do que você pode construir.”
evento de crise tecnológica
Boston, Massachusetts
|
23 de junho de 2026


















