Neel Somani, engenheiro de software, ex-pesquisador quantitativo e fundador de uma startup, estava testando as habilidades matemáticas dos novos modelos da OpenAI no fim de semana passado quando fez uma descoberta inesperada. Depois de colar o problema no ChatGPT e deixar pensar por 15 minutos, voltei com uma solução completa. Ele avaliou a prova e formalizou através de uma ferramenta chamada Harmonic, e deu tudo certo.

“Eu estava interessado em estabelecer uma linha de base para quando os LLMs podem efetivamente resolver problemas matemáticos não resolvidos em comparação com quando eles estão com dificuldades”, disse Somani. O que me surpreendeu foi que a Frontier começou a avançar aos poucos com o modelo mais recente.

Bate-papoGPT cadeia de pensamentos Isso é ainda mais impressionante, citando axiomas matemáticos como: Fórmula de Legendre, Postulado de Bertrande teoria da estrela de david. Finalmente encontrei o modelo Postagem de estouro de matemática de 2013o matemático de Harvard Noam Elkies apresentou uma solução elegante para um problema semelhante. No entanto, a prova final do ChatGPT diferiu do trabalho de Elkies em aspectos importantes e forneceu uma solução mais completa para a versão do problema colocada pelo lendário matemático Paul Erdős. Sua vasta coleção de problemas não resolvidos tornou-se um campo de testes para a IA.

Para os céticos da inteligência de máquina, este é um resultado surpreendente, mas não é o único. De LLMs orientados à formalização, como o Aristóteles da Harmonic, a ferramentas de revisão de literatura, como a Deep Research da OpenAI, as ferramentas de IA são difundidas na matemática. Mas desde o lançamento do GPT 5.2, que Somani diz ser “anedoticamente mais proficiente em raciocínio matemático do que as versões anteriores”, tornou-se difícil ignorar o grande volume de problemas resolvidos, levantando novas questões sobre a capacidade dos modelos de linguagem em grande escala para ultrapassar as fronteiras do conhecimento humano.

Somani estava se concentrando no problema de Erdős, que é uma compilação de mais de 1.000 conjecturas de matemáticos húngaros. mantido on-line. Esses problemas variam amplamente tanto no assunto quanto na dificuldade, tornando-os alvos atraentes para a matemática baseada em IA. O primeiro lote de soluções autônomas foi entregue em novembro. Modelo equipado com Gemini chamado AlphaEvolve — Mas recentemente, Somani e colegas descobriram que o GPT 5.2 é muito bom em matemática avançada.

Desde o Natal, 15 questões foram alteradas de “abertas” para “resolvidas” no site da Erdos, com 11 das resoluções reconhecendo especificamente que um modelo de IA está envolvido no processo.

O respeitado matemático Terence Tao tem uma visão mais sutil desse progresso. em sua página GitHubcontamos oito problemas diferentes em que os modelos de IA fizeram progressos significativos de forma autônoma no problema de Erdos, e seis outros problemas em que encontraram e fizeram progressos com base em pesquisas anteriores. Embora tenhamos um longo caminho a percorrer antes que os sistemas de IA possam realizar matemática sem intervenção humana, é claro que os modelos de grande escala têm um papel importante a desempenhar.

evento de crise tecnológica

São Francisco
|
13 a 15 de outubro de 2026

Sobre MastodonteTao especula que a natureza escalável dos sistemas de IA os torna adequados para serem aplicados sistematicamente à “cauda longa” dos problemas Erdos, muitos dos quais na verdade têm soluções simples.

“Muitos desses problemas simples de Erdos têm, portanto, maior probabilidade de serem resolvidos por métodos puramente baseados em IA do que por meios humanos ou híbridos”, continuou Tao.

Outro impulsionador é o recente movimento em direção à formalização, uma tarefa trabalhosa que facilita a validação e a extensão do raciocínio matemático. A formalização não requer o uso de IA ou computadores, mas o advento de novas ferramentas automatizadas tornou o processo muito mais fácil. Lean, um “assistente de prova” de código aberto desenvolvido na Microsoft Research em 2013, tornou-se amplamente utilizado no campo como uma forma de formalizar provas, e espera-se que ferramentas de IA como o Aristóteles da Harmonic automatizem grande parte do trabalho de formalização.

Para o fundador da Harmonic, Tudor Achim, o facto de o problema de Erdos ter sido subitamente resolvido é menos importante do que o facto de os maiores matemáticos do mundo estarem a começar a levar estas ferramentas a sério. “Estou mais preocupado com o fato de professores de matemática e ciências da computação estarem usando[ferramentas de IA]”, disse Achim. “Essas pessoas têm reputações a proteger, então quando dizem que estão usando o Aristóteles ou o ChatGPT, isso é uma evidência real.”

Source link