Google lançado Na quinta-feira, uma versão “reimaginada” do agente de pesquisa da empresa, Gemini Deep Research, Modelo básico de última geração muito grandeGêmeos 3 Pró.
Este novo agente não foi projetado apenas para criar reportagens investigativas. No entanto, é possível. Isso permite que os desenvolvedores incorporem os recursos de exploração do modelo SATA do Google em seus próprios aplicativos. Esse recurso é possível graças a um novo recurso do Google. API de interaçãoIsso foi projetado para dar aos desenvolvedores mais controle na era vindoura da IA do agente.
A nova ferramenta Gemini Deep Research é um agente capaz de sintetizar montanhas de informações e processar grandes despejos de contexto em prompts. O Google diz que seus clientes o utilizam para tudo, desde due diligence até estudos de segurança de toxicidade de medicamentos.
O Google também anunciou que o novo agente de pesquisa profunda será em breve integrado a serviços como Google Search, Google Finance, o aplicativo Gemini e o popular NotebookLM. Este é mais um passo na preparação para um mundo onde agentes de IA pesquisam no Google, em vez de humanos pesquisarem qualquer coisa no Google.
A gigante da tecnologia afirma que a Deep Research se beneficia do status do Gemini 3 Pro como o modelo “mais baseado em fatos”, treinado para minimizar alucinações durante tarefas complexas.
As ilusões de IA (que os LLMs estão apenas inventando) são um problema particularmente importante para tarefas de agente de raciocínio profundo de longa duração, onde muitas decisões autônomas são tomadas em minutos, horas ou mais. Quanto mais escolhas o LLM tiver que fazer, maior será a probabilidade de que uma escolha ilusória invalide todo o resultado.
Para provar as suas afirmações de progresso, o Google também criou outro benchmark (como se o mundo da IA precisasse de outro benchmark). O novo benchmark, chamado de DeepSearchQA, tem como objetivo testar agentes em tarefas complexas de exploração de informações em várias etapas. O Google abriu o código-fonte deste benchmark.
evento de crise tecnológica
São Francisco
|
13 a 15 de outubro de 2026
Também testamos pesquisas profundas no último teste da humanidade. Esta é uma referência independente de conhecimento geral repleta de tarefas de nicho impossíveis com nomes muito interessantes. BrowserComp é uma referência para tarefas de agente baseadas em navegador.
Como seria de esperar, o novo agente do Google venceu a concorrência tanto em seus próprios benchmarks quanto nos benchmarks da Humanity. No entanto, o ChatGPT 5 Pro da OpenAI ficou surpreendentemente em segundo lugar, vencendo por pouco o Google no BrowserComp.
No entanto, essas comparações de benchmark foram interrompidas no momento em que o Google as publicou. Porque no mesmo dia, a OpenAI anunciou o tão esperado GPT 5.2 (codinome Garlic). A OpenAI afirma que seu modelo mais recente supera seus rivais, especialmente o Google, em uma série de benchmarks típicos, incluindo benchmarks desenvolvidos internamente.
Talvez um dos aspectos mais interessantes deste anúncio tenha sido o momento. Sabendo que o mundo estava esperando pelo lançamento do Garlic, o Google anunciou algumas novidades sobre IA.


















