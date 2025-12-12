A rivalidade entre as gigantes da tecnologia intensificou-se, com a Google e a OpenAI a apresentarem atualizações significativas para os seus modelos de inteligência artificial (IA) quase em simultâneo.

Integração em serviços e redução de alucinações

A Google revelou uma versão "reimaginada" do seu agente de investigação, o Gemini Deep Research, fundamentado no seu modelo de última geração, o Gemini 3 Pro. Esta nova ferramenta não se limita apenas à produção de relatórios de investigação, embora mantenha essa competência.

A grande inovação reside na possibilidade de os programadores incorporarem as capacidades de investigação deste modelo SATA diretamente nas suas próprias aplicações. Esta funcionalidade é viabilizada através da nova Interactions API da Google, concebida para oferecer aos criadores um maior controlo na emergente era da IA agêntica.

O novo Gemini Deep Research apresenta-se como um agente equipado para sintetizar volumes massivos de informação e gerir um contexto extenso nos prompts. Segundo a tecnológica de Mountain View, a ferramenta já está a ser utilizada por clientes para tarefas que variam desde processos de due diligence até à investigação de segurança em toxicidade de medicamentos.

A empresa anunciou ainda que, em breve, integrará este novo agente de investigação em vários dos seus serviços, incluindo a Pesquisa Google, o Google Finance, a aplicação Gemini e o popular NotebookLM. Este movimento representa mais um passo na preparação para um futuro onde os utilizadores delegam as pesquisas aos seus agentes de IA, em vez de as realizarem manualmente.

A Google destaca que o Deep Research beneficia do estatuto do Gemini 3 Pro como o seu modelo "mais factual", treinado especificamente para minimizar alucinações durante tarefas complexas.

Novos testes e comparações de desempenho

Para fundamentar os seus progressos, a Google criou um novo referencial de testes (benchmark), batizado de DeepSearchQA. Este teste, que a empresa tornou open-source, destina-se a avaliar agentes em tarefas complexas de procura de informação com múltiplos passos.

O Deep Research foi também submetido ao Humanity's Last Exam, um teste independente de conhecimento geral composto por tarefas extremamente específicas, e ao BrowserComp, um referencial para tarefas agênticas baseadas em browser.

Como seria de esperar, o novo agente da Google superou a concorrência no seu próprio teste e no Humanity's Last Exam. No entanto, o GPT-5 Pro da OpenAI ficou num segundo lugar surpreendentemente próximo em todas as categorias e chegou mesmo a superar ligeiramente a Google no BrowserComp.

Contudo, estas comparações de desempenho tornaram-se praticamente obsoletas no momento em que foram publicadas. Isto porque, no mesmo dia, a OpenAI lançou o seu muito aguardado GPT-5.2, com o nome de código "Garlic". A empresa liderada por Sam Altman afirma que o seu modelo mais recente supera os rivais - especialmente a Google - num conjunto de testes típicos, incluindo um desenvolvido internamente pela própria OpenAI.

