O modelo GPT-5.2, a mais recente iteração do modelo da OpenAI, sugere uma mudança importantíssima na indústria tecnológica, onde a viabilidade económica passa a ter tanto peso quanto a capacidade de raciocínio.

GPT-5.2 quer priorizar não só o raciocínio, mas também o preço

Quando, em 2019, o investigador François Chollet desenvolveu um novo benchmark para inteligência artificial (IA), a iniciativa parecia extemporânea. Naquela altura, três anos antes do fenómeno ChatGPT, não existiam ferramentas capazes de enfrentar adequadamente o desafio proposto.

O teste em questão, designado ARC-AGI, diferenciava-se dos restantes por não recompensar a mera capacidade de memorização dos modelos. O objetivo era avaliar o pensamento abstrato e a generalização através de puzzles visuais - tarefas triviais para o cérebro humano, mas historicamente complexas para as máquinas.

Nos últimos dois anos, a evolução foi notória, mas trazia consigo um obstáculo significativo: o preço exorbitante da computação necessária. É neste contexto que o lançamento do GPT-5.2 altera as regras do jogo.

A questão central deixou de ser se a IA consegue resolver um problema, passando a ser quanto custa essa resolução. Para contextualizar, o modelo o3-preview conseguiu resolver 87% do teste ARC-AGI 1. Embora o feito tenha sido celebrado pelos criadores do teste, a fatura foi pesada: a execução de 100 tarefas teve um custo total de 456.000 dólares, o que se traduz em aproximadamente 4560 dólares por cada tarefa individual.

Com a chegada do GPT-5.2, o modelo mais recente da OpenAI, o cenário mudou radicalmente. O desempenho no ARC-AGI 1 foi superior, atingindo uma taxa de sucesso de 90,5% na versão Pro (X-High). Contudo, o dado verdadeiramente impressionante reside na eficiência económica: cada tarefa custou apenas 11,65 dólares. Trata-se de uma redução de custo na ordem das 390 vezes face ao ano anterior.

Mais surpreendente ainda é a versão otimizada do modelo, que, com um custo inferior a um dólar por tarefa (0,96 dólares), conseguiu ainda assim resolver 86,2% dos problemas.

A superação de novos limites

Antecipando a evolução das máquinas, a equipa de Chollet lançou, em março de 2025, o ARC-AGI 2. Esta segunda versão foi desenhada para elevar a fasquia, constituindo um desafio sério onde os melhores modelos anteriores, como o Claude Opus 4.5, não ultrapassavam os 38% de sucesso.

O GPT-5.2, no entanto, conseguiu resolver perto de 55% destes novos problemas complexos. Este é um salto qualitativo colossal, alcançado com um custo de 15,72 dólares por tarefa. A tendência é inequívoca: a tecnologia não só está a tornar-se mais capaz, como está a ficar drasticamente mais acessível.

Estes resultados são um sinal positivo para o ecossistema tecnológico, contrariando a tese de que o aumento de escala dos modelos estaria a perder eficácia. Embora os ganhos de "inteligência" bruta pareçam estar a estabilizar em certas áreas, os ganhos em eficiência de custos são enormes.

A indústria da IA parece ter atingido um ponto de inflexão. A democratização do acesso a estas ferramentas depende intrinsecamente do preço da sua operação. Para a OpenAI, que atravessa um período onde a sustentabilidade financeira é crítica, esta evolução é vital.

