Chatbots como o Gemini, o Claude e o ChatGPT podem ser apenas a ponta do icebergue na revolução da inteligência artificial (IA). Pois bem, parece que o próximo grande avanço será com os agentes: programas concebidos para assumir o controlo de sistemas ou aplicações e executar uma grande variedade de tarefas. A Google acaba de dar um passo gigante nesta direção.

Google apresenta uma nova forma de utilizar o browser

A gigante de Mountain View revelou ontem o Project Mariner (anteriormente conhecido como Projeto Jarvis). Trata-se de um agente de IA concebido para compreender o que aparece no ecrã do browser e realizar ações em nome do utilizador. Baseia-se no Gemini 2.0, a versão mais recente da família de modelos de linguagem da empresa.

A Google explica que o Project Mariner tem a capacidade de interagir com páginas Web graças a uma extensão experimental disponível no Chrome. Em primeiro lugar, o sistema analisa as instruções do utilizador (escritas ou faladas). Em seguida, tenta realizar os pedidos solicitados, analisando os pixéis, o texto da página, o código, as imagens e até os formulários.

Num vídeo de demonstração, é possível ver uma janela do Chrome com uma folha do Google Sheets aberta, onde estão apresentados nomes de várias empresas. Um membro da equipa da Google DeepMind pede ao agente que pegue na lista de empresas e procure nos respetivos websites para extrair um e-mail de contacto. Imediatamente, o agente começa a fazer exatamente o que lhe foi pedido:

[Vídeo original]

O agente abre a página do motor de pesquisa da Google, procura cada uma das empresas, navega dentro delas até à secção "About us" e extrai a informação. O agente faz um relatório de progresso visual numa barra lateral do browser, para que o utilizador saiba exatamente o que está a fazer. Também é possível parar a sua execução em qualquer altura.

A Google afirma que o agente pode ser útil para automatizar tarefas repetitivas e ajudar a poupar tempo às pessoas. E, se um pedido não for suficientemente claro, o agente pode pedir esclarecimentos ou mais informações ao utilizador. Isto deverá reduzir as situações de falha. É de salientar que a empresa espera que o seu agente apresente alguns bugs, uma vez que se trata de uma versão experimental que está momentaneamente disponível apenas para alguns "testers de confiança".

Em outubro deste ano foi apresentado o Computer Use da Anthropic, um sistema de automatização de tarefas ao nível do sistema operativo. Como se trata de uma versão inicial, o agente ainda é muito limitado. De qualquer forma, esta tecnologia deverá continuar a evoluir.

Leia também: