Model Context Protocol (MCP): o que é e como funciona este protocolo para agentes de IA?

Rui Neto

8 meses ago

O Model Context Protocol (MCP), introduzido pela primeira vez em novembro de 2024 pela Anthropic, tem vindo a ganhar popularidade por oferecer uma forma mais coerente e consistente de ligar Large Language Models (LLM) a ferramentas e funcionalidades externas. Mas o que é e como funciona exatamente este protocolo?

O que é o Model Context Protocol (MCP)?

Para compreender o MCP, é essencial, antes de mais, entender o conceito de “agente de IA”. Ao contrário de um chatbot como o ChatGPT, que responde a pedidos diretos, um agente de IA é um sistema autónomo concebido para interpretar o seu ambiente, tomar decisões e executar ações de forma proativa.

Estes agentes dependem de modelos de inteligência artificial (IA) para processar informação e deliberar sobre os passos seguintes.

Contudo, para que um agente seja eficaz, necessita de um fluxo constante de informação proveniente de diversas fontes externas. É precisamente aqui que o MCP é importante. O MCP funciona como um intermediário standard, uma ponte que liga o modelo de IA do agente às fontes de dados e ferramentas de que este precisa para operar.

Desta forma, o modelo consegue consultar informações em tempo real e tomar decisões mais informadas e precisas.

A diferença face ao RAG

Atualmente, uma das abordagens mais comuns para fornecer dados a modelos de IA é a Retrieval-Augmented Generation (RAG). No entanto, este método possui uma desvantagem enorme: exige que todos os documentos e dados sejam previamente indexados e armazenados em bases de dados vetoriais, um processo que pode ser moroso e consumir bastantes recursos.

O MCP apresenta-se como uma alternativa mais eficiente. Em vez de depender de uma base de dados intermédia, o protocolo permite que o agente aceda diretamente às fontes de dados originais, como ficheiros locais, APIs ou outros sistemas.

Esta abordagem elimina a necessidade de indexação prévia e garante que a informação utilizada é sempre a mais recente e fidedigna. A troca de dados e informações torna-se, assim, mais rápida e próximo do tempo real.

Além disso, o MCP simplifica a integração com ferramentas externas. Anteriormente, os programadores tinham de escrever código complexo e personalizado para definir cada chamada de função que um modelo de IA pudesse fazer. O MCP fornece uma interface standard sobre estas chamadas e permite que os modelos interajam com o mundo exterior de forma universal.

É importante salientar que se trata de um padrão aberto, desenvolvido pela Anthropic (empresa responsável pelo modelo de IA Claude), o que incentiva a sua adoção por toda a comunidade tecnológica.

Como funciona a arquitetura do MCP

O funcionamento do padrão MCP baseia-se numa arquitetura cliente-servidor composta por três elementos essenciais que operam em conjunto:

MCP Host: Corresponde à aplicação ou ao agente de IA que necessita de aceder a dados ou utilizar uma ferramenta externa. É o host que inicia o pedido.
MCP Client: É o componente de software que o host utiliza para gerir a comunicação. O client implementa o protocolo e assegura que os pedidos são formatados e enviados corretamente para o server.
MCP Server: Trata-se do programa que está diretamente ligado à fonte de dados (por exemplo, um sistema de ficheiros ou uma API) ou à ferramenta. O servidor “expõe” as capacidades disponíveis – como “procurar um ficheiro” ou “ler o conteúdo de um email” – e responde aos pedidos do cliente.

De: towardsdatascience.com

O fluxo de trabalho é, portanto, bastante lógico. Quando o agente de IA (host) precisa de executar uma tarefa que requer informação externa, utiliza o MCP client para estabelecer uma ligação com o MCP server apropriado.

O servidor processa o pedido, obtém os dados ou executa a ação e devolve o resultado. Com essa informação em mãos, o agente pode então prosseguir com o seu processo de tomada de decisão.

Leia também:

Google lança um protocolo aberto para os agentes de IA comunicarem entre si