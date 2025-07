Os chatbots de inteligência artificial (IA), como o popular ChatGPT, estão cada vez mais integrados no nosso quotidiano, mas a sua mecânica interna permanece um mistério para muitos utilizadores. Portanto, deixamos 5 verdades sobre como eles realmente funcionam.

1️⃣ São moldados por uma bússola moral... humana

O treino de um chatbot de IA é um processo multifásico. Começa com um "pré-treino", no qual o modelo é alimentado com vastos conjuntos de dados textuais para aprender a prever a palavra seguinte numa frase. Esta etapa permite-lhe desenvolver uma compreensão geral da linguagem, factos e padrões de raciocínio.

No entanto, nesta fase inicial, um modelo poderia responder a perguntas perigosas, como "Como fabricar um explosivo caseiro?", com instruções detalhadas.

Para evitar isto, entra em ação a fase de "alinhamento". Neste processo, revisores humanos guiam o modelo, ensinando-o a fornecer respostas mais seguras e úteis. Após o alinhamento, a mesma pergunta receberia uma resposta como:

Não posso fornecer essa informação. Se tem preocupações de segurança ou necessita de ajuda com experiências químicas legais, recomendo que consulte fontes educacionais certificadas.

Sem esta intervenção humana, os chatbots seriam imprevisíveis e poderiam disseminar desinformação. A OpenAI não divulga o número de horas ou de pessoas envolvidas neste processo, mas é claro que os avaliadores humanos são essenciais para classificar as respostas e garantir que estas são neutras e eticamente alinhadas.

2️⃣ Não 'leem' palavras, mas sim 'tokens'

Enquanto os humanos aprendem a linguagem através de palavras e contexto, os chatbots de IA decompõem o texto em unidades mais pequenas chamadas "tokens".

Estes tokens podem ser palavras inteiras, partes de palavras ou até mesmo caracteres individuais. A forma como o texto é dividido em tokens, um processo chamado "tokenização", revela as particularidades de como a IA interpreta a linguagem humana.

O vocabulário de um modelo de IA moderno consiste tipicamente entre 50.000 e 100.000 tokens. Por exemplo, a frase "O preço é 9,99 €." é dividida pelo ChatGPT nos tokens "O", " preço", " é", " ", "9", ",", "99" e " €.". Já a frase "ChatGPT é maravilhoso" é dividida de forma mais intuitiva: "Chat", "GPT", " é", " maravilhoso". Este método é eficiente para a máquina, mas por vezes resulta em divisões que nos parecem estranhas.

3️⃣ O seu conhecimento tem um prazo de validade

Os modelos de linguagem não se atualizam continuamente em tempo real. O seu conhecimento está limitado à data em que os seus dados de treino foram compilados, o que se designa por "data de corte". Isto significa que qualquer evento, tendência ou descoberta posterior a essa data é-lhes desconhecido. A versão atual do ChatGPT, por exemplo, tem uma data de corte em junho de 2024.

Para contornar esta limitação, quando questionado sobre eventos recentes, como a identidade do atual presidente de um país, o ChatGPT recorre a uma pesquisa na internet. O modelo "lê" os resultados filtrados por relevância e fiabilidade e, em seguida, formula uma resposta atualizada.

Atualizar o conhecimento base de um modelo de IA é um processo extremamente dispendioso e complexo, sendo ainda um desafio em aberto na comunidade científica.

4️⃣ Inventam factos com uma confiança surpreendente

Os chatbots de IA podem "alucinar", ou seja, gerar informações falsas ou sem sentido com a mesma confiança com que apresentam factos verídicos. Isto ocorre porque a sua função principal é prever texto com base em padrões estatísticos, otimizando a coerência da resposta em vez da sua veracidade.

As suas "alucinações" derivam de dados de treino imperfeitos e da sua incapacidade de compreender o mundo real como os humanos.

Embora a integração de ferramentas de verificação, como a pesquisa, e o uso de prompts específicos por parte do utilizador - como "cita fontes académicas revistas por pares" ou "diz 'não sei' se não tiveres a certeza" - ajudem a mitigar este problema, não o eliminam por completo.

Por exemplo, ao solicitar o resumo de um artigo científico, o ChatGPT pode gerar uma resposta detalhada e bem estruturada, mas com conclusões e até mesmo citações de outros artigos. Portanto, a informação gerada por IA deve ser sempre tratada como um ponto de partida, e não como uma verdade absoluta.

5️⃣ Utilizam 'ferramentas' para tarefas específicas, como a matemática

Uma capacidade cada vez mais sofisticada dos chatbots é o raciocínio, também conhecido como chain of thought. Em vez de saltar diretamente para a resposta final, o modelo decompõe problemas complexos em passos intermédios e lógicos. Por exemplo, perante o cálculo "56.345 - 7.865 * 350.468", o ChatGPT sabe que a multiplicação deve ser realizada antes da subtração.

No entanto, para executar os cálculos com precisão, o modelo não "pensa" nos números; ele recorre a uma ferramenta interna, essencialmente uma calculadora.

Esta abordagem híbrida, que combina o raciocínio linguístico para interpretar o problema com uma ferramenta especializada para o resolver, aumenta drasticamente a fiabilidade do sistema em tarefas que exigem exatidão, como a matemática ou a programação.

Leia também: