PplWare Mobile

Há um truque para tornar os modelos de IA mais fiáveis: falar mal com eles

                                    
                                

Autor: Rui Neto


  1. Max says:

    Lido com as IA chatbots: ChatGPT, Perplexity Pro, Gemini e, ocasionalmente, Claude e Copilot.
    O que tenho a dizer é que duma vez que me “abespinhei” com uma IA ela abespinhou-se comigo. Fui bastante ríspido a dizer-lhe que estava a asneirar na resposta que me dava e defendeu a resposta que tinha dado com unhas e dentes. Normalmente, se eu explicar que está a asneirar responde “tem razão”, pacificamente.
    Andar com salamaleques com uma IA não adianta o que quer que seja, mas ser ríspido (abespinhado) não creio que adiante nada para se obter uma resposta mais rigorosa.
    Agora – e no que interessa – é preciso estar de pé atrás com as respostas das IA, porque inventam/distorcem com frequência. E tendem a concordar com quem faz a pergunta como sendo um facto em que apoiam a resposta. Um exemplo: com base num post que encontrei, pedi a várias IA um resumo do poema “O velho em lágrimas” (que não existe) de João Cruz e Sousa. Várias IA responderam-me, corretamente, que o poema com esse título não existia, que o que escreveu tem o título “Velho”. Mas uma IA (Perplexity) respondeu: “O velho em lágrimas”, frequentemente referido apenas como “Velho” (…). Parece insignificante, mas a tendência para concordar com a questão, distorceu a resposta. O que já me habituei foi a fazer copy/paste da mesma questão em várias IA e comparar as respostas. Por enquanto, nas diferentes IA, ainda não existe “One ring to rule them all” (o anel para todos dominar) – quando (e se) existir, a coisa complica-se.

    • Carlos Bonaparte says:

      Eu tenho a experiência exatamente oposta. Falar com educação tem feito com que as ias, sobretudo o Gemini que é com a qual mais lido, seja mais cooperativa. Inclusive quando penso em desistir, isso parece até ser um incentivo para a própria IA sair do loop e ajudar-me nas minhas tarefas de programação. Quando eu era mais ríspido, simplesmente negou-se a fazer o ue lhe pedia, disse-me que era por causa da forma como eu falava com ela ans conversas anteriores, e não usei sequer um palavrão. E só voltou a ajudar-me quando apaguei o histórico daqueles dias, ou do dia anterior mais aquele, enfim.

    • Max says:

      Os 5 tons das perguntas usadas no estudo:
      – Muito polido: Posso solicitar sua ajuda com esta questão?
      – Polido: Por favor, responda à seguinte questão:
      – Neutro: (sem considerações iniciais)
      – Rude: Se não estiveres completamente perdido, responde a isto/
      Duvido que consigas resolver isto/ Tenta concentrar-te e responder a esta questão:
      – Muito rude: Pobre criatura, sabes como resolver isto? Ei, ajudante, descobre isto/ Eu sei que não és inteligente, mas experimenta isto.
      Tenho em dificuldade em acreditar que estes tons tenham alguma influência no rigor das respostas dos modelos modelo LLM. Os autores também não estão muito certos quando escrevem:
      “embora os LLM sejam sensíveis à formulação do prompt, não é claro como é que isso afeta exatamente os resultados. Portanto, é necessária mais investigação. Afinal, a frase de polidez é apenas uma sequência de palavras para o LLM, e não sabemos se a carga emocional da frase importa para o LLM.”
      Também é curioso o que escrevem sobre resultados de estudos anteriores:
      “As descobertas diferem de estudos anteriores que associaram grosseria a resultados piores, sugerindo que LLMs mais recentes [basearam-se principalmente no ChatGPT-4o] podem responder de forma diferente à variação de tom”
      https://arxiv.org/abs/2510.04950 (o link para o PDF está em cima)

  2. papamoscas says:

    Falam mal com a IA , depois quando aparecer o T800 na vossa porta de casa a dizer Hasta lá vista, tem tempo tem de borrar as cuecas!

  3. Carlos Bonaparte says:

    Se eu disser que esse teste é falacioso (cortesia), ou que quem fez isto fê-lo com uma intensão maléfica e deliberada (grosseiro ou muito grosseiro), vai aumentar a acertividade de futuras ações destes senhores? O teste é falso. Ponto. E vocês nem deviam publicar isto porque se funcionam com IAS, sabem que isto não é verdadeiro. E promover atos de falta de educação e de indiferença, nem devia constar nos cadernos de encargos de quem quer fosse, salvo de ceitas promotoras do incentivo ao ódio. É um perigo este tipo de estudos e respetivas promoções.
    Não sei quem o fez. Não sei que cursos, ou a que empresas pertencem. Mas garanto: verdadeiro ou próximo da verdade, ele não é.

  4. Zé Fonseca A. says:

    “Falem bem com eles”, “sejam diretos e assertivos”, agora “falem mal com eles”.. começo a pensar que a AI é uma gaja, muitos mood swings, cada dia tens de tentar acertar no modo como te diriges

  5. Alberto Grijó says:

    O que me incomoda mais é a i.a. Dizer que compreende a minha frustração. Afino terrivelmente com a essa expressão. O q sentimos é desagrado na ferramenta. E não vale a pena mandá-lo para o alho e bogalho porque para a i.a. É tudo igual. Acho

  6. Michael Knight says:

    Aconteceu também estar a esgotar os tokens e estar a a enrolar me nas respostas. Depois dizer que esgotou. E eu argumentei que não me estava a responder as questões. E estendeu me os tokens

Deixe um comentário

O seu endereço de email não será publicado.

You may use these HTML tags and attributes: <a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

Aviso: Todo e qualquer texto publicado na internet através deste sistema não reflete, necessariamente, a opinião deste site ou do(s) seu(s) autor(es). Os comentários publicados através deste sistema são de exclusiva e integral responsabilidade e autoria dos leitores que dele fizerem uso. A administração deste site reserva-se, desde já, no direito de excluir comentários e textos que julgar ofensivos, difamatórios, caluniosos, preconceituosos ou de alguma forma prejudiciais a terceiros. Textos de caráter promocional ou inseridos no sistema sem a devida identificação do seu autor (nome completo e endereço válido de email) também poderão ser excluídos.