xAI de Elon Musk lança o Grok 3: modelo supera o GPT-4o em alguns benchmarks
A xAI, empresa de inteligência artificial de Elon Musk, lançou esta madrugada o seu mais recente modelo de IA, o Grok 3, juntamente com novas funcionalidades para as aplicações Grok no iOS e na web. Segundo a empresa, este novo modelo supera até o GPT-4o em alguns benchmarks.
O Grok surge como resposta da xAI a modelos como o GPT-4o da OpenAI e o Gemini da Google: é capaz de analisar imagens e responder a perguntas. Além disso, impulsiona diversas funcionalidades na rede social X, também propriedade de Musk.
O desenvolvimento do Grok 3 decorreu durante vários meses e, embora estivesse previsto para 2024, o lançamento sofreu um ligeiro atraso.
Este lançamento representa um marco para a xAI
A empresa tem utilizado um data center massivo em Memphis, equipado com cerca de 200.000 GPUs, para treinar o Grok 3. De acordo com Musk, o novo modelo foi desenvolvido com um poder computacional "15 vezes superior" ao do seu antecessor, o Grok 2, utilizando um dataset que incluiria até registos de processos judiciais.
O Grok 3 é significativamente mais capaz do que o Grok 2. Trata-se de uma IA que procura a verdade ao máximo, mesmo que essa verdade não seja politicamente correta.
Afirmou Musk durante a apresentação ao vivo.
Na realidade, o Grok 3 é uma família de modelos. Existe uma versão mais leve, o Grok 3 mini, que responde mais rapidamente, embora com alguma perda de precisão. Nem todas as versões e funcionalidades do Grok 3 estão disponíveis de imediato, com algumas ainda em fase beta.
A xAI alega que o Grok 3 supera o GPT-4o em vários benchmarks, incluindo o AIME (que avalia a performance do modelo em questões matemáticas) e o GPQA (que testa o modelo com problemas de física, biologia e química ao nível de doutoramento).
Uma versão preliminar do Grok 3 também obteve bons resultados no Chatbot Arena, um teste de IA baseado na votação de utilizadores, segundo a xAI.
Dois dos novos modelos da família Grok 3, designados Grok 3 Reasoning e Grok 3 mini Reasoning, são capazes de "pensar" de forma mais estruturada sobre os problemas, semelhante a modelos de "raciocínio" como o o3-mini da OpenAI e o R1 da empresa chinesa DeepSeek. Estes modelos tentam verificar a veracidade das suas respostas antes de as fornecerem.
A xAI afirma que o Grok 3 Reasoning ultrapassa o melhor modelo da gama o3-mini da OpenAI, especialmente em benchmarks matemáticos mais recentes, como o AIME 2025.
Os modelos de raciocínio estão acessíveis através da aplicação Grok. Os utilizadores podem pedir ao Grok 3 para "pensar" ou, para perguntas mais complexas, utilizar o modo "Big Brain", que recorre a um processamento adicional. A xAI descreve estes modelos como ideais para questões de matemática, ciência e programação.
Musk referiu que parte do processo de raciocínio destes modelos é ocultada na aplicação Grok para evitar distillation, uma técnica usada por outras empresas para extrair conhecimento de modelos concorrentes. Recentemente, a DeepSeek foi acusada de utilizar esta técnica para desenvolver os seus modelos com base nos da OpenAI.
Os modelos de raciocínio do Grok também são a base de uma nova funcionalidade chamada DeepSearch, uma ferramenta que analisa informações na internet e no X para fornecer resumos detalhados.
Os utilizadores do plano Premium+ do X (com um custo de 50 dólares por mês) terão acesso prioritário ao Grok 3, enquanto funcionalidades adicionais estarão disponíveis numa nova subscrição chamada SuperGrok. Segundo rumores, este serviço custará 30 dólares por mês ou 300 dólares por ano e incluirá acesso maior ao DeepSearch e geração ilimitada de imagens.
Modo de voz também chegará ao Grok 3 em breve
No futuro próximo, possivelmente dentro de uma semana, a aplicação Grok receberá um "modo de voz". Algumas semanas depois, os modelos Grok 3 serão disponibilizados através da API empresarial da xAI, juntamente com a funcionalidade DeepSearch.
Quando foi apresentado há cerca de dois anos, o Grok foi promovido por Musk como uma IA irreverente, sem filtros e contra o que considera ser a "cultura woke" dominante noutras inteligências artificiais.
No entanto, antes do Grok 3, o modelo mostrava alguma hesitação ao abordar temas políticos, recusando-se a ultrapassar certos limites. Um estudo indicou que o Grok demonstrava tendências mais alinhadas com a esquerda política em temas como direitos transgénero, programas de diversidade e desigualdade social.
Musk atribui este viés aos dados de treino do Grok, que incluem páginas públicas da web, e comprometeu-se a "ajustá-lo para ser mais politicamente neutro". Ainda não é claro se a xAI alcançou esse objetivo.
Leia também:
Alguns bench’s? Todos!
Assim a openai vai apressar o chatgpt 5
Melhor pra todos. Deepseek deve estar a preparar algo também. Meta e Google e cloude seguem-se
Só não vejo os preços a baixar…..
Até agora, a nível de valores somente a DeepSeek tem matéria a oferecer..
O resto ainda está extremamente caro para colocar em software de Produção capaz de ajudar todas as empresas.
+1
Discordo. Openai o3 é o mais barato. Explico porquê, apesar de o token de entrada ser mais caro a saída é muito melhor que deepseek ou outras soluções. Isto é, o o3 mini executa e dá uma resposta de boa qualidade, enquanto o deepseek necessita de uma parametrização muito maior para entregar a mesma qualidade isso gasta mais tokens principalmente na ida. Isto falando na prática.
Quanto ao sw de produção, já não existe mais. O meta agora é a substituição do Saas por Agentes de IA (IA vertical). Ainda não estou a vender, mas neste momento tenho para mim um fluxo feito em n8n com vários agentes IA que falam comigo, gerem tudo o que tem a ver com google desde calendários(ver marcar, remover), ver documentos, enviar/ler emails, marcação de reuniões incluindo zoom tudo automatizado, comunico com eles por whatsapp em audio(para integrar com a alexa devem ser dois palitos). Isto apenas com llama3.1 7b que dá bem conta do recado e sobra, não precisava de tanto (tudo instalado numa maquina local com um tunel da cloudflare para aceder pela internet). Para explorar comercialmente basta alugar um servidor com gpu nvidia e implementar lá o sistema, 80GB de VRAM vão custar 200eur/mes aprox mas consegue servir facilmente várias empresas trazendo retornos bem superiores. Exemplo prático, atendimento via webchat/Whatsapp/Instagram/Telegram/e-mail para clinicas, responde todas as duvidas (horarios, especialidades, convenios,outros), direciona o cliente para a especialidade correta, faz marcação e envia os dados para o cliente, para a clinica e o médico/terapeuta. Acredito que as pessoas estão fartas de instalar novas apps, na minha visão é mais inteligente usar os caminhos/apps que as pessoas já usam diariamente.
será que me vai ensinar a falar alemão e a ensinar como chamar um taxi?
Deixem o pó pousar… Para já o que é dito neste mesmo artigo é que o Grok “demonstrava tendências mais alinhadas com a esquerda política em temas como direitos transgénero, programas de diversidade e desigualdade social.” mas os adeptos Musk podem ficar descansados que o Elon já está a “ajustá-lo para ser mais politicamente neutro”.
Aliás neste mesmo artigo existe o link https://www.wired.com/story/fast-forward-elon-musk-grok-political-bias-chatbot/ que lhes permitem ficar descansados… ou talvez não. Recomendo vivamente a leitura deste artigo para ficarem elucidados (se é que tinham dúvidas) da forma como as redes sociais funcionam, ou as obrigam a funcionar.
Liberdade de expressão à maneira Elon, “Ou pensas como eu ou ficarás a pensar como eu”
Se o Musk diz…agenti akardita!