A X.ai, empresa de IA de Elon Musk, revelou o seu mais recente modelo de IA generativa, o Grok-1.5. Preparado para alimentar o chatbot Grok da rede social X "nos próximos dias", o Grok-1.5 parece ser uma atualização bastante significativa em relação ao seu antecessor, o Grok-1.

Grok-1.5 traz melhorias significativas no código e na matemática

O Grok-1.5 beneficia de um "raciocínio melhorado", de acordo com a X.ai, particularmente no que diz respeito a tarefas relacionadas com código e matemática. O modelo mais do que duplica a pontuação do Grok-1 num popular benchmark de matemática, MATH, e obtém mais de 10% de melhoria no teste HumanEval de geração de linguagem de programação e capacidades de resolução de problemas.

É claro que é difícil prever como estes resultados se traduzirão na utilização efetiva. Os benchmarks de IA habitualmente utilizados, que medem coisas como o desempenho em questões de exames de química de nível superior, não conseguem captar a forma como a pessoa comum interage com os modelos atualmente.

Uma melhoria que deve levar a ganhos observáveis é a quantidade de context que o Grok-1.5 pode aceitar em comparação com o Grok-1. O Grok-1.5 tem um context de 128.000 tokens. O context refere-se aos dados de entrada (neste caso, texto) que um modelo considera antes de gerar a saída (mais texto).

"O modelo pode lidar com solicitações mais longas e complexas"

Os modelos com context windows pequenas tendem a esquecer o conteúdo mesmo de conversas muito recentes, enquanto os modelos com contexts maiores evitam esta situação - e, como benefício adicional, compreendem melhor o fluxo de dados que recebem.

O Grok-1.5 pode utilizar informações de documentos substancialmente mais longos. Além disso, o modelo pode lidar com solicitações mais longas e complexas, mantendo a capacidade de seguir instruções à medida que a sua context window se expande.

Escreveu a X.ai.

O que historicamente diferencia os modelos Grok da X.ai de outros modelos de IA generativa é que eles respondem a perguntas sobre tópicos que normalmente estão fora dos limites de outros modelos, como conspirações e ideias políticas mais controversas.

O anúncio do Grok-1.5 vem depois de a X.ai abrir o Grok-1, embora sem o código necessário para treiná-lo ainda mais. Mais recentemente, Musk disse que mais utilizadores do X - especificamente os que pagam o plano Premium de 8 dólares por mês - teriam acesso ao Grok, chatbot que anteriormente só estava disponível para os X Premium+ (que pagam 16 dólares por mês).

