Pplware

DeepSeek R-1 não é 100% aberto. Mas a Hugging Face quer mudar isso

Nos últimos dias, a DeepSeek tem captado a atenção da indústria da Inteligência Artificial (IA), surpreendendo até mesmo empresas como a OpenAI e a Microsoft. Agora, a Hugging Face decidiu dar um passo significativo e desenvolver uma alternativa 100% open-source do modelo DeepSeek-R1.


De acordo com um comunicado no seu blog oficial, os engenheiros da Hugging Face estão a trabalhar no Open-R1, um projeto que visa reconstruir o modelo de raciocínio da DeepSeek, mas com total transparência.

Com o Open-R1, pretendemos demonstrar como o Reinforcement Learning pode melhorar o raciocínio, partilhar conhecimento reproduzível com a comunidade open-source e estabelecer uma base sólida para futuros avanços nesta área.

Explicou a equipa.

A iniciativa, liderada pelo chefe de investigação da Hugging Face, Leandro von Werra, surge como uma resposta à falta de transparência da DeepSeek. Embora o modelo DeepSeek-R1 seja tecnicamente open-source, existem várias questões pouco claras, nomeadamente sobre os datasets utilizados e os métodos de treino aplicados.

Apesar de a sua licença permitir um certo grau de utilização, não se enquadra no conceito clássico de open-source.

Não há dúvidas de que o modelo R1 é avançado, mas a ausência de dados públicos, experiências detalhadas e modelos intermédios torna extremamente difícil tanto a sua reprodução como o aprofundamento da investigação na área.

Afirmou Elie Bakouch, engenheiro do projeto, numa entrevista à TechCrunch.

Hugging Face quer um modelo verdadeiramente aberto

O objetivo do Open-R1 é desenvolver um modelo equivalente ao DeepSeek-R1 num curto espaço de tempo. Para tal, a Hugging Face irá tirar partido do seu Science Cluster, um sistema de computação de alto desempenho equipado com 768 placas gráficas Nvidia H100, que serão usadas para gerar datasets semelhantes aos utilizados pela DeepSeek. Adicionalmente, a equipa pretende envolver a comunidade de IA no processo de desenvolvimento.

A implementação rigorosa dos algoritmos e das técnicas de treino é essencial. Aqui, um esforço coletivo pode fazer a diferença, trazendo conhecimento diversificado para resolver problemas complexos.

Sublinhou von Werra.

Diferente de outros projetos, o Open-R1 não tem como foco a competição tecnológica entre nações, mas sim combater a falta de transparência dos chamados modelos “black box”. Segundo Bakouch, a falta de acesso ao código de treino do R1 dificulta a compreensão do seu funcionamento e limita a capacidade de adaptação do modelo a diferentes contextos.

Contudo, a iniciativa levanta preocupações sobre o possível uso indevido da IA open-source. Os engenheiros da Hugging Face reconhecem esses riscos, mas defendem que os benefícios da transparência superam as ameaças potenciais.

 

Leia também:

Exit mobile version