A IA chinesa DeepSeek abalou o mundo da IA porque, em teoria, era um LLM muito avançado que teria custado apenas 6 milhões de dólares no total. Os números apresentados davam uma "chapada de luva branca" à tecnologia da americana OpenAI. Contudo, o Bom, Bonito e Barato... afinal poderá ser mentira!

DeepSeek é muito mais cara do que o anunciado

Sim, o cenário parece ser extraordinário, aliás, segundo os números apresentados, talvez até demasiado bom para ser verdade. Os dados de um estudo partilhado pela SemiAnalysis confirmam que tudo não passou de uma ilusão em que muitos quiseram acreditar.

O estudo baseia-se num ponto crucial: o custo do hardware necessário para treinar o DeepSeek. Para este treino, foram usadas GPUs da NVIDIA, mais precisamente modelos H800 e H100, cujo custo total ronda os 1.600 milhões de dólares. A isto, soma-se o custo operacional de manter e utilizar essas GPUs, estimado em cerca de 944 milhões de dólares.

No total, para treinar o DeepSeek, terão sido utilizadas cerca de 60.000 GPUs da NVIDIA, resultando num custo acumulado de aproximadamente 2.573 milhões de dólares, segundo a SemiAnalysis. Além disso, há outro fator importante a considerar: o custo dos dados necessários para alimentar um modelo desta dimensão.

De acordo com as informações mais recentes, os responsáveis por esta IA podem ter roubado dados da OpenAI e treinado o DeepSeek com uma técnica conhecida como destilação de resultados. Este método viola as políticas de uso da API da OpenAI, mas permite reduzir significativamente os custos de treino de uma IA.

Os tais 6 milhões de dólares referem-se apenas ao custo em GPUs na fase de pré-treino, o que representa uma pequena fração do custo total do modelo. Este valor ignora despesas fundamentais como os investimentos em I&D e o custo total de propriedade do hardware.

Em resumo, o valor divulgado não reflete o custo real. Além disso, o facto de o DeepSeek ter conseguido acesso a um número tão elevado de GPUs para treinar a sua IA levanta questões sobre a eficácia das restrições de exportação deste tipo de hardware para a China, um tema que já está a ser investigado.

IA chinesa será assim tão impressionante?

Tecnicamente, representa um avanço importante na inteligência artificial, mas isso depende da comparação. Em termos de custo por milhão de tokens, oferece um bom valor face a certos modelos, como o GPT-4o-0513, mas fica atrás do GPT-4o-mini e do Llama 3.2 70B.

Resta ver como este tema vai evoluir e qual será o desfecho da polémica gerada em torno deste modelo. No entanto, uma coisa é certa: a chegada do DeepSeek deverá intensificar a concorrência entre modelos de IA avançada, algo que poderá ter um impacto positivo no setor.