Pplware

Não é possível pagar por todos os dados usados para treinar a IA, dizem gigantes

A Inteligência Artificial (IA) está a impulsionar notórias mudanças e melhorias no mundo moderno. Para o seu crescimento, são necessárias insanas quantidades de dados, pelas quais, segundo as gigantes, não é possível pagar.


Os modelos de linguagem que alimentam ferramentas de IA como o ChatGPT da OpenAI, Bing Chat da Microsoft e Bard da Google foram e são treinados com largos conjuntos de dados. Graças a isso, pela informação que reúnem, são capazes de nos responder às mais remotas questões.

A esses conjuntos de dados dão forma informações espalhadas por websites, notícias, livros, blogues, entre outras plataformas e fontes. Além disso, os chatbots também alimentam a sua sabedoria com imagens e vídeos alheios.

À medida que a IA generativa evolui e se torna mais popular e utilizada, os autores de trabalhos de todos os tipos estão a começar a queixar-se – alguns mesmo a processar – as grandes empresas tecnológicas por utilizarem o seu trabalho sem permissão.

Aliás, há quem afirme que o atual quadro legislativo não contempla esta realidade que viola os direitos de autor.

 

Solução não pode passar por atribuir direitos de autor, dizem gigantes

A trabalhar nesta questão está, alegadamente, o Copyright Office dos Estados Unidos da América, que pretende encontrar uma estratégia de compensação para os autores. Para já, o processo está em fase de recolha de perspetivas e comentários pelas partes envolvidas no tema.

Na sequência desse trabalho de recolha, algumas das maiores empresas de tecnologia já admitiram que não faz sentido atribuir direitos de autor aos dados que utilizam para treinar a IA.

De acordo com o Business Insider, a Meta, por exemplo, observou que “seria impossível para os desenvolvedores de IA adquirirem licenças de direitos de autor para obras críticas”, tendo em conta que são utilizadas largas quantidades de dados.

Outras empresas como OpenAI, a Microsoft e a Google adotaram uma posição semelhante, alegando que são utilizados tantos dados que não existe uma forma viável de pagar por todos eles, através da emissão de licenças.

O grupo que representa estas empresas, TechNet, também afirmou que a abordagem prejudicaria o desenvolvimento da IA.

Exit mobile version