Zuckerberg é acusado de aprovar utilização de materiais pirateados para treinar IA da Meta
A Meta está a enfrentar um processo judicial que alega que a empresa recorreu a materiais pirateados para treinar os seus modelos de inteligência artificial (IA) Llama, com a suposta aprovação do próprio CEO, Mark Zuckerberg.
Meta parece não respeitar os direitos de autor
De acordo com informações divulgadas pelo TechCrunch, os documentos submetidos no caso Kadrey v. Meta descrevem a utilização do dataset da LibGen como fonte de dados para o treino da IA.
A LibGen, frequentemente referida como uma "biblioteca sombra", é conhecida por disponibilizar livros, revistas académicas, imagens e outros materiais de forma gratuita através de partilha de ficheiros, muitas vezes sem respeitar os direitos de autor.
Segundo os advogados que representam os queixosos, incluindo autores como Sarah Silverman e Ta-Nehisi Coates, Zuckerberg terá autorizado o uso deste repositório, apesar de preocupações levantadas por executivos e funcionários da própria empresa, que descreveram o LibGen como "um conjunto de dados que sabemos ser pirateado".
Os documentos judiciais também alegam que a Meta procedeu à remoção de informações de direitos de autor dos materiais da LibGen antes de os integrar nos modelos Llama. Numa das peças submetidas ao tribunal, a Meta admitiu que apagou "todos os parágrafos sobre direitos de autor do início e do fim" de artigos científicos.
Um engenheiro da empresa terá mesmo criado um script automático para eliminar essas referências, o que, segundo os queixosos, demonstra uma tentativa deliberada de esconder práticas de violação de direitos de autor.
E não acaba aqui...
Outra acusação grave envolve a revelação de que a Meta utilizou torrents para obter materiais da LibGen, uma prática que deixou desconfortáveis vários engenheiros da empresa, especialmente devido à utilização de computadores corporativos para esse fim.
O processo judicial é liderado por Silverman e outros escritores que processaram tanto a Meta como a OpenAI em 2023, acusando as empresas de usar materiais pirateados provenientes de bibliotecas sombra para treinar os seus modelos de IA.
Embora algumas das acusações iniciais tenham sido rejeitadas pelo tribunal, os queixosos reformularam a sua queixa, apresentando novas evidências para sustentar as alegações de infração de direitos de autor e abordando as razões previamente mencionadas para a rejeição.
A Meta ainda não comentou oficialmente sobre estas novas alegações.
Leia também: