Pplware

Meta acusada de usar 81,7 TB de livros com direitos de autor para treinar a sua IA

No âmbito do processo judicial Kadrey contra a Meta, a empresa de Mark Zuckerberg está a ser acusada de ter utilizado livros protegidos por direitos de autor para treinar os seus modelos de inteligência artificial (IA). Esta acusação ganha novas evidências substanciais com a revelação de emails internos.


O “Anexo A“, parte integrante do caso, inclui vários emails trocados entre funcionários da Meta que confirmam downloads massivos de dados na forma de livros protegidos por direitos de autor. Melanie Kambadu, empregada da Meta, expressou a sua oposição a esta prática já em outubro de 2022.

Num email de abril de 2023, Nikolay Bashlykov, um dos responsáveis pelo processo de recolha de dados, fez piadas com emojis, mas também alertou para os riscos legais associados ao uso de torrents para este fim.

A partir de setembro do mesmo ano, Bashlykov abandonou os emojis e advertiu que o uso de torrents poderia resultar na distribuição ilegal de material protegido, reconhecendo a ilegalidade da prática.

Frank Zhang, investigador da Meta, discutiu internamente sobre evitar o uso dos servidores da empresa para downloads, visando minimizar os riscos de monitorização durante a aquisição desses dados.

Segundo informações reportadas pelo Ars Technica, a Meta descarregou pelo menos 81,7 terabytes de dados através de torrents, incluindo material de bibliotecas como Z-Library e LibGen, que foi encerrada recentemente.

Meta nega qualquer acusação

A Meta alega falta de provas de que qualquer livro tenha sido descarregado por funcionários através de torrents ou distribuído posteriormente pela Meta. O caso continua a desenvolver-se.

Este caso reflete as práticas questionáveis que as empresas de IA adotam para treinar os seus modelos, um tema também presente com outras gigantes como a Google e a OpenAI, que enfrentaram críticas parecidas.

“Fair use” ou abuso?

O conceito de “fair use” (uso justo) tem sido constantemente invocado para justificar estas ações, o que permite o uso limitado de material protegido sem autorização direta. No entanto, o debate sobre os limites éticos destas práticas continua em curso, especialmente no contexto da IA generativa.

 

Leia também:

Exit mobile version