Uma das maiores controvérsias sobre o uso crescente de IA é que as empresas que treinam estes modelos podem estar a usar dados da Internet protegidos por direitos de autor. Isto levou a uma série de processos judiciais de autores e outras empresas de notícias e conteúdos contra empresas de IA. A Microsoft agora mostrou uma posição única neste tema.
Uma posição diferente da Microsoft
Estes processos tentam provar que afirmam que o Copilot, ChatGPT e outros LLMs estão a ser treinados com dados aos quais não têm o direito de aceder. Não é uma situação simples e que deverá em breve ter respostas por meio de legislação.
Esta semana, Mustafa Suleyman, o recentemente nomeado CEO da nova divisão de IA da Microsoft, foi entrevistado durante o Aspen Ideas Festival. A entrevista, conduzida por Andrew Ross Sorkin, da CNBC, foi publicada, entretanto, no YouTube.
Internet pode ser usada para ensinar a IA
Aos 13:34 minutos do vídeo, Sorkin perguntou a Suleyman sobre o tema da IA que obtém dados da Internet e se estes modelos de IA roubaram efetivamente a propriedade intelectual do mundo. A resposta de Suleyman pode não ser a que os criadores de conteúdos da Internet gostariam de ouvir.
No que diz respeito ao conteúdo que já está na web aberta, o contrato social desse conteúdo desde os anos 90 é o de utilização justa. Qualquer pessoa pode copiá-lo, recriar com ele, reproduzir com ele. Isso tem sido “freeware”, tem sido esse o entendimento.
Existe uma categoria separada em que um site, um editor ou uma organização de notícias disse explicitamente para não me rastrear ou raspar por qualquer outro motivo que não seja indexar-me para outras pessoas poderem encontrar esse conteúdo. Esta é uma área cinzenta e penso que chegará aos tribunais.
A resposta de Suleyman parece sugerir que a Microsoft, e talvez outras empresas de IA generativa, acreditam que quase tudo na Internet pode ser usado para treinar os seus modelos, e que essas empresas não têm de compensar os criadores desse conteúdo.
Cenário terá de mudar muito em breve
Esta afirmação irá provavelmente fazer com que ainda mais questões jurídicas sejam levantadas nos próximos meses e anos. A controvérsia está já presente e no passado ficou provado que este cenário aconteceu.
As medidas de proteção contra esta utilização indevida estão a ser implementadas, mas parecem não surtir efeito. Além disso, o compromisso das grandes empresas também nem sempre é cumprido, como já foi mostrado várias vezes.