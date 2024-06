Uma das maiores controvérsias sobre o uso crescente de IA é que as empresas que treinam estes modelos podem estar a usar dados da Internet protegidos por direitos de autor. Isto levou a uma série de processos judiciais de autores e outras empresas de notícias e conteúdos contra empresas de IA. A Microsoft agora mostrou uma posição única neste tema.

Estes processos tentam provar que afirmam que o Copilot, ChatGPT e outros LLMs estão a ser treinados com dados aos quais não têm o direito de aceder. Não é uma situação simples e que deverá em breve ter respostas por meio de legislação.

Esta semana, Mustafa Suleyman, o recentemente nomeado CEO da nova divisão de IA da Microsoft, foi entrevistado durante o Aspen Ideas Festival. A entrevista, conduzida por Andrew Ross Sorkin, da CNBC, foi publicada, entretanto, no YouTube.

Aos 13:34 minutos do vídeo, Sorkin perguntou a Suleyman sobre o tema da IA que obtém dados da Internet e se estes modelos de IA roubaram efetivamente a propriedade intelectual do mundo. A resposta de Suleyman pode não ser a que os criadores de conteúdos da Internet gostariam de ouvir.

No que diz respeito ao conteúdo que já está na web aberta, o contrato social desse conteúdo desde os anos 90 é o de utilização justa. Qualquer pessoa pode copiá-lo, recriar com ele, reproduzir com ele. Isso tem sido “freeware”, tem sido esse o entendimento.

Existe uma categoria separada em que um site, um editor ou uma organização de notícias disse explicitamente para não me rastrear ou raspar por qualquer outro motivo que não seja indexar-me para outras pessoas poderem encontrar esse conteúdo. Esta é uma área cinzenta e penso que chegará aos tribunais.