Wikipédia quer cobrar gigantes tecnológicas pelo uso dos seus dados para treinar IA
Numa era dominada pela inteligência artificial (IA), a Wikimedia Foundation delineou uma nova estratégia para assegurar a sustentabilidade da Wikipédia. A solução passa por cobrar às empresas que utilizam os seus vastos dados para treinar os seus modelos de linguagem.
Um novo modelo de negócio para a Wikipédia
A maior enciclopédia livre do mundo está a adaptar-se aos novos tempos. Embora a celebração do seu 25.º aniversário traga à memória as suas origens como um projeto sem fins lucrativos, a Wikimedia Foundation apresentou uma visão de futuro que redefine o seu papel: uma Wikipédia preparada para a era da IA.
Neste contexto, a fundação revelou que gigantes tecnológicas como a Microsoft, a Meta e a Amazon se juntaram a outras empresas, como a Google, para utilizar o conteúdo da Wikipédia no treino dos seus modelos de IA. Para tal, estas corporações investem quantias enormes para obter um acesso privilegiado a estes dados.
A Fundação Wikimedia confirmou que empresas como a Microsoft, Meta, Amazon, Perplexity e Mistral AI são agora clientes pagadores da Wikimedia Enterprise, uma plataforma comercial lançada em 2021. De acordo com Lane Becker, diretor sénior de receitas da fundação, esta iniciativa disponibiliza uma versão da API da Wikipédia otimizada para utilização comercial.
O serviço foi desenhado para responder às necessidades de empresas de IA, oferecendo funcionalidades personalizadas e um acesso mais robusto aos dados. As tecnológicas dependem de forma massiva da Wikipédia para treinar os seus modelos, aproveitando os seus 65 milhões de artigos em mais de 300 idiomas.
Este uso intensivo, no entanto, aumentou exponencialmente os custos de manutenção e dos servidores da fundação, que tradicionalmente dependia de pequenas doações do público.
A Wikipédia é um componente crítico para o trabalho destas empresas, que precisam de encontrar uma forma de nos apoiar financeiramente.
Explicou Becker à Reuters.
Um equilíbrio entre o acesso livre e a sustentabilidade financeira
A Wikimedia Enterprise é muito mais do que um simples descarregamento da Wikipédia. A plataforma permite que as empresas acedam aos conteúdos a um volume e a uma velocidade concebidos especificamente para o treino de modelos de IA em larga escala, com formatos de dados estruturados e a possibilidade de solicitar funcionalidades personalizadas.
Este modelo de financiamento representa uma grande mudança para a Wikimedia Foundation. Durante anos, a enciclopédia dependeu de donativos individuais, enquanto grandes corporações beneficiavam gratuitamente do seu conhecimento.
Agora, a fundação encontrou um ponto de equilíbrio: manter o acesso livre para o público em geral, ao mesmo tempo que monetiza a utilização comercial intensiva, garantindo a sua sustentabilidade a longo prazo.
Alcançar um novo equilíbrio sustentável com estas empresas é crítico para a nossa existência contínua, mas também para a delas.
Sublinhou Becker ao The Verge.
Leia também:






















E será que a Wikipedia quer pagar aos utilizadores que escreveram os artigos?
Ora bem, assim vistas as coisas à distância, os utilizadores que referes sabiam que não iam ser pagos ao alimentar a Wikipédia? Acho que sabiam.
A Wikipédia e outros sites sabiam que iam ser roubados por uma ferramenta de IA? Julgo que não.
A mim parece-me bem que o Sam ao invés de açambarcar toda a sabedoria da net para ele, ficando logo multi milionário, pague pelo menos a quem fornece o serviço.
Até porque se as Wikipédias e outros sites de informação deixarem de ser acedidos, deixarão de existir. Onde vai depois a IA buscar informação?
Excelente resposta.
Exato… Á uns anos atrás fartei de explicar a esses senhores que a nossa antiga “G3” não era Automática…. Finalmente eles corrigiram… Mas não pagaram nada…
Já agora, os bancos, e todas as empresas ( que são centenas) que teem os nossos dados Enis vendem, não nos pagam porquê?
Não é muito leal, uma empresa, ganhar dinheiro, com o conhecimento dos outros, sem esses mesmos outros, não receberem nada com isso. Mas infelizmente, é o que há mais hoje em dia.
Acho que têm razão.. a sobrevivência do Wikipédia tem sido complicada e a IA só vai trazer menos hits nas suas páginas.
Fazia sentido pedir aos leitores um contributo, como até hoje, mas hoje em dia os maiores leitores são os scrapers de IA, logo, faz sentido que eles tb contribuam para manter este serviço.
Os textos da wikipédia são licensiados segundo a GNU Free Documentation License, ninguém paga nada.
Segundo essa Licença, se o Chat GPT, o Gemini, a Meta AI, etc. distribuirem mais de 100 “cópias” do conteúdo, ainda que editadas ou truncadas, teriam de pagar.
Quantas subscrições ou prestações de serviço e acessos foram vendidos?
Seria simplesmente justo. E deviam pagar aos redditors, aos autores que viram os seus livros sacados dos sete mares, aos investigadores que partilharam know how na deep web e no Google scholar, aos que perderam emprego porque as suas tarefas foram substituidas e a todos aqueles de quem recolhem dados.
Ahahahahah. A Wikipedia foi criafa com base em livros.
Qualquer dia o acesso a muitos dos sites, é feito, só com login.
A Wikipédia faz muito bem, essas empresas de IA tem milhões, não precisam de usar o trabalho dos outros para passarem a ter biliões. Até digo, é preciso ter descaramento essas empresas não avançarem por moto-próprio nessas compensações. Roubar parece estar na ordem do dia.