Suíça lança o Apertus, um modelo de IA soberano, de código aberto e transparente
A Suíça está a lançar o seu próprio LLM soberano, o Apertus. Quer ser uma IA “confiável, soberana e inclusiva”. Multilingue, de código aberto e de grande escala, este modelo de IA pode ser utilizado para desenvolver bots, sistemas de tradução, ferramentas educativas e até mesmo em projetos comerciais.
Apertus, latim para “aberto”, é um novo LLM desenvolvido por três instituições públicas suíças. O Centro Nacional Suíço de Computação Científica (CSCS), o Instituto Federal Suíço de Tecnologia em Lausanne (EPFL) e o Instituto Federal Suíço de Tecnologia em Zurique (ETH) têm vindo a trabalhar na criação deste LLM completamente aberto.
Os dados de treino, a metodologia, os parâmetros e a arquitetura do Apertus são documentados e de livre acesso, ao contrário da maioria dos outros modelos. O Apertus foi treinado com 15 triliões de palavras ou partes de palavras (tokens) de mais de 1.000 línguas. 40% das suas fontes, todas públicas, não são o inglês — incluindo línguas geralmente sub-representadas, como o romanche e o suíço-alemão.
O modelo pode ser utilizado por investigadores de IA, profissionais, empresas e até mesmo particulares, tudo gratuitamente no Hugging Face. Estão disponíveis duas versões: 8 mil milhões e 70 mil milhões de parâmetros, sendo a mais pequena mais adequada para uso individual.
Uma vez que o LLM está licenciado sob a licença Apache 2.0, pode ser utilizado para investigação e ensino, bem como para aplicações comerciais O Apertus será atualizado regularmente, embora não tenha a intenção de competir com o fluxo interminável de novos modelos comerciais, como o GPT-5. Os lançamentos futuros irão alargar a família de modelos e melhorar a sua eficiência. Um dos objetivos é também desenvolver variantes específicas para determinadas áreas de negócio, como o direito, a saúde ou a educação.
Uma das vantagens deste LLM para as empresas e organizações que o pretendam utilizar é que tem em conta as leis suíças sobre a proteção de dados, os direitos de autor, bem como as obrigações de transparência do regulamento europeu sobre a IA (a Lei da IA).
Para a Public AI Inference Utility, uma iniciativa que visa facilitar o acesso público aos modelos de IA, o Apertus é “o modelo público de referência para a IA: um modelo construído por instituições públicas, para o interesse público. É a melhor prova até à data de que uma IA se pode tornar numa verdadeira infra-estrutura pública, tal como as estradas, a água ou a eletricidade”.




















“Apertus foi treinado com 15 triliões de palavras ou partes de palavras (tokens) de mais de 1.000 línguas”
Inclui o português de Portugal ?
Português espero que não, só para te chatear para uma pergunta um tanto idiota!!
Faltou dizer que era baseado em…
“Quer ser uma IA “confiável, soberana e inclusiva”. Inclusiva? Em que maneira é que as outras IA’s não são inclusivas.
É top não haja dúvida…estive a testar e perguntei qual é o primeiro ministro actual de Portugal…a resposta:
“O primeiro-ministro de Portugal é António Costa, que tem ocupado este cargo desde o 26 de novembro de 2015. Ele lidera um governo de coligação envolvendo o Partido Socialista (PS) e o Bloco de Esquerda (BE). As eleições para a Assembleia da República foram realizadas em outubro de 2019, e a atual legislatura começou em janeiro de 2020. A função de primeiro-ministro é a de chefe de governo de Portugal e pode variar de acordo com as eleições e as alianças políticas existentes no país. É importante verificar informações recentes e fontes politicas fiáveis para obter informações precisas e atualizadas sobre a composição do governo português e os nomes dos seus membros.”
lol
Ainda nao reconhece a palavra actual, precisa de mais treinamento. hehe Alem disso nao sabe responder a uma pergunta directa. Apenas responder o nome, precisavamos de saber isso tudo ? Se fosse para saber outras coisas perguntava-se de maneira diferente.
Isso tem que ver com a data de corte dos dados que foram usados para o pré-treino do Apertus. É um problema comum a outros modelos quando foram lançados. Já reinava Trump há meses e ainda diziam que o presidente era Biden.
O pessoal já se esqueceu que as versões iniciais do ChatGPT foram lançados com data de corte – e sem acesso à internet para atualizar os dados (depois de seguir um processo de validação).
Confirmei que o Apertus ainda não tem acesso à internet para atualizar os dados e por isso a situação que relatas é perfeitamente normal, durante bastante tempo. O Apertus avisa quando diz: “É importante verificar informações recentes e fontes politicas fiáveis para obter informações precisas e atualizadas sobre a composição do governo português e os nomes dos seus membros.”
Este chat responde em que variante do português ?
AI “Respondo em português padrão brasileiro. Se preferir discutir em castelhano, francês, italiano ou outra variante, por favor me informe!”
Igual as outras, 1000 línguas menos o português de Portugal, os políticos portugueses são uma vergonha nem a nossa identidade linguística sabem porteger .
É este o tipo de IAs vamos ter nas escolas portuguesas onde respondem no português do brasil em vem vez no nosso Português ?
Haja vergonha .
+1
mas o problema não se restringe à IA, a msft e a google já fazem isso há muito tempo com os resultados das pesquisas, sabem que o teu ISP está na euroma mas os primeiros resultados que mostra são pt/br. Desconfio que pt/pt desaparece na próxima geração ou seguinte. A maior parte dos conteudos “impigidos” pelos algoritmos aos putos são pt/br e eles “papam” com naturalidade.
*ISP está na Europa
Kkkk. É que o brasileiro é massa!!! Tem mais palavras que vocês não conhecem!!!!
“O primeiro-ministro anunciou esta segunda-feira o lançamento, no primeiro trimestre do próximo ano, de um “grande modelo de linguagem” em português (LLM, sigla em inglês), que considerou “um passo crítico” para o ensino, administração pública ou empresas.” (Expresso, 11/11/2924)
“O grande modelo de linguagem (LLM) de inteligência artificial (IA) português vai chamar-se Amália e a sua versão final será lançada em 2026” (19/11/2024).
Está marcada uma apresentação pública para o próximo dia 30 de setembro.
Se o samba te atrapalha, é só esperar que vais pode parar cantar o fado. A mim não me atrapalha por aí além, os modelos de IA mais conhecidos já fizeram um esforço bastante grande para usar o PT-PT, embora, escavando, se note que tem por base o PT-BR. Provavelmente, o Apertus seguirá o mesmo percurso (e não me admirava se, por causa dos dados utilizados no pré-treino, o Amalia também, sem que daí caísse a Casa dos Bicos).
Vão precisar de mais de um ano para treinar um modelo?! Puxa, devem estar a usar uma placa bem velhinha…
O português do Brasil é uma lingua crioula, lingua usada desde dos tempos da escravatura no Brasil ou seja é uma lingua usada pelos negros (escravo).