Google Tradutor adiciona 110 novos idiomas e traz o português de Portugal
[Atualização: Português de Portugal já está disponível! Ver no final do artigo]
A Google anunciou hoje que o Google Tradutor (Google Translate) suporta agora mais 110 idiomas. A adição mais notável é o cantonês, que tem mais de 85 milhões de falantes. Além disso, a empresa refere um foco maior nas variações linguísticas. Será agora que teremos no Google Tradutor o português de Portugal?
Apoio à tradução para mais de 500 mil milhões de pessoas
Do cantonês ao Qʼeqchiʼ, estas novas línguas representam mais de 614 milhões de falantes, permitindo traduções para cerca de 8% da população mundial. Algumas são as principais línguas mundiais, com mais de 100 milhões de falantes; outras são faladas por pequenas comunidades de povos indígenas; e algumas quase não têm falantes nativos, mas têm esforços ativos de revitalização.
Cerca de um quarto das novas línguas provém de África, representando a maior expansão de línguas africanas até à data, incluindo Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.
Agora, o Google Translate (Google Tradutor) suporta mais 110 idiomas. A empresa observa que o seu modelo de linguagem grande PaLM 2 foi fundamental para ajudar o Tradutor a aprender com mais eficiência idiomas intimamente relacionados.
Em 2022, adicionámos 24 novos idiomas utilizando a tradução automática Zero-Shot, em que um modelo de aprendizagem automática aprende a traduzir para outro idioma sem nunca ter visto um exemplo. E anunciámos a Iniciativa 1.000 Línguas, um compromisso para criar modelos de IA que suportem as 1.000 línguas mais faladas em todo o mundo.
Agora, estamos a utilizar a IA para expandir a variedade de idiomas que suportamos. Graças ao nosso modelo de linguagem de grande dimensão PaLM 2, estamos a lançar 110 novos idiomas no Google Translate, a nossa maior expansão de sempre.
Eis algumas das novas línguas suportadas pelo Google Tradutor:
- O afar é uma língua tonal falada no Djibuti, na Eritreia e na Etiópia. De todas as línguas neste lançamento, o Afar foi a que recebeu mais contribuições voluntárias da comunidade.
- O cantonês é, desde há muito, uma das línguas mais solicitadas pelo Google Translate. Como o cantonês sobrepõe-se frequentemente ao mandarim na escrita, é difícil encontrar dados e treinar modelos.
- O manx é a língua celta da Ilha de Man. Quase foi extinta com a morte do seu último falante nativo em 1974. Mas graças a um movimento de revitalização em toda a ilha, existem agora milhares de falantes.
- O NKo é uma forma normalizada das línguas Manding da África Ocidental que unifica muitos dialetos numa língua comum. O seu alfabeto único foi inventado em 1949 e tem uma comunidade de investigação ativa que desenvolve recursos e tecnologia para ele atualmente.
- Punjabi (Shahmukhi) é a variedade do Punjabi escrita em escrita perso-árabe (Shahmukhi) e é a língua mais falada no Paquistão.
- O tamazight (Amazigh) é uma língua berbere falada no Norte de África. Embora existam muitos dialetos, a forma escrita é geralmente compreensível para todos. Escreve-se em escrita latina e em escrita Tifinagh, ambas suportadas pelo Google Tradutor.
- Tok Pisin é um crioulo de base inglesa e a língua franca da Papua-Nova Guiné. Se fala inglês, tente traduzir para Tok Pisin - talvez consiga perceber o significado!
Finalmente é referido o suporte ao português de Portugal
As línguas têm uma enorme quantidade de variações: variedades regionais, dialetos, diferentes padrões ortográficos. De facto, muitas línguas não têm uma forma padrão, pelo que é impossível escolher a variedade "certa".
Na informação partilhada no seu blog, a abordagem é dar prioridade às variedades mais utilizadas de cada língua. Por exemplo, o Romani é uma língua que tem muitos dialetos em toda a Europa. Os modelos produzem um texto que se aproxima mais do Romani do Vlax do Sul, uma variedade comummente utilizada online. Mas também misturam elementos de outras, como o Vlax do Norte e o Romani dos Balcãs.
Aqui, conforme é descrito pela da empresa, cabe o português de Portugal. E, apesar da versão atual da aplicação Google Tradutor não estar ainda a fazer esta destrinça, a ideia será haver uma maior correção na tradução do nosso idioma.
Pode começar a traduzir a partir de translate.google.com ou através da app Google Translate para Android e para iOS.
[Atualização: Português de Portugal já está disponível!]
O nosso idioma já está disponível para os utilizadores, tanto na app para Android como na app para iOS. Bastará mudar o idioma de Português do Brasil para Português de Portugal e passará a usar o novo idioma.
Vamos ver se é PT/PT e não PT/BR. Sim porque Português, sempre foi Português. Disso não tenho dúvidas.
E o PT/BR é Português (embora haja brasileiros e portugueses que digam que não). O PT/Alentejano também.
Não tem nada a ver…. PT-PB não é português de Portugal. Eu já estou farto até nos call Centers ter que andar a tentar perceber o brasileiro. Eu não vejo novelas, não percebo patavina o que dizem. Já tive que pedir que me passassem para alguém que falasse português.
+1
Português é de Portugal e Ilhas, tudo o resto são dialectos.
+1
Finalmente! Vamos ver se funciona bem
Latim?
Latinam translationem habet
Era interessante meterem o mirandes
a língua que vive dos fundos
Não existe português de Portugal e português do Brasil.
Existe português e português do Brasil.
Verdade, há sites que sabem a diferença (ver foto), parece que a Google quer meter tudo no mesmo saco.
Sapos e Rãs para a Google também deve ser a mesma coisa.
https://postimg.cc/PNCTmWDQ
Que na verdade deveria chamar-se de “Brasileiro”
https://postimg.cc/PNCTmWDQ
Verdade, há sites que sabem a diferença (ver foto), parece que a Google quer meter tudo no mesmo saco.
Sapos e Rãs para a Google também deve ser a mesma coisa.
https://postimg.cc/PNCTmWDQ
Português®
O português é tão inútil que até metem brasileiros a comentar futebol tuga hahahaha
Finalmente o bus é autocarro
tens o caso pratico duma “xerox”. Na nossa lingua é uma “fotocópia”…
A unica empresa a fazer traduções de confiança é a Vasco ( http://www.vasco-tranlator.pt ), sou medico nas Urgencias do São João e desde falar, tradução de documentos é o único tradutor que até hoje faz as mesmas acertadas, google tradutor é para esquecer completamente é pura recolha de informação.
melhor comentário aqui, deu para aprender algo, obrigado Dr.
De certeza que é esse endereço? A mim deu-me este erro no Firefox:
Hum. Estamos a ter problemas em encontrar esse site.
Não é possível estabelecer a ligação ao servidor em http://www.vasco-tranlator.pt.
Se inseriu o endereço correto, pode:
Tentar novamente mais tarde
Verificar a sua ligação à rede
Verificar se Firefox tem permissão para aceder à Internet (pode estar ligado, mas atrás de uma firewall)
https://vasco-translator.pt
Será que é o fim do pesadelo? É que, sem ofensa para os brasileiros, podes usar as mesmas palavras numa frase e o sentido é completamente diferente.
Seja qual for a forma como olhamos para o português que se fala no Brasil, não deixa de ser a expressão de um povo, produto de uma amálgama de diferentes culturas e dinâmicas.
Ninguém diz o contrário e é tudo uma questão de semântica mas porque razão o povo do “Brasil” não fala “brasileiro” mas sim “português do brasil”? Por acaso o país deles chama-se “portugal do brasil”?
A linguística chama-lhe variante. Independentemente dos afastamentos, o português do Brasil será sempre isso, uma variante da matriz portuguesa.
Veja-se, a este propósito, o caso dos EUA, que continuam a chamar ao seu idioma American English.
Porquê os americanos falam americano, os argentinos, argentino, os chilenos, chileno certo?
A linguística chama-lhe variante. Independentemente dos afastamentos, o português do Brasil será sempre isso, uma variante da matriz portuguesa.
Veja-se, a este propósito, o caso dos EUA, que continuam a chamar ao seu idioma American English.
E não tens o British English???
Então agora os burlões já vão conseguir enviar mails e mensagens em PT-PT……
Se o traductor se fôr «enganando» e injectando palavras brasileiras de vez em quando, só estará a contribuir silenciosamente para a corrupção da nossa língua. Um pau de dois bicos.