Nvidia lança voz artificial mas que soa como uma voz natural
Se está farto daquela voz característica de equipamentos como o GPS, então há boas notícias para si. A Nvidia acaba de anunciar a sua solução através do desenvolvimento de uma voz artificial, mas que soa a uma voz natural.
Desta forma, o objetivo da empresa norte-americana é tornar esta voz cada vez mais humana, com uma expressividade mais natural, através das suas pesquisas no campo da Inteligência Artificial de conversação.
As pessoas falam de uma forma mais livre, mais fluída e menos automatizada. Mas as características da voz humana ainda são pormenores bastante complexos para a sua produção através de Inteligência Artificial. Como tal, é com alguma facilidade que reconhecemos as vozes geradas por via das tecnologias, como as que se encontram nos GPS.
Mas a Nvidia é uma marca atenta às várias necessidade do mercado e dos consumidores e, por conseguinte, já pensou numa solução.
Nvidia lança voz artificial que soa como voz natural
De forma a oferecer suporte aos programadores e criadores, os investigadores da Nvidia Enterprise estão a construir modelos e ferramentas de síntese de voz controlável de alta qualidade capaz de capturar todos os pormenores da fala humana, sem os característicos detalhes artificiais de áudio.
A novidade foi apresentada oficialmente pela Nvidia nesta terça-feira e recorre às tecnologias de IA para o efeito. Assim, fica viabilizada a utilização destes modelos de voz em diversos âmbitos, como o atendimento automatizado em lojas e bancos ou um 'simples' GPS.
Ouça no seguinte vídeo o resultado da voz da Nvidia:
Mas não é só a voz expressiva o foco da Nvidia com este trabalho. A fabricante também está empenhada noutros elementos de conversa através de IA, como o processamento da linguagem natural, reconhecimento da fala automatizado, deteção de passwords, melhoria de áudio, etc.
Estas soluções são também aceleradas por meio de hardware da Nvidia e o código aberto pode ser acedido através da ferramenta NeMo toolkit com recursos disponíveis no NGC HUB.
Poderá ainda conhecer mais sobre este e outros desenvolvimentos da Nvidia relacionados com processamentos da fala através do evento Interspeech 2021.
Este artigo tem mais de um ano
Fonte: Nvidia
Bem… agora também são os cantores com os empregos em risco
Esses já há muitos anos que utilizam hardware e software para poderem ter uma voz aceitável lol
A maioria, sem aditivos parecem cabras a cantar.
Pois é… mas agora a experiencia de concerto pode ser muito diferente.
Her (2013)
Vozes neurais é o que não faltam. Só no Azure é aos pontapés e já estão mais disseminadas na tv e net que nem uma praga. Euronews abusa à força toda.