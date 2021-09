Se está farto daquela voz característica de equipamentos como o GPS, então há boas notícias para si. A Nvidia acaba de anunciar a sua solução através do desenvolvimento de uma voz artificial, mas que soa a uma voz natural.

Desta forma, o objetivo da empresa norte-americana é tornar esta voz cada vez mais humana, com uma expressividade mais natural, através das suas pesquisas no campo da Inteligência Artificial de conversação.

As pessoas falam de uma forma mais livre, mais fluída e menos automatizada. Mas as características da voz humana ainda são pormenores bastante complexos para a sua produção através de Inteligência Artificial. Como tal, é com alguma facilidade que reconhecemos as vozes geradas por via das tecnologias, como as que se encontram nos GPS.

Mas a Nvidia é uma marca atenta às várias necessidade do mercado e dos consumidores e, por conseguinte, já pensou numa solução.

Nvidia lança voz artificial que soa como voz natural

De forma a oferecer suporte aos programadores e criadores, os investigadores da Nvidia Enterprise estão a construir modelos e ferramentas de síntese de voz controlável de alta qualidade capaz de capturar todos os pormenores da fala humana, sem os característicos detalhes artificiais de áudio.

A novidade foi apresentada oficialmente pela Nvidia nesta terça-feira e recorre às tecnologias de IA para o efeito. Assim, fica viabilizada a utilização destes modelos de voz em diversos âmbitos, como o atendimento automatizado em lojas e bancos ou um 'simples' GPS.

Ouça no seguinte vídeo o resultado da voz da Nvidia:

Mas não é só a voz expressiva o foco da Nvidia com este trabalho. A fabricante também está empenhada noutros elementos de conversa através de IA, como o processamento da linguagem natural, reconhecimento da fala automatizado, deteção de passwords, melhoria de áudio, etc.

Estas soluções são também aceleradas por meio de hardware da Nvidia e o código aberto pode ser acedido através da ferramenta NeMo toolkit com recursos disponíveis no NGC HUB.

Poderá ainda conhecer mais sobre este e outros desenvolvimentos da Nvidia relacionados com processamentos da fala através do evento Interspeech 2021.