Depois de anos de melhorias no controlo por voz nos carros, os novos sistemas poderão desbloquear uma nova fonte de receitas avaliada em milhares de milhões, segundo um estudo recente. Os valores astronómicos devem-se, sobretudo, à Inteligência Artificial (IA).

À medida que os botões físicos desaparecem em favor dos ecrãs táteis, as interfaces de voz evoluem de simples ferramentas de comando para algo mais complexo, integrando pedidos, pagamentos e navegação sem mãos, diretamente no assistente de voz do carro.

Uma investigação realizada pelo fornecedor tecnológico SoundHound AI estima que as transações por voz realizadas através dos sistemas de infotainment dos veículos poderão gerar até 35 mil milhões de dólares, à medida que os consumidores mostram uma disposição crescente para utilizar assistentes de voz em atividades relacionadas com o comércio durante a condução.

Segundo o estudo, citado pelo Automotive News, 73% dos condutores norte-americanos demonstraram interesse em utilizar o comércio por voz nos carros, nomeadamente para o seguinte:

76% para fazer pedidos de comida;

73% para manutenção do veículo;

71% para estacionamento;

59% para planeamento de entretenimento;

58% para compras por impulso.

De acordo com Varun Murthy, analista da SBD Automotive, "os controlos por voz com IA são agora capazes de responder a muitas questões e fornecer perspetivas importantes", descrevendo o ponto de viragem que a tecnologia atingiu.

Fabricantes têm um desafio: equilibrar o controlo e a conveniência

Conforme o estudo, as implicações vão além das projeções de receita, uma vez que as fabricantes têm de equilibrar o controlo com a conveniência, especialmente quando comandos de voz podem ativar ou desativar funções de segurança.

Deverá o controlo por voz conseguir ativar ou desativar uma função de segurança específica? Onde traçamos o limite para os comandos de voz e até que ponto o input de voz pode controlar funcionalidades do veículo é a questão mais importante.

Para Murthy, atualmente, os maiores desafios dos sistemas por voz em veículos são a facilidade de utilização e a consistência em condições reais de condução. Já não se trata apenas da precisão do reconhecimento de voz.

Ou seja, a questão foca-se, agora, em resolver a fiabilidade da voz, equilibrando preocupações com a privacidade e os custos de processamento.

Sistemas devem estar continuamente presentes nos carros

Os sistemas da Kardome, apoiados pela Hyundai, por exemplo, combinam IA de audição espacial e IA cognitiva para permitir que os dispositivos ouçam, localizem e interpretem a fala de forma semelhante aos humanos, mesmo em cenários ruidosos ou com múltiplos intervenientes.

Segundo Dani Cherkassky, diretor-executivo da Kardome, a maioria dos sistemas enfrenta dificuldades, porque são efetivamente "cegos e surdos antes de serem ativados", dependendo de palavras específicas e da ligação à cloud.

Essa abordagem obriga os condutores a falar de forma pouco natural, a repetir-se e a explicar novamente a intenção, aumentando a carga cognitiva em vez de a reduzir.

Para Cherkassky, o caminho a seguir passa por uma camada de voz sempre ativa, que compreenda espaço, intervenientes e contexto localmente, levando para a cloud apenas os pedidos complexos.

Desta forma, o carro ouve continuamente, mas processa os dados internamente, sem gravar ou transmitir conversas.

Embora o objetivo seja que o carro ouça "o tempo todo", a Kardome, espeficiamente, não quer "que a informação vá para a cloud".

Construído desta forma, o sistema redesenhado poderá "mudar drasticamente a forma como as interfaces de utilizador por voz funcionam", pois eliminará as "palavras de ativação" nos carros do futuro, tornando a interação com os veículos mais fluida.