Siri Linux? Sistema de reconhecimento de voz para Ubuntu
Nos últimos anos muito se tem investigado em sistemas que garantam a melhor interação entre o utilizador e a máquina. Os teclados e ratos, apesar de ainda fundamentais por questões de produtividade, têm dado espaço a ecrã multi-touch e algumas empresas têm mesmo apostado fortemente na voz para envio de comandos para o sistemas.
No Pplware já apresentamos o SIRI para iOS, o IRIS para Android, o Google Voice, o projecto Your Speech da Microsoft.. entre outros sistemas. Hoje vamos conhecer um sistema de reconhecimento de voz para GNU/Linux.
Depois de alguns anos de trabalho, James McClain consegui desenvolver uma plataforma de reconhecimento de voz para sistemas GNU/Linux. Desta forma, o utilizador pode enviar instruções, por voz, para o seu sistema proceda a um conjunto de tarefas. Actualmente o sistema permite:
- Executar e fechar aplicações
- Abrir sites
- Várias funções ao nível do sistema de ficheiros (copiar, mover, apagar..)
- Envio de e-mails
- Resposta a questões
Tudo isto pode ser visto a funcionar no vídeo seguinte:
Como Funciona
- O utilizador carrega numa tecla (hot-key)
- Utilizador fala (envia comando)
- O sistema de reconhecimento é executado (recorrendo ao Google)
- Os resultados são devolvidos para o “dicionário” da aplicação
- …que depois são comparados com os respectivos comandos/modos de funcionamento
Command recognition is handled by a c program that I wrote, I made it to be able to recognize many different ways of saying a command (fuzzy matching), it recognizes commands based on dictionaries that look for example like this.
<open,start,run> <f,F>irefox
open firefox
That allows someone to say open firefox, start firefox, or run firefox, and it will still run the same command.
Ainda relativamente ao projecto, McClains refere que todo é feito com base em pequenos scripts e que brevemente irá disponibilizar uma “private beta”. McClains refere ainda que necessita de designers, programadores ou alguém que tenha know how para o ajudar no projecto, para que no futuro o disponibilize gratuitamente para toda a gente.
Este artigo tem mais de um ano
Boas,
Excelente Post Pedro Pinto.
McClains tem um vídeo mais recente com poucas horas e para ser sincero muito mais agradável de ver pois não mete medo aos “Novatos” por causa do terminal =) : https://www.youtube.com/watch?v=HfrQrjH3AGw&list=UUR2WPs2B8S9ehJeDemPXhkw&index=1
Thanks pela partilha 🙂
Só um pequeno reparo…a resposta da Google à Siri não foi o google voice mas o Google Now. 😉
AIVC para andoroid – alice
https://play.google.com/store/apps/details?id=yourapp24.android.tools.aivc
AIVC para android – Alice
https://play.google.com/store/apps/details?id=yourapp24.android.tools.aivc