Entrevista com… Juan Picazo Nuance Director for Iberia Market
A Nunace é hoje uma das mais empolgantes empresas ligadas às tecnologias de futuro que equipam os dispositivos móveis de comunicação. Estas empresas com uma visão focada no horizonte são quem empurra o mercado da tecnologia para patamares de alto desenvolvimento, alias são as mais sonantes das novidades que recentemente temos lido.
Para sabermos mais sobre esta empresa questionamos Juan Picazo, o director da Nuance para o mercado Ibérico.
Deixamos algumas questões pertinentes sobre produtos novos que estão já no mercado e algumas ideias para um futuro próximo, quiçá se não serão os trunfos das grandes empresas de smartphones para os próximos meses.
- A Nuance lançou recentemente o sistema de reconhecimento de voz, o Dragon NDEV Mobile, para as aplicações portuguesas. Qual o objectivo deste sistema?
Lançámos recentemente o nosso SDK para programadores, NDEV – providenciando aos programadores a oportunidade de integrar a plataforma de discurso em todas as suas apps. Para além do reconhecimento de voz, o SDK, providencia acesso a uma ferramenta de text-to-speech (TTS), gerando som natural a partir da introdução de texto. Isto significa que os utilizadores podem não apenas falar e serem compreendidos pelo telefone mas também que o telefone lhes devolva uma resposta. Actualmente, todas as ajudas que permitam reduzir o tempo com tarefas menores para as pessoas, justificam só por si todos os esforços realizados por organizações, de modo a tornar a vida das pessoas mais fácil.
- Quais as motivações da Nuance para a criação de um sistema de reconhecimento de voz? Os nossos conhecimentos, aplicações e serviços tornam a experiência mais fácil, transformando a forma como as pessoas interagem com a informação e como criam, partilham e usam documentos. Os consumidores gostam e querem mais aplicações de voz. A Nuance conseguiu ver esta oportunidade de negócio, com o sucesso esmagador das Dragon Apps, incluindo o Dragon Dictation.
- Em que aplicações o Dragon NDEV Mobile irá funcionar? As pessoas podem, rapidamente, usar a voz para encontrar e ouvir música, visualizar filmes em streaming, encontrar lojas locais, obter reviews, fazer reservas e outras coisas. É possível criar melhores experiências para os consumidores pelo planeta inteiro.
- Quais as principais características/funcionalidades do Dragon NDEV Mobile? O programa NDEV foi um sucesso tão grande que a Nuance teve que o dividir em três níveis – silver, gold e emerald. Estes três serviços oferecem aos programadores mais flexibilidade na forma como trazem as suas inovações para o mercado desde o nível de serviço básico “Silver” até ao “Emerald”, que oferece um leque de customizações e serviços.
- De que forma o sistema faz o reconhecimento de voz nas aplicações? O reconhecimento de voz já está feito a nível de data centers, e na cloud também, caso queiram usá-lo.
- O sistema chegou agora às aplicações portuguesas, mas já está disponível noutros idiomas. Qual a reacção e feedback dos utilizadores ao Dragon NDEV Mobile? O feedback tem sido muito positivo. Actualmente temos mais de 6000 programadores! E estamos apenas a começar.
- Quais as plataformas móveis que suportarão o reconhecimento de voz nas aplicações? A Nuance permitiu que o SDK Dragon Mobile se pudesse utilizar para iOS, Android e Windows Phone 7 apps.
- Quais são, neste momento, as aplicações mais importantes já com suporte do Dragon NDEV Mobile? Grandes marcas, como a Amazon, estão actualmente a utilizar o poder da voz para conquistar os seus clientes definindo a sua oferta para os competidores. Foi recentemente lançada a app Price Check que permite aos utilizadores apenas dizer o nome de qualquer produto que querem comprar para receberem, instantaneamente, os preços do item em causa na loja da Amazon.com. A aplicação permite ainda a leitura de códigos de barras, tirar uma fotografia ou introduzir o nome de um produto para obter os mesmos e respectivos preços na Amazon e/ou em outras montras online.
O NDEV Mobile permitiu o reconhecimento de voz nas aplicações mais populares em todos os mercados, incluindo o Price Check by Amazon como mencionado acima, Ask for iPhone, Merriam-Webster, Dictionary.com, RemoteLink from OnStar, SpeechTrans, Yellow Pages e AirYell from Avantar, iTranslate, Taskmind, SayHi Translate, Vocre, Bon’App, e outras mais.
- Quais as vantagens mais salientes para o uso de um sistema como este? A penetração de mercado dos smartphones aumentou drasticamente ao longo dos últimos anos. Não apenas ao nível do maior número de consumidores que utilizam serviços mobile, não é surpresa ouvir que o mercado das aplicações está também em forte crescimento. De acordo com o Mobile Entertainment, os downloads para iOS passaram a marca dos 18 Biliões (com extra mil milhão adicionado a cada mês) e mais de 10 mil milhões de Android foram descarregados até ao momento. Num mercado cheio de apps, os programadores estão à procura de ferramentas que diferenciem as suas da oferta que estão disponíveis e a incorporação do reconhecimento de voz é uma vantagem competitiva.
Os consumidores preferem modalidades com várias vertentes – os ecrãs por toque são o exemplo como se pode dar a revolução nos terminais móveis – e a integração de discurso é um método a ser explorado por programadores e empresas. São significantes os desenvolvimentos no mercado de aplicações e os avanços que têm vindo a ser feitos na tecnologia de reconhecimento de voz.
- Este é decerto um sistema inovador e que fazia falta no mercado das aplicações. Qual a sua opinião acerca de inexistência de recursos como reconhecimento de voz nas aplicações? Poderá o Dragon NDEV Mobile ser uma chamada de atenção a essa falha?
Num mercado extremamente desenvolvido, os programadores estão à procura de formas para diferenciar a sua oferta a partir de outras aplicações disponíveis – e são uma forma de incorporar o discurso que está agora disponível graças à Nuance em várias línguas. O nosso programa permite que o programadores escolham a experiência de voz mobile cujas principais características são ser flexível, editável e que vai ao encontro das necessidades únicas dos consumidores.
O recente lançamento do iPhone 4S permitiu o crescente entusiasmo em torno desta tecnologia. É importante mencionar que a união entre voz e percepção inteligente de voz. Com o desenvolvimento destas tecnologias, será possível ditar ordens para uma televisão de modo a que a mesma coloque no canal que pretendemos ver. Combinando o potencial da tecnologia de reconhecimento de voz com o desenvolvimento de aplicações, oferece uma excelente oportunidade de modo a envolver consumidores e gerar novos lucros que não podiam ser antes conseguidos. Estamos confiantes que vamos conseguir convencer muitas empresas a integrar o reconhecimento de voz nas suas aplicações porque é uma interface natural e os utilizadores querem-na!
- A tentativa de aquisição da Vligo será para aniquilar com a tecnologia noutras plataformas ou para expandir pela mão da Nuance o reconhecimento de voz a essas mesmas plataformas? Não, nós quisemos comprar a Vlingo porque é uma grande equipa com uma excelente tecnologia. Nos próximos 3 a 4 anos, esperamos que o discurso se torne ainda mais integrado e mais fácil de interagir com os seus utilizadores. Como os desenvolvimentos continuam, não tardará muito em comandar a TV pela nossa voz, e a aquisição da Vlingo vai ajudar-nos a acelerar esse processo.
Este artigo tem mais de um ano
Isto do reconhecimento de voz tem tido uma evolução muito interessante. Ainda me lembro do tempo em que era preciso treinar por várias horas até que o reconhecimento fosse aceitável. Já usei o Dragon Dictate e até funciona bastante bem.
Acho que lançaram qualquer coisa ao estilo SIRI para Android-EUA.
http://www.redmondpie.com/folks-behind-siri-release-dragon-go-for-android-download-it-now-video/