A Google Assistant, assistente virtual da gigante norte-americana, é um luxo que ainda ilude muitos portugueses uma vez que o idioma PT-PT ainda não é suportado. Contudo, em português do Brasil, já é possível comunicar com a assistente. Mas quão privadas serão as conversas que temos com os dispositivos Google Home?
Infelizmente, ao que tudo indica, as nossas conversas podem ser sujeitas a escrutínio.
De acordo com o canal belga VRT NWS, os colaboradores da empresa estão à escuta do que é dito nos lares e “ouvido” pelos vários dispositivos Google Home. Isto é, apurou-se a forma como a empresa contrata colaboradores para transcrever as gravações de áudio recolhidas pela inteligência artificial da tecnológica.
Gravações da Google Assistant são ouvidas pelos funcionários
Posto isto, pessoas reais, os colaboradores contratados, podem ouvir o que se passa nas nossas casas. Desse modo, é possível que captem os mais variados tipos de pedidos, desde nomes, moradas, bem como detalhes das vidas pessoais. Esta é a realidade retratada, sendo deveras assustador.
De uma forma sucinta, a fonte teve acesso à plataforma onde são armazenadas as gravações feitas pela Google Assistant, que poderá estar integrada nos dispositivos Google Home ou noutros produtos fabricados por terceiros.
À escuta mesmo quando não há comandos!
Ora, para ativar oficialmente os “ouvidos” da assistente, o utilizador tem que dizer uma frase-chave. Isto é, um comando de voz que a ativa, podendo este ser programado para reconhecer apenas a voz de um utilizador. Tome-se, por exemplo, os comandos Hi Google, ou Hey Google, as únicas formas de ativação.
No entanto, os dispositivos Google Home estarão a enviar informações (gravações de voz), mesmo sem que a frase de ativação seja dita. Ou seja, temos sempre um canal aberto para os servidores da empresa. Em seguida, estas mesmas gravações são transcritas pelos prestadores de serviços encarregues de tal.
As gravações feitas e transcritas para melhorar a assistente virtual
De referir ainda que as transcrições são feitas com o intuito de melhorar os serviços da assistente. Mais concretamente, para ajudar a empresa a aprimorar o seu mecanismo de reconhecimento dos padrões de discurso, além da síntese de voz.
Entretanto, estes colaboradores acabam por ouvir todo o tipo de conversas. Note-se que sem o apelo direto ao dispositivo, o utilizador alheio ao facto de estarem a ser feitas gravações, pode falar sobre qualquer coisa. Ora, torna-se assim fácil de perceber as repercussões que tal acaba por ter na nossa privacidade.
Recordamos o relato prévio da Bloomberg. Aí é descrita a mesma problemática, mudando apenas o nome da assistente. Isto é, também a Alexa da Amazon carece da análise cuidadosa dos trechos de áudio e pedidos dos utilizadores para melhorar os seus serviços.
Na prática, isto significa que as gravações colhidas pelos dispositivos Google Home e Amazon Echo são enviadas para servidores de cada empresa. Em seguida, essas mesmas gravações (pelo menos parte delas) são transcritas por prestadores de serviços para que seja possível “alimentar” os algoritmos de IA.
Um acervo com mais de 1000 gravações de voz
Grande parte das gravações analisadas foram colhidas da forma convencional. Isto é, após o utilizador emitir o comando de voz. Cumpre ainda salientar que o acervo de gravações a que o meio jornalístico teve acesso continha mais de 1000 gravações.
Estas, por sua vez, estavam entregues a uma empresa contratada pela Google para efeitos de transcrição desse material. No entanto, algumas das gravações continham informações sensíveis que, por exemplo, permitiram aferir o estatuto de avós a um casal belga.
Portanto, a grande maioria das gravações analisadas continha pedidos convencionais, desde informações de meteorologia local até aos pedidos e procuras por pornografia. Já, por outro lado, num universo superior a mil gravações foram encontradas 153 que terão sido captadas por engano, ou fruto de um reconhecimento erróneo.
O reconhecimento equívoco da frase de ativação
Acontece com demasiada frequência, bastando por vezes dizer parte da mesma. De qualquer forma, mesmo perante um falso comando, é feita a gravação de voz para que a assistente esteja sempre pronta a dar resposta. Percebemos assim que possa ser colhida informação de forma casual, mas ainda assim indevidamente.
O whistleblower acabou por confessar que ouviu uma voz feminina que expressava indícios de “violência física”.
Cenários em que as vozes se tornam em algo mais do que conteúdo a transcrever. Torna-se assim mais do que trabalho, são pessoas reais que estamos a ouvir, não apenas vozes.
Afirma o prestador de serviços.
Já numa outra perspetiva, esta prática não é recente. É comum para as grandes tecnológicas enviarem trechos de vozes humanas para serem transcritas. Só assim poderá a assistente virtual adaptar-se a apreender com o nosso discurso. No entanto, para que tal aconteça, é necessário um feed de material novo a chegar.
Acabamos por revelar demasiados detalhes à assistente virtual
Por vezes alheios a tal facto, podemos acabar por revelar demasiados detalhes à Google Assistant. Aliás, a qualquer assistente do género. Ora, isto levanta várias preocupações sempre que um caso deste género chega a público. De qualquer forma, a prática não cessará, ainda que a privacidade deva ser sempre acautelada.
Já em declarações ao Wired, um porta-vos da Google afirmou que apenas 0,2% de todas as gravações são transcritas por humanos. É uma pequena fração de todo o universo da Google Assistant, residente nos dispositivos Google Home e não só. Esta encontra-se também nos smartphones, entre outros produtos.
Há, contudo, um sinal preocupante, sobretudo no que diz respeito ao cumprimento do RGPD. Ao analisar as políticas de privacidade da Google, a transcrição feita por humanos é omissa. Ainda que o tratamento de dados para melhoria do serviço esteja prevista, a forma como tal é feito não é clara.
Google no longer talks about users ‘in aggregate’
Via @nytimes#GDPR #DataProcessing #Privacy https://t.co/MQ9zjF3Dk3
— GDPR News | Freevacy (@FreevacyLtd) July 11, 2019
Em suma, é aqui que podem residir os problemas para a empresa. A forma, ainda confusa e desconexa como este tratamento de dados é contemplado e o seu respeito pelo RGPD na Europa. Sobretudo neste quesito, os responsáveis pela Google Assistant deveriam clarificar o tema.