Internet: Desfocar uma imagem para esconder informação pode ser má ideia
Nunca podemos pensar que estamos seguros com as medidas que, supostamente, foram criadas para nos ajudar. Aliás, a internet todos os dias nos mostra isso. Por exemplo, quer publicar no seu Facebook, ou no seu blog, uma imagem com o seu novo cartão de crédito que tem o símbolo do seu clube lá estampado. Tira a foto, faz um desfocar ou coloca um borrão em cima dos números do cartão e publica. Pois é, mas isso pode ser apenas o princípio da sua dor de cabeça.
Quem diz os números de um cartão, diz o rosto numa fotografia ou um qualquer dado privilegiado. Agora há uma nova técnica, que recorre à aprendizagem automática, que consegue decifrar as imagens desfocadas ou pixelizadas da internet.
IA pode adivinhar o que está desfocado numa imagem
Já sabemos que nunca podemos dar nada como adquirido na internet. Muito menos no que toca à segurança. É profundamente utópico pensarmos em total segurança na internet. Um exemplo, a acrescentar a tantos outros que já sabemos, chega-nos para nos mostrar que as ações de "desfocar ou borrata", com a intenção de esconder algo, podem não servir para nada.
Segundo o que veio agora a público, utilizando ferramentas simples de aprendizagem profunda, uma equipa da Universidade do Texas em Austin e da Universidade de Cornell, conseguiu identificar rostos e números desfocados com uma precisão alarmante. Num conjunto de dados padrão da indústria em que os humanos tinham 0,19% de probabilidade de identificar um rosto, o algoritmo tinha 71% de precisão (ou 83% se permitido adivinhar cinco vezes).
O algoritmo não produz uma imagem sem o desfocado - simplesmente identifica o que vê na foto obscurecida, com base em informação que já conhece. A abordagem funciona com imagens desfocadas e pixelizadas, assim como P3, um tipo de encriptação JPEG usado como uma forma segura de esconder informação.
Conforme é referido, desde há uns anos que estas ferramentas especializadas para ver através de desfocagem e pixelização têm aparecido. Um exemplo é o trabalho do Instituto Max Planck na identificação de pessoas em fotos desfocadas do Facebook. O que distingue a investigação da equipa do Universidade do Texas e da Universidade de Cornell é a sua simplicidade.
O ataque utiliza Torch (uma biblioteca de código aberto de aprendizagem profunda), modelos Torch para redes neuronais, e dados padrão de código aberto.
Como funciona este "ataque" à informação escondida?
Para construir os ataques que identificaram rostos em vídeos do YouTube, os investigadores tiraram fotografias disponíveis ao público e desfocaram os rostos com a ferramenta de vídeo do YouTube. Em seguida, alimentaram o algoritmo de ambos os conjuntos de imagens, para que pudesse aprender a correlacionar os padrões de desfocagem com os rostos desobstruídos.
Quando dadas imagens diferentes das mesmas pessoas, o algoritmo podia determinar a sua identidade com 57% de precisão, ou 85% quando se lhes davam cinco hipóteses.
Basicamente este processo é semelhante ao ataque de palavras-passe de dicionário ou, como é trivialmente conhecido, um ataque de força-bruta. Isto é, o algoritmo tentará usar todas as palavras de um idioma, mesmo com derivações conhecidas, para tentar acertar na palavra-passe, como é ilustrado pelo site Sudo null.
Segundo referem dois dos alunos envolvidos no trabalho, Richard McPherson e Vitaly Shmatikov, empresas como o YouTube, que recomendam técnicas de desfocagem, devem deixar claro que as suas medidas de privacidade protegem apenas as informações de humanos, não de máquinas ou adversários determinados.
Então como se pode esconder algo para não ser identificado?
Já que o desfocar dá pistas sobre o que está por trás, a melhor forma é colocar barrar opacas. Desta forma, a máquina não terá forma de procurar um padrão, uma imagem de comparação.
Se colocar um cartão, um bilhete de um concerto, de avião, ou simplesmente a sua identificação, coloque por cima uma barra sólida, conforme imagem a cima. Ou melhor, evite essas publicações, não se exponha.
Este artigo tem mais de um ano
Sempre usei barras opacas e mesmo assim não uso o file original, faço um print ao trabalho final assim não existe hipóteses de deixar código que mais tarde pode ser revertido.
Já há muito que se sabe que para esconder a informação em imagens têm de meter mesmo uma imagem por cima ou pintar por cima e guardar como uma nova imagem preferencialmente em um formato que não guarde a informação por camadas.
Diria que cartões de crédito é especialmente perigoso, dado que a font, tamanho e espaçamento dos caracteres/números é standard, por isso mais facilmente reversível.
Qualquer tipo de cartão standartizado, é fácil de remover o blur ou o borrão. Maioria usa os filtros das apps das redes sociais, algo que a própria rede social permite reverter, tendo ferramentas acessíveis por quem percebe do tema. Apagar os números com a borracha da cor do cartão, reduzir a imagem a uma percentagem aleatória e gravar num novo ficheiro, impede essas coisas, só que 99,95% dos jovens não o sabem fazer…
Desde os anos 90 que há programas capazes de desfocar a desfocagem das imagens… foram desenvolvidos pelos japoneses, principalmente, para remover os blur dos vídeos pornográficos. Desde aí para cá, facilmente é possível refocar imagens sem ser preciso uma biblioteca de pixels, então se a imagem for enviada para redes sociais, muita gente nem nota que fica com 3 cópias da imagem, sendo que duas desaparecem, aquando do post. As 3 imagens estão lá e basta um simples teste para as encontrar, uma delas é a versão original, sem qualquer blur ou borrão.
Se querem fazer publicações destas, usem o Paint, editem a imagem e coloquem manchas por cima do que querem tapar. A maneira mais eficaz é apagar usando a borracha com a cor de fundo do que está em volta. Dá um pouco mais trabalho. A outra é colocar uma imagem sobreposta mas, atenção ao gravar, pois se gravam no formato original, continuará a estar lá a cópia de segurança com o original…. quando fazem isso, Save As e gravem em JPG um novo ficheiro.
Outro truque é usar o mesmo paint, reduzir a qualidade da imagem antes de remover o que não deve aparecer. Ao fazerem isso, já torna a imagem a ter de ser processada quer seja por redes sociais, quer seja por email quer seja por qualquer serviço online. Nesse momento a vossa imagem é processada e volta aos tamanhos comuns o que remove qualquer falha no apagar de dados. E NUNCA USEM FILTROS DE REDES SOCIAIS PARA OBSCURECER AS VOSSAS IMAGENS!!!! Ao faze-lo já enviaram a imagem original que estará guardada noutro ficheiro que não podem ver… durante 8 a 20 anos. Usem sempre computadores e se usam o telemóvel, apaguem sem usar os filtros das apps das redes sociais, esses filtros não tem qualquer forma de apagar dados e só vos lixam.
No meu caso, fotos de cartao ou algo que identifique alguem tipo carta de conducao, coloco lapis, cartolina ou dedos a tapar dados importantes antes de tirar a foto.
Se for fotos com pessoas tipo multidao, ai e editar com barras, e salvar noutra foto/ficheiro.