Rede neuronal inspirada no cérebro poderá matar o CAPTCHA
CAPTCHA é um acrónimo para "Completely Automated Public Turing test to tell Computers and Humans Apart", que em bom português quer dizer teste de Turing público completamente automatizado para a diferenciação entre computadores e humanos. Basicamente todos já nos cruzamos com este teste de validação, que serve, por exemplo como ferramenta Anti-SPAM, para validação de autentivações, etc.
Se até hoje o CAPTCHA conseguia deter ou pelo menos dificultava a vida aos spammers, agora existe um novo modelo de inteligência artificial que consegue interpretar CAPTCHAs com muito poucos dados de treino e poderá ser o fim do reinado deste sistema anti-spam.
O sistema CAPTCHA foi criado para ser indecifrável por algoritmos de computador. Aparecia-nos de várias formas, desde combinações de letras e números, num milhão de estilos diferentes, a imagens que só o ser humano poderia agrupar ou interpretar. Este técnica permite que o ser humano naturalmente reconhecesse os padrões, os números e os requisitos ao contrário dos computadores que teriam dificuldades em validar camadas com desenhos, "ruído" e outras armadilhas.
Desde há vários anos que são criados algoritmos para resolver esses enigmas tão intensivos em dados, exigindo treino em milhões de exemplos de imagens CAPTCHA já resolvidas - a imagem mais a sua interpretação - ou regras codificadas sobre como interpretar cada tipo de imagem.
Rede Cortical Recursiva
O investigador Dileep George e os seus colegas da Stanford University, elaboraram um modelo mais eficiente, apelidado de Rede Cortical Recursiva (RCR), que incorpora insights da neurociência para ensinar ao programa como generalizar além do que lhe é ensinado no período de treino.
Este treino trabalha de forma mais parecida com o cérebro humano. O novo modelo agora apresentado tem a capacidade de aprender e generalizar, recorrendo a relativamente poucos exemplos, especialmente em comparação com os modelos atuais de aprendizagem profunda, tornando-se assim, aproximadamente, 300 vezes mais eficiente em termos de dados.
A chave do sucesso da RCR, segundos os seus criadores, é a sua codificação com pressupostos fortes, que são usados para reconhecer entradas que nunca encontrou no treino. Dessa forma, o algoritmo consegue interpretar textos CAPTCHA, identificar letras e números manuscritos, delinear objetos em camadas complexas e reconhecer texto em fotos de cenários do mundo real.
Em comparação com as abordagens avançadas da aprendizagem profunda para a leitura de texto, a RCR tem uma precisão comparável ou maior usando cerca de 5.000 vezes menos imagens de treino.
Estes estudos agora apresentados têm duas vertentes muitos distintas, mas ambas interessantes. Uma que mostra claramente um avanço considerável no campo das redes neurais e da inteligência artificial e outra que permite um salto qualitativo no que toca ao "desmembrar" de uma técnica de segurança anti-spam promovendo assim a urgência em criar algo mais forte, mais produtivo do que o atual mecanismo CAPTCHA.
Este artigo tem mais de um ano
Não percebi nada xD
Mas está simples de perceber. Agora, a inteligência artificial tem tantos exemplos de captcha já resolvidos, a base de dados é tal que com base no que aprendeu nso já nenhum (supostamente) captcha que apareça que o sistema neuronal não tenha aprendido. Dessa forma deteta, descobre e decifra.
O que está em causa é um tipo de máquina diferente de um computador. Um computador clássico funciona segundo um conjunto de instruções fixas (os algoritmos) que podem incluir fazer cálculos (soma, subtração, multiplicação, divisão) e “tomar decisões” de uma forma muito simplista “se é maior ou igual que x faz assim se é menor que x faz assado”. Numa máquina deste tipo nenhuma acção é feita que não tenha sido programada/ordenada pelo programador.
O circuito electrónico referido no texto funciona de um modo mais parecido com o do nosso próprio cérebro. É constituído por um grande conjunto de nós ligados por uma rede. Cada nó está ligado a uma grande quantidade de outros nós e recebe ou transmite sinais para eles. Os sinais transmitidos entre os nós são impulsos eléctricos que podem ser mais ou menos intensos. Cada nó ao receber sinais dos seus vizinhos funciona como um misturador/amplificador mas dá mais peso aos sinais de uns vizinhos e menos aos de outros. A aprendizagem deste sistema acontece quando os pesos dados aos sinais recebidos dos vizinhos sofrem ajustamento devido a informação de retorno sobre se a tarefa do conjunto foi bem sucedida ou não. A capacidade de aprendizagem e de resolução de problemas de um sistema deste tipo é ainda maior se este tiver a capacidade de criar novos nós e ligações e eliminar parte dos antigos tal como acontece no nosso cérebro.
Engenheiro de eletrónica?
Visto que os Captcha tbm sao usados para treinar redes neuronais, acho um paradigma interessante.