Naptha: Manipule texto dentro de imagens de forma limpa
Quantos de vós não tiveram já acesso a imagens com texto no fundo e quiseram copiá-lo para poderem pesquisar ou traduzir? Existem formas de o fazerem, mas envolvem sempre software externo e nem sempre os resultados são os melhores e ficam longe do desejado.
Mas esses dias pode ter terminado com a chegada de uma simples extensão para o Chrome. O Naptha vem resolver um problema quase tão antigo como a capacidade de vermos imagens na Internet.
Esta extensão para o Chrome consegue trazer para o browser algo que muitos já procuravam há muitos anos. A capacidade de retirar texto de uma imagem, podendo depois tratá-lo de várias formas possíveis.
O Naptha foi desenvolvido para permitir inicialmente que consigam retirar todo e qualquer texto que exista numa imagem e para poderem colocar esse texto onde quiserem. Claro que não se limita a essa função e consegue de imediato trabalhar esse mesmo texto directamente, permitindo que o traduzam ou que alterem por outro que bem entendam.
O Naptha apenas trabalha com imagens que tenham texto presente, tendo uma simplicidade grande na detecção de texto e até de o alterar.
Perfeitamente integrado no Chrome, o Naptha permite que seleccionem o texto de uma imagem com o rato, podendo depois dar-lhe acesso através de um menu de contexto com as várias opções disponíveis.
Para tratar da capacidade de reconhecer o texto dentro das imagens, o Naptha recorre a uma biblioteca JavaScript de OCR, mas pode recorrer ao o projecto opensource Tesseract, da Google.
Para tratar da tradução do texto que encontra nas imagens, o Naptha recorre também a vários motores públicos de tradução de texto que podem ser encontrados na Internet.
O Naptha é ainda uma ferramenta com algum trabalho que precisa de ser desenvolvido, para lhe dar algumas capacidades adicionais e para melhorar as presentes, mas é já uma peça única e que dá aos seus utilizadores funcionalidades que até agora estavam reservadas a softwares de grande capacidade e com outras possibilidades computacionais.
O reconhecimento de caracteres é muito bom já e mesmo a conversão para texto é já muito capaz.
Testem o Naptha e vejam o que já podemos fazer no nosso browser, com uma simples extensão e alguma imaginação... Os textos que encontram nas imagens deixaram de estar lá "presos" e podem facilmente convertê-los para outros idiomas, quebrando barreiras de idioma.
Instalem já o Naptha no no vosso browser e as imagens deixam de ter segredos em poucos segundos, permitindo que retirem dela tudo o que precisam.
Download: Naptha
Homepage: Project Naptha
Este artigo tem mais de um ano
Nice! Mas o adb/dlhelper ja gastam ram que chegue ao meu firefox 🙂
infelizmente só temos para o Chrome… acabo de testar mas não gostei muito do reconhecimento não…talvez por só ter opções em idiomas outros que não o português ele não foi “esperto” o suficiente para reconhecer palavras…depois fareis mais testes em imagens em inglês… de qualquer forma é uma ferramenta interessante…espero que trabalhem mais no desenvolvimento dela 😉
Como será o desempenho disto com Captchas? Alguém já experimentou?
Bem pensado, tenho que testar isso.
Não dá, por exemplo no reCaptcha tem as letras rasuradas para não detectar.
Em outros captchas detecta alguns caracteres, mas não dá pra copiar tudo, é por o estarem em linha.
Ao fim de uns dias esta extensão já vai com um consumo de 1,6GB de RAM!