Pplware

Google Docs com OCR para PDF’s e imagens

A equipa responsável pelo Google Docs voltou a surpreender os seus utilizadores com a apresentação de mais uma funcionalidade que de certeza vai fazer as delícias de muitos. Têm sido tempos de muita agitação positiva para aqueles lados e muito frequentemente têm sido apresentadas funcionalidades novas e que os utilizadores esperavam à muito. Todas estas novidades são fruto da implementação do Google Docs em HTML5 e das potencialidades que este oferece.

A funcionalidade agora apresentada permite que carreguemos imagens e PDF’s e que os textos neles contidos sejam convertidos para texto editável. Finalmente existe um mecanismo de OCR no Google Docs.

Esta funcionalidade não era nova para todos aqueles utilizadores que gostam de testar as ferramentas antes de elas se tornarem públicas. Esteve desde Setembro do ano passado disponível na forma de uma API e que permitia submetermos uma imagem e  era-nos devolvido o texto nela contida.

Pois essa API foi agora incorporada como uma funcionalidade disponível na zona de carregamento de ficheiros do Google Docs.

Para podermos utilizar esta funcionalidade basta que antes de carregarmos um ficheiro seleccionemos a opção “Converter texto de ficheiros PDF ou de imagem para documentos do Google Docs”.

Após o carregamento ficheiro (imagem ou PDF) é criado um novo documento e o texto que estava contido passa a estar disponível para edição.

Naturalmente que este OCR não é perfeito, mas os valores de interpretação que apresenta rondam os 100%. Os principais problemas começam a surgir com formatações mais estranhas (colunas de texto e outras similares), mas na maioria dos casos o texto é convertido. Não aparece no local exacto, mas está lá.

Cada novo documento criado desta forma tem no seu início uma tabela (a amarelo) a indicar que o texto gerado é proveniente de um OCR e como tal pode não estar completo e que a formatação foi perdida. Essa tabela é facilmente removida.

Após estes passos todos resta-nos então verificar a qualidade do texto e adicionar palavras que eventualmente tenham escapado ao sistema de OCR da Google.

É sem dúvida mais uma grande valia para o Google Docs e certamente que será uma ajuda preciosa para todos os utilizadores desta plataforma. Testem e digam de vossa justiça.


Homepage: Google Docs

Exit mobile version