IA da Google digitaliza oito milhões de fotos históricas do The New York Times
O Google Cloud uniu-se ao The New York Times para ajudar a digitalizar a sua vasta coleção de fotos. A mítica publicação americana está a recorrer a inúmeras ferramentas no Google Cloud Platform que lhes tem servido de armazenamento às suas imagens de forma segura.
A inteligência artificial da Google, usada no Google Cloud Platform, está a ajudar a encontrar fotografias e informações que estão, algumas delas, no verso das imagens. É um trabalho titânico!
The New York Times usa agora Inteligência Artificial Google
Durante mais de 100 anos, o The New York Times arquivou cerca de cinco a sete milhões de fotos antigas em centenas de arquivos que estavam três andares abaixo do nível da rua, perto dos seus escritórios num local chamado “necrotério”.
Muitas das fotos foram armazenadas em pastas e nunca mais foram vistas. Embora exista um catálogo de cartões que fornece uma visão geral do conteúdo do arquivo, há muitos detalhes nas fotos que não são percetíveis num formulário indexado a esse arquivo.
Necrotério, o arquivo com histórias únicas do mundo moderno
O necrotério contém fotos do final do século XIX, e muitos dos seus conteúdos têm um tremendo valor histórico - alguns que não são armazenados em nenhum outro lugar do mundo.
Em 2015, um cano rebentou e inundou a biblioteca de arquivos, colocando em risco toda a coleção. Felizmente, apenas causou pequenos danos, mas o evento levantou a questão: como podem ser armazenados alguns dos ativos físicos mais preciosos da empresa com segurança?
Para resolver esta crise o The New York Times contratou a Google para cuidar do trabalho de preservação de todas estas fotografias, que têm de ser todas digitalizadas.
Este trabalho será realizado usando o sistema de "machine vision" da Google, que é baseado na sua plataforma de inteligência artificial e é usado num grande número dos seus produtos, como o Google Fotos.
O objetivo não é apenas digitalizar, mas também validar as anotações manuscritas nas fotografias e classificar as informações semânticas que elas contêm, para vincular os dados de locais e datas. Uma tarefa titânica.
Simplesmente armazenar imagens de alta resolução não é suficiente para criar um sistema que os editores de fotos possam usar facilmente. Um sistema de gestão de ativos em funcionamento deve permitir que os utilizadores possam procurar e pesquisar fotos de forma fácil.
O The New York Times construiu um canal de processamento que armazena e processa as fotos e usará a tecnologia cloud para processar e reconhecer textos, manuscritos, objetos e outros detalhes que podem ser encontrados nas imagens.
Temos imagens que datam do século XIX, muitas das quais não existem em nenhum outro lugar do mundo. É um tesouro de documentos perecíveis, uma crónica inestimável não só da história do Times, mas de quase mais de um século de eventos globais que moldaram o nosso mundo moderno.
Referiu Nick Rockwell, diretor de tecnologia do New York Times.
Mas como funciona o processo?
Quando uma imagem é inserida no Cloud Storage, o The New York Times usa o Cloud Pub / Sub para lançar o canal de processamento para realizar várias tarefas. As imagens são redimensionadas através de serviços executados no Google Kubernetes Engine (GKE) e os metadados da imagem são armazenados numa base de dados PostgreSQL em execução no Cloud SQL, um sistema totalmente gerido pela Google.
Trazer o passado para o futuro
Este é apenas o começo do que é possível para empresas com arquivos físicos. As entidades podem usar a API do Vision para identificar objetos, lugares e imagens. É um serviço que, dados os avanços da tecnologia e a globalidade, cada vez será mais necessário. É importante ir ao passado, digitalizar a história e colocar os dados disponíveis para podermos evoluir no futuro. Estamos no mundo da digitalização... inteligente.
Este artigo tem mais de um ano