Arquivo.pt já tem 1 PetaByte de informação guardada…
O Arquivo.pt foi criado a 8 de novembro de 2007 com o objetivo de preservar conteúdos da Web portuguesa. Segundo as mais recentes informações, este serviço já guarda mais de 1 PetaByte de informação.
Arquivo.pt é uma excelente fonte para investigadores...
Para atingir o volume de 1 PetaByte o Arquivo.pt tem vindo a gravar periodicamente conteúdos dos sites do domínio .PT e de sites portugueses em outros domínios. Têm sido feitas recolhas frequentes, diárias e mensais, a um pequeno conjunto de sites governamentais e aos principais sites noticiosos em Portugal.
No Arquivo.pt é possível pesquisar informação publicada na Web no passado, como, por exemplo:
- A primeira página da Web portuguesa
- O site oficial da Expo’98
- Notícias do jornal Público no dia da final do Campeonato Europeu de Futebol de 2016
Ao disponibilizar 1 PetaByte de informação, em acesso aberto e através do uso de APIs (Application Programming Interfaces), o Arquivo.pt torna-se assim uma ferramenta bastante útil para a investigação.
Este artigo tem mais de um ano
Um milhão de gigabytes é muita fruta. Se algo acontece… 😐
Precisavam era de digitalizar todo o arquivo útil do Estado, principalmente o que tem como o cidadão como interveniente.
Procurei alguns sites de noticias e confirma-se que só gravam uma cópia por ano e por vezes saltam. Sei que era pedir muito mas o ideal seria uma cópia diária de pelo menos os portais de noticias. O petabyte não chega para isso?