www.arquivo.pt: pesquise informação desaparecida da Internet
A Internet foi idealizada como um meio de comunicação rápido, mas tem vindo progressivamente a substituir a imprensa como meio privilegiado de publicação. Cada vez existem mais publicações que são exclusivamente disseminadas através da Internet.
Contudo, a Internet padece de um problema grave como meio de publicação e disseminação de conhecimento: a informação nela publicada desaparece rapidamente. Estima-se que 85% dos conteúdos publicados na Internet são alterados ou desaparecem após apenas 1 ano da sua publicação. Esta não se perdeu, encontre-a no www.arquivo.pt.
A publicação na Web quebrou barreiras económicas e geográficas ao conhecimento, mas a natureza efémera da Web poderá fazer com que se quebre o acesso ao próprio conhecimento.
A informação publicada em-linha deverá ser preservada e mantida acessível para a gerações futuras, tal como tem sido feito durante séculos com a informação publicada através da imprensa.
Os arquivos da Web são sistemas que recolhem e preservam informação publicada na Internet para que esta possa ser acessível no futuro. Arquivar a Web além de contribuir para preservar conhecimento científico e histórico, permite também que cidadãos comuns mantenham as suas memórias enquanto indivíduos. Todos os dias as pessoas tiram fotografias e partilham-nas na Web. Contudo, os cuidados mais elementares para a preservação desta informação, como copiar as fotografias para um disco, raramente são tomados. No futuro, muitas pessoas terão dificuldade em mostrar retratos das suas memórias ou famílias.
O Arquivo da Web Portuguesa é um serviço da Fundação para a Computação Científica Nacional que arquiva e preserva conteúdos da Web particularmente relevantes para a comunidade portuguesa.
Este projeto destaca-se por ter desenvolvido um serviço de pesquisa textual sobre conteúdos do passado, disponível experimentalmente em http://www.arquivo.pt.
Homepage: Arquivo.pt
Este artigo tem mais de um ano
Ora mas esse serviço já existe em http://web.archive.org!
Mais interessante ainda é que as datas disponíveis em http://www.arquivo.pt são as mesmas que existem no http://web.archive.org.
Experimentei para o sapo.pt!
Ou seja, é apenas um frontend em PT do http://web.archive.org?
Hum…
Penso que a palavra mais importante em Arquivo da Web Portuguesa é Portuguesa, ou seja, este serviço é focalizado em arquivos escritos em Português.
Olá,
O Arquivo da Web Portuguesa faz uma preservação em repositório próprio de dados de interesse para a comunidade portuguesa.
Por outro lado, disponibiliza serviços de valor acrescentado em relação ao Internet Archive, como por exemplo, possibilidade de pesquisa por palavra chave.
Para encontrar alguma informação no Internet Archive é necessário saber qual o endereço onde esta foi publicada no passado.
Vejam as Perguntas Frequentes acerca do projecto:
http://sobre.arquivo.pt/perguntas-frequentes/projecto#section-4
Abraços.
Discordo e muito.
Valor acrescentado neste serviço, para mim, é ver o pplware em 2006:
http://web.archive.org/web/20061110005543/https://pplware.sapo.pt/
Enquanto que o mais antigo na versão ‘Portuguesa’ é de 2008:
http://arquivo.pt/wayback/wayback/id3790index6?year=2008&r_pos=1&r_t=3&col_pos=1&col_tot=3&l=pt&sid=D765A53BA0F7C6ACE50FDDD68FB5C49C
Muito engraçado 😀 Vi cada site mais feio aí arquivado lol Mas prontos, uns anos atrás eles eram mesmo assim hehehe
http://arquivo.pt/wayback/wayback/id2692index10?year=2009&r_pos=1&r_t=2&col_pos=1&col_tot=3&l=pt&sid=A6831A812747BC5188F0186A638C42FE
Pena não existirem versões mais antigas!
Existem sim: http://www.arquivo.pt/search.jsp?query=http%3A%2F%2Fwww.pplware.com%2F&dateStart=01/01/1996&dateEnd=31/12/2011&pos=1
Não me expliquei bem… o link que forneci é referente à data 18 de Fevereiro de 2008, portanto, é o mais antigo disponível.
Eu estava a dizer que é pena não existirem referências anteriores a essa data!
Excelente artigo
Cumprimentos
Serva
http://expresso.sapo.pt/anonymous-atacam-embaixada-de-portugal=f713918
Este projeto não tem/tinha o apoio de voluntários, que cediam uma certa parte do disco para manter cópias dos websites?
Em todo o caso, apoio completamente este tipo de iniciativas. Para além de ficarmos com um registo histórico da web em Portugal, que é sempre interessante, ainda podemos ver alguma informação útil que entretanto foi esquecida pelos webmasters de alguns sites. É um museu da web.
Alguém me pode indicar um programa de preferência gratuito que faça uma cópia dos conteúdos existentes num website. Incluindo pics, vids, etc.
Testei o SurfOffline mas a versão gratuita é muito limitada e eu não consegui encontrar nenhuma versão “paga” nos sítios do costume.
PS. A aplicação tanto pode ser para ser Linux como para Windows
Cromos do Cosmos:
Experimente o HTTrack:
http://www.httrack.com/
Muito obrigado Miranda, era disto mesmo que estava à procura.
@Cromos do Cosmos
Para sistemas Linux/GNU podes usar o wget. Já vem instalado no sistema operativo (em princípio). Não tem interface gráfica, mas não é complicado trabalhar com ele, é uma questão de ler a man page.
Vou experimentar.
Apesar do HTTrack fazer o que o pretendo e ter um interface simples e intuitivo, vou testar o wget.
Obrigado POliveira