A história da Internet em Portugal também tem um lugar especial
A Internet foi criada para ser uma forma de comunicação sempre assente no presente, sem ligar ao que já passou. O interesse encontra-se no que está a acontecer agora, preparando o que pode vir a surgir no futuro imediato.
Mas é importante preservar a memória e arquivar o que já passou, para que mais tarde possa ser consultado e visto com o devido distanciamento.
Em Portugal há quem assuma este papel, garantindo a preservação de tudo o que a Internet já nos deu no passado. Vamos conhecer melhor o projecto do Arquivo da Web Portuguesa.
A Internet, dizem, tem uma memória eterna e tudo o que nela é publicado fica para sempre gravado. O problema é mesmo conseguir aceder a essa informação. E é aqui que entra o Arquivo da Web Portuguesa, recolhendo toda informação disponível no espaço virtual Português.
O Pplware foi conhecer melhor este projecto e conversou com os responsáveis do AWP, que nos explicaram quais os seus desafios e as dificuldades que encontram no dia-a-dia.
Pplware: Quando foi iniciado o projecto?
AWP: 2007 mas foi derivado de investigação feita em Portugal desde 2001. Saiba mais detalhes em: http://sobre.arquivo.pt/sobre-o-arquivo/historia
Pplware: Quem liderou, qual a instituição?
AWP: FCCN - Fundação para a Computação Científica Nacional (www.fccn.pt). A FCCN tem como objectivo disponibilizar serviços relacionados com a Internet para a comunidade científica e académica.
Pplware: Que tecnologia é utilizada?
AWP: A tecnologia foi adaptada de um projecto de código-aberto livre apoiado pelo International Internet Preservation Consortium e pelo Internet Archive chamado Archive-access.
Depois evoluiu para um projecto independente de código-aberto livre, o pwa_technologies, que agora está no Google Code, mas vai ser migrado para o GitHub com o novo nome FullPast.
Como tecnologias base, usamos Linux, Java, Tomcat, Apache Lucene httpd e Apache Lucene.
Pplware: Qual a estrutura que a instituição montou para arquivar a web (pessoas, equipamentos)?
AWP: Tem variado ao longo do tempo. Mas em média temos o equivalente a 3 pessoas a tempo inteiro investidos em recursos humanos. Ao nível de equipamento temos actualmente 85 servidores que totalizam cerca de 11 TB de memória RAM e 1,2 PB de disco rígido.
Pplware: E a questão de direitos autorais? Portugal tem uma lei de depósito legal estendido ao conteúdo Web?
AWP: A lei do depósito legal portuguesa foi redigida quando ainda não existia Web e portanto não se refere explicitamente a este tipo de informação.
O arquivo da Web respeita os direitos dos autores. O arquivo e preservação dos sites portugueses é um serviço gratuito oferecido pela FCCN aos autores. Contudo, um autor pode prescindir deste serviço indicando-o através do protocolo Robots Exclusion Protocol.
Todos os conteúdos arquivados só ficam disponíveis passado 1 ano da sua recolha para que não exista competição de acesso com os sites originais.
Qualquer autor pode pedir que o seu conteúdo deixe de estar disponível no Arquivo.pt.
Mas por outro lado, também pode sugerir que seja arquivado em Sugerir.
Pplware: O que podem arquivar e o que não podem?
AWP: Apenas podemos arquivar informação pública e que seja tecnologicamente acessível. Existem páginas impossíveis de arquivar e preservar devido à tecnologia que foi usada na sua construção. É importante que os autores sigam recomendações para criar sites preserváveis ao longo do tempo.
Pplware: Desde quando o site 'arquivo.pt' está no ar?
AWP: O serviço de pesquisa está no ar desde 2010.
Pplware: O que ele guarda?
AWP: Mais de 2 000 milhões de ficheiros arquivados da Web desde 1996 em todos os formatos, relacionados com a comunidade portuguesa e de interesse internacional. Contudo, existem conteúdos que são tecnologicamente difíceis de arquivar, como por exemplo, vídeos em Flash.
Pplware: Quantos utilizadores têm?
AWP: Em Abril registámos 3 500 utilizadores. O que não é muito, se considerarmos a utilidade e unicidade deste tipo de serviço.
Precisamos de divulgação para que mais pessoas possam conhecer e tirar partido do serviço. Os recursos são limitados e as campanhas publicitárias são caras.
Este artigo tem mais de um ano
Desconhecia.
Bom artigo
Bom projecto!!!
Encontrei projectos que eu tive e que a muito foram fechados! 🙂
Gostei do artigo, mto bom, parabéns pessoal.
Coitadas das pessoas que nessa altura usavam smartphones para irem a esses websites jk 😉
encontrei vários projetos de quando ainda era uma criança, e que por a caso ainda estão de pé. http://rafaeloli.no.sapo.pt/ 🙂
http://rafaeloli.no.sapo.pt/diversos.htm
“Esta folha vai ser realizada por Rafael e Daniel”
Estamos há 15 anos à espera Rafael!
Espero que a TP One (Telepac One) là esteja, administrei-a durante anos e tive a honra de a desligar.