Pplware

A história da Internet em Portugal também tem um lugar especial

A Internet foi criada para ser uma forma de comunicação sempre assente no presente, sem ligar ao que já passou. O interesse encontra-se no que está a acontecer agora, preparando o que pode vir a surgir no futuro imediato.

Mas é importante preservar a memória e arquivar o que já passou, para que mais tarde possa ser consultado e visto com o devido distanciamento.

Em Portugal há quem assuma este papel, garantindo a preservação de tudo o que a Internet já nos deu no passado. Vamos conhecer melhor o projecto do Arquivo da Web Portuguesa.

A Internet, dizem, tem uma memória eterna e tudo o que nela é publicado fica para sempre gravado. O problema é mesmo conseguir aceder a essa informação. E é aqui que entra o Arquivo da Web Portuguesa, recolhendo toda informação disponível no espaço virtual Português.

O Pplware foi conhecer melhor este projecto e conversou com os responsáveis do AWP, que nos explicaram quais os seus desafios e as dificuldades que encontram no dia-a-dia.

Pplware: Quando foi iniciado o projecto?

AWP: 2007 mas foi derivado de investigação feita em Portugal desde 2001. Saiba mais detalhes em: http://sobre.arquivo.pt/sobre-o-arquivo/historia

Pplware: Quem liderou, qual a instituição?

AWP: FCCN – Fundação para a Computação Científica Nacional (www.fccn.pt). A FCCN tem como objectivo disponibilizar serviços relacionados com a Internet para a comunidade científica e académica.

Pplware: Que tecnologia é utilizada?

AWP: A tecnologia foi adaptada de um projecto de código-aberto livre apoiado pelo International Internet Preservation Consortium e pelo Internet Archive chamado Archive-access.

Depois evoluiu para um projecto independente de código-aberto livre, o pwa_technologies, que agora está no Google Code, mas vai ser migrado para o GitHub com o novo nome FullPast.

Como tecnologias base, usamos Linux, Java, Tomcat, Apache Lucene httpd e Apache Lucene.

Pplware: Qual a estrutura que a instituição montou para arquivar a web (pessoas, equipamentos)?

AWP: Tem variado ao longo do tempo. Mas em média temos o equivalente a 3 pessoas a tempo inteiro investidos em recursos humanos. Ao nível de equipamento temos actualmente 85 servidores que totalizam cerca de 11 TB de memória RAM e 1,2 PB de disco rígido.

Pplware: E a questão de direitos autorais? Portugal tem uma lei de depósito legal estendido ao conteúdo Web?

AWP: A lei do depósito legal portuguesa foi redigida quando ainda não existia Web e portanto não se refere explicitamente a este tipo de informação.

O arquivo da Web respeita os direitos dos autores. O arquivo e preservação dos sites portugueses é um serviço gratuito oferecido pela FCCN aos autores. Contudo, um autor pode prescindir deste serviço indicando-o através do protocolo Robots Exclusion Protocol.

Todos os conteúdos arquivados só ficam disponíveis passado 1 ano da sua recolha para que não exista competição de acesso com os sites originais.

Qualquer autor pode pedir que o seu conteúdo deixe de estar disponível no Arquivo.pt.

Mais detalhes em:

Mas por outro lado, também pode sugerir que seja arquivado em Sugerir.

Pplware: O que podem arquivar e o que não podem?

AWP: Apenas podemos arquivar informação pública e que seja tecnologicamente acessível. Existem páginas impossíveis de arquivar e preservar devido à tecnologia que foi usada na sua construção. É importante que os autores sigam recomendações para criar sites preserváveis ao longo do tempo.

Pplware: Desde quando o site ‘arquivo.pt’ está no ar?

AWP: O serviço de pesquisa está no ar desde 2010.

Pplware: O que ele guarda?

AWP: Mais de 2 000 milhões de ficheiros arquivados da Web desde 1996 em todos os formatos, relacionados com a comunidade portuguesa e de interesse internacional. Contudo, existem conteúdos que são tecnologicamente difíceis de arquivar, como por exemplo, vídeos em Flash.

Pplware: Quantos utilizadores têm?

AWP: Em Abril registámos 3 500 utilizadores. O que não é muito, se considerarmos a utilidade e unicidade deste tipo de serviço.

Precisamos de divulgação para que mais pessoas possam conhecer e tirar partido do serviço. Os recursos são limitados e as campanhas publicitárias são caras.

Exit mobile version