Os números são claros: 38% das páginas de internet publicadas até 2013 já desapareceram. O mesmo aconteceu com 25% das que foram publicadas na última década. A corrida para preservar este histórico digital está em curso, mas não é fácil.
É um comum dizer-se que a velocidade a que tudo se move na internet é avassaladora. Também é normal afirmar-se que uma vez na net, para sempre na net. Afinal, parece que não é bem assim. Muitas páginas que talvez muita gente acedeu vezes sem conta estão a desaparecer sem deixar grande pegada digital.
Por isso, as plataformas de arquivamento digital estão a enfrentar uma corrida contra o tempo para salvar a vasta quantidade de informação que desaparece da internet a cada ano. É que uma investigação recente revela que 25% das páginas web publicadas entre 2013 e 2023 já desapareceram.
A Internet Archive, uma organização sem fins lucrativos, tem desempenhado um papel vital neste esforço, com o objetivo de preservar uma vasta gama de conteúdos digitais. Fundada em 1996, já arquivou mais de 866 mil milhões de páginas web, bem como livros, vídeos e outros materiais culturais.
Mas a verdade é que a história digital da humanidade está em risco devido à fragilidade da internet. Ao contrário de artefactos físicos como manuscritos antigos ou livros históricos, o conteúdo online é mais efémero.
Empresas fecham, websites são descontinuados, e informação importante desaparece num ciclo constante. Este problema é mais visível com o passar do tempo, sendo que 38% das páginas web que existiam em 2013 já não estão acessíveis.
Problema estende-se aos governos
Mesmo as instituições governamentais não estão imunes a este fenómeno. O estudo mostra que uma em cada cinco páginas web de governos contém ligações quebradas, o que compromete a integridade das informações que deveriam ser preservadas para futuras gerações.
Mais de metade dos artigos da Wikipédia também enfrentam este problema, o que significa que as fontes citadas podem deixar de estar disponíveis para consulta.
No entanto, o esforço de arquivamento enfrenta desafios significativos. As organizações que pugnam pela preservação desta história digital estão sujeitas a problemas financeiros, ataques cibernéticos, e batalhas legais, especialmente com empresas que não querem que as suas criações intelectuais sejam armazenadas gratuitamente.
A Internet Archive, por exemplo, utiliza o seu projeto Wayback Machine para capturar múltiplas versões de uma página ao longo do tempo, permitindo que o público aceda a versões anteriores de websites, muitas vezes gratuitos.
Além da Internet Archive, outras organizações, como a Biblioteca do Congresso dos EUA, têm os seus próprios projetos de arquivamento, preservando websites governamentais e notícias. Também há esforços específicos em certas regiões, como no Reino Unido, onde o UK Web Archive captura uma imagem da internet britânica anualmente.
Com o rápido avanço da tecnologia, a maior parte da nossa vida social, cultural e intelectual migrou para o espaço virtual.
É por isso que manter um registo digital do nosso tempo é fundamental para que futuras gerações compreendam a era em que vivemos, tal como hoje estudamos documentos históricos.