A internet está a “desaparecer”. Mas há quem lute por preservar a história digital
Os números são claros: 38% das páginas de internet publicadas até 2013 já desapareceram. O mesmo aconteceu com 25% das que foram publicadas na última década. A corrida para preservar este histórico digital está em curso, mas não é fácil.
É um comum dizer-se que a velocidade a que tudo se move na internet é avassaladora. Também é normal afirmar-se que uma vez na net, para sempre na net. Afinal, parece que não é bem assim. Muitas páginas que talvez muita gente acedeu vezes sem conta estão a desaparecer sem deixar grande pegada digital.
Por isso, as plataformas de arquivamento digital estão a enfrentar uma corrida contra o tempo para salvar a vasta quantidade de informação que desaparece da internet a cada ano. É que uma investigação recente revela que 25% das páginas web publicadas entre 2013 e 2023 já desapareceram.

Fonte: Análise do Pew Research Center de uma seleção aleatória de URLs recolhidos pelo repositório Web Common Crawl (n=999.989) e verificados utilizando códigos de resposta de página e DNS. As páginas Web foram definidas como inacessíveis se devolvessem um código de estado de 204, 400, 404, 410, 500, 501, 502, 503, 523 ou não devolveram um código de estado válido. “Quando o conteúdo online desaparece”
A Internet Archive, uma organização sem fins lucrativos, tem desempenhado um papel vital neste esforço, com o objetivo de preservar uma vasta gama de conteúdos digitais. Fundada em 1996, já arquivou mais de 866 mil milhões de páginas web, bem como livros, vídeos e outros materiais culturais.
Mas a verdade é que a história digital da humanidade está em risco devido à fragilidade da internet. Ao contrário de artefactos físicos como manuscritos antigos ou livros históricos, o conteúdo online é mais efémero.
Empresas fecham, websites são descontinuados, e informação importante desaparece num ciclo constante. Este problema é mais visível com o passar do tempo, sendo que 38% das páginas web que existiam em 2013 já não estão acessíveis.
Problema estende-se aos governos
Mesmo as instituições governamentais não estão imunes a este fenómeno. O estudo mostra que uma em cada cinco páginas web de governos contém ligações quebradas, o que compromete a integridade das informações que deveriam ser preservadas para futuras gerações.
Mais de metade dos artigos da Wikipédia também enfrentam este problema, o que significa que as fontes citadas podem deixar de estar disponíveis para consulta.
No entanto, o esforço de arquivamento enfrenta desafios significativos. As organizações que pugnam pela preservação desta história digital estão sujeitas a problemas financeiros, ataques cibernéticos, e batalhas legais, especialmente com empresas que não querem que as suas criações intelectuais sejam armazenadas gratuitamente.
A Internet Archive, por exemplo, utiliza o seu projeto Wayback Machine para capturar múltiplas versões de uma página ao longo do tempo, permitindo que o público aceda a versões anteriores de websites, muitas vezes gratuitos.
Além da Internet Archive, outras organizações, como a Biblioteca do Congresso dos EUA, têm os seus próprios projetos de arquivamento, preservando websites governamentais e notícias. Também há esforços específicos em certas regiões, como no Reino Unido, onde o UK Web Archive captura uma imagem da internet britânica anualmente.
Com o rápido avanço da tecnologia, a maior parte da nossa vida social, cultural e intelectual migrou para o espaço virtual.
É por isso que manter um registo digital do nosso tempo é fundamental para que futuras gerações compreendam a era em que vivemos, tal como hoje estudamos documentos históricos.
Apps, redes sociais, IA estão a ficar cada vez mais com a maioria do tráfego da internet, a velha página de internet cada vez tem menos adeptos é essa a realidade dos números.
Chama se evolucao. Também ha dezenas de sites que copiam ou traduzem e dizem o mesmo como este. As redes sociais sao a internet e ainda bem, os nerds so tem de as programar não tem amigos para as usar. Fui
Na minha opinião a internet está a perder interesse devido ao controlo das BigTech e também UE.
Só servirá para serviços e comunicação no futuro.
A internet está repleta de lixo. Hoje mais do que nunca. Imaginem como estará os servidores das plataformas de redes sociais e de vídeos daqui 30…40 anos. Com os ditos “produtores de conteúdos digitais” a produzires conteúdos cada vez mais irrelevantes para a sociedade poduzidos “toneladas” de vídeos diariamente. Demandando uma estrutura física cada vez maior. Poderiam abordar mais sobre este tema.
Como utilizadora da Internet desde 1994, posso afirmar que nada é como era antes. Muito, mas muito pior nos dias de hoje. Ou seja, a Internet era das pessoas, “agora” é das empresas (poucas). A censura na Internet atual está a níveis nunca antes vistos, as BigTech dominam praticamente todo o conteúdo que vemos e controlam/vigiam praticamente (quase) todo o nosso rasto digital. As BigTech e os governos (todos) ajudam-se mutuamente para combater e calar quem têm opiniões divergentes da narrativa oficial… Está em marcha uma tentativa oculta de uma vasta equipa em apagar a História. A História antes da Internet, e a História do que se escreveu na Internet. O geoblocking foi a pior funcionalidade alguma vês inventada e colocada em prática. As técnicas de manipulação do Ser Humano são hoje usadas de tal forma, que nem nós nos damos conta que estamos a ser manipulados. Estamos na Internet, tal como uma criança de 5 anos que quando chega à caixa do supermercado se vê manipulada (sem saber), com os chocolates que estão junto à caixa de pagamento. As Apps e redes sociais estão pensadas para nos viciar, por isso, conquistam naturalmente mais tráfego. Admitindo estar errada, penso que a poluição mental das e nas redes sociais é um cancro que se vai alastrar e fazer muitos estragos psicológicos a que as utiliza. A produção de conteúdos é cada vez menos humana e de menor qualidade. Disso, não tenho dúvidas. A começar pelas fotografias de perfil e outras, que são alteradas com filtros para se parecer o que não se é, passando pelas vidas sempre “cor de rosa” nas redes sociais, até chegarmos à criação de conteúdos com a AI, confesso que a qualidade do que veremos futuramente na Internet não será melhor do que era antes de aparecerem as GAFAM. Quando os resultados das nossas pesquisas na Internet são manipulados e o seu número é limitado, isto deveria ser um sinal de alarme para nós próprios e pensarmos que algo não bate certo.
Concordo plenamente, cada vez mais, temos “seres não pensantes”, mas é disto e é isto que os Estados querem “Atrofiados Mentalmente”.
“A escravidão começa quando você não tem liberdade de pensar e tudo começa com o pensamento, por isso pense muito bem antes de pensar. Pensar é difícil, por isso que a maioria das pessoas começa a julgar”
Maldito copy /paste que por vezes falha.
“A escravidão começa quando você não tem liberdade de pensar e tudo começa com o pensamento, por isso pense muito bem antes de pensar. Pensar é difícil, por isso que a maioria das pessoas começa a julgar, mas é no pensamento que você começa a vencer.”
Bom post.
+1000
O charlatão Musk já apagou vários posts de promessas que fez há quase uma década. A sorte dele é que os fãs da Tesla têm memoria de periquito.
Quem te dera teres 0.1% da inteligência do Musk. Sempre a chorar estes garotos!
Tenho 0.1%^10
Estas gerações nem gravuras nas rochas vão deixar.
Arquivo.pt é um serviço público do estado Português que preserva milhões de ficheiros recolhidos da web desde a década de 1990 e disponibiliza um serviço público de pesquisa sobre esta informação
Seria muito mais interessante abordar no Artigo o Arquivo.pt do que Internet Archive.