Niente è per sempre, neanche Internet. E questo è un problema
Per alcuni, potrebbe essere una rivincita all'avviso che le cose pubblicate su Internet restano per sempre, ma il "decadimento digitale" riguarda anche le fonti di Wikipedia o su Twitter / X
Internet ha un problema, che per molti in realtà potrebbe essere un sollievo, o anche una rivincita: quasi il 40% delle pagine Web di 10 anni fa o più non è più accessibile e rimanda al famoso "404: Page not found".
Stiamo parlando di quello che viene chiamato "decadimento digitale", che stando a un rapporto del Pew Research Center è particolarmente grave e getta un'ombra sulle fonti di una serie di articoli, come quelle che possiamo trovare su Wikipedia.
Internet ha un problema, che per molti in realtà potrebbe essere un sollievo, o anche una rivincita: quasi il 40% delle pagine Web di 10 anni fa o più non è più accessibile e rimanda al famoso "404: Page not found".
Stiamo parlando di quello che viene chiamato "decadimento digitale", che stando a un rapporto del Pew Research Center è particolarmente grave e getta un'ombra sulle fonti di una serie di articoli, come quelle che possiamo trovare su Wikipedia.
Il decadimento digitale è un fenomeno più grave di quanto si possa pensare.
Stando all'articolo pubblicato dal Pew Research Center, un quarto di tutte quelle che esistevano tra il 2013 e il 2023 non è più disponibile.
Questa tendenza è più aggressiva per i contenuti più vecchi, in quanto il 38% delle pagine Web del 2013 non è più accessibile, mentre per quelle del 2023 stiamo parlando dell'8%, il che comunque non è un valore così basso.
Il fenomeno, noto come "decadimento digitale", non riguarda solo le pagine Web, ma anche i tweet. Circa un quinto di tutti i tweet non è più visibile pochi mesi dopo essere stati pubblicati, perché l'account è diventato privato, è stato sospeso o cancellato.
Inoltre alcuni tweet tendono a sparire più velocemente di altri. Per esempio i tweet scritti in turco o arabo hanno maggiori probabilità di svanire rispetto ai tweet scritti in altre lingue (stiamo parlando del 40% di questi contenuti, spariti entro tre mesi dalla pubblicazione).
Perché? Pensate a Wikipedia: sono tantissime le schede in cui le fonti non sono più accessibili. Ma questo riguarda anche i siti Web governativi, o anche quelli di notizie.
Secondo il sito Columbia Journalism Review, che aveva ravvisato questo pericolo già nel 2021, questo comporta che non si può più accedere a contenuti di riferimento, quindi non si potrà più comprendere il contesto di un articolo.
Non solo, ma in uno studio del 2014 si è visto come negli Stati Uniti quasi la metà di tutti i collegamenti ipertestuali nei pareri della Corte Suprema hanno portato a contenuti che erano cambiati dalla loro pubblicazione originale o erano scomparsi da Internet.
Purtroppo questo rende certi tipi di ricerche estremamente difficili o quasi impossibili.
Il sito, o la comoda estensione per Chrome, vi permettono di recuperare miliardi di pagine Internet, salvate automaticamente dai suoi web crawler per preservare quanto più possibile il web pubblico. Certo, non troverete tutto quello che è stato pubblicato, ma una buona parte sì, e noi lo usiamo di frequente per controllare cambiamenti nei siti durante il tempo.
Curiosamente, mentre scrivevamo questo articolo il sito di The Internet Archive risultava non accessibile con errore 503, giustamente smentendo quanto appena affermato.
Stando all'articolo pubblicato dal Pew Research Center, un quarto di tutte quelle che esistevano tra il 2013 e il 2023 non è più disponibile.
Questa tendenza è più aggressiva per i contenuti più vecchi, in quanto il 38% delle pagine Web del 2013 non è più accessibile, mentre per quelle del 2023 stiamo parlando dell'8%, il che comunque non è un valore così basso.
Il fenomeno, noto come "decadimento digitale", non riguarda solo le pagine Web, ma anche i tweet. Circa un quinto di tutti i tweet non è più visibile pochi mesi dopo essere stati pubblicati, perché l'account è diventato privato, è stato sospeso o cancellato.
Inoltre alcuni tweet tendono a sparire più velocemente di altri. Per esempio i tweet scritti in turco o arabo hanno maggiori probabilità di svanire rispetto ai tweet scritti in altre lingue (stiamo parlando del 40% di questi contenuti, spariti entro tre mesi dalla pubblicazione).
Perché è un problema
Come dicevamo, per molti potrebbe essere una rivincita, dopo che per anni si sono sentiti dire che quello che si pubblica su Internet è per sempre, ma in realtà è un problema.Perché? Pensate a Wikipedia: sono tantissime le schede in cui le fonti non sono più accessibili. Ma questo riguarda anche i siti Web governativi, o anche quelli di notizie.
Secondo il sito Columbia Journalism Review, che aveva ravvisato questo pericolo già nel 2021, questo comporta che non si può più accedere a contenuti di riferimento, quindi non si potrà più comprendere il contesto di un articolo.
Non solo, ma in uno studio del 2014 si è visto come negli Stati Uniti quasi la metà di tutti i collegamenti ipertestuali nei pareri della Corte Suprema hanno portato a contenuti che erano cambiati dalla loro pubblicazione originale o erano scomparsi da Internet.
Purtroppo questo rende certi tipi di ricerche estremamente difficili o quasi impossibili.
C'è una parziale soluzione
C'è una soluzione, però, almeno parziale: The Internet Archive, una biblioteca digitale non profit che offre uno spazio digitale permanente per l'accesso a vari tipi di risorse, tra cui appunto i siti web.Il sito, o la comoda estensione per Chrome, vi permettono di recuperare miliardi di pagine Internet, salvate automaticamente dai suoi web crawler per preservare quanto più possibile il web pubblico. Certo, non troverete tutto quello che è stato pubblicato, ma una buona parte sì, e noi lo usiamo di frequente per controllare cambiamenti nei siti durante il tempo.
Curiosamente, mentre scrivevamo questo articolo il sito di The Internet Archive risultava non accessibile con errore 503, giustamente smentendo quanto appena affermato.
Lavoro sul testo.
Scrivi ciò che pensi riguardo al tema trattato nel testo.
1. Ritieni che il decadimento digitale sia un problema o un vantaggio e perché?
2. Quale impatto potrà avere in futuro il decadimento digitale sulla cultura e sulla conservazione dei documenti?
3. Che cosa proporresti per evitare gli inconvenienti derivanti dalla morte dei materiali digitali?
Discutine in aula oppure scrivi un testo di almeno 50 parole.
Commenti
Posta un commento