Informatie op internet verdwijnt langzaam

Toegevoegd door - Ariën -, 9 maanden geleden

Informatie op internet verdwijnt langzaamInformatie op het internet is aan het verdwijnen, suggereert een onderzoek van Common Crawl die delen van het internet indexeert. Van de webpagina's die in 2013 bestonden, is momenteel 38 procent verloren. Het internet wordt vaak gezien als een plek waar inhoud voor altijd blijft bestaan. Maar volgens nieuw onderzoek gaan grote delen ervan verloren als pagina’s worden verwijderd of verplaatst. Het verdwijnen van de content gebeurt overigens ook op reguliere websites, zo blijkt uit het onderzoek van het Pew Research Center.

Ongeveer 23 procent van de nieuwspagina's bevat ten minste één verbroken link, en 21 procent van de overheidswebsites, zegt het rapport – en 54 procent van de Wikipedia-pagina's bevat een link in hun verwijzingen die niet langer bestaat. Ook op sociale media vindt dit effect plaats. Een vijfde van de berichten op X (Twitter) verdwijnt binnen enkele maanden na plaatsing van de site.

Het onderzoek werd vond plaats door willekeurige steekproeven van bijna een miljoen webpagina's te verzamelen, afkomstig van Common Crawl, een dienst die delen van het internet archiveert. Onderzoekers keken vervolgens of die pagina’s tussen 2013 en 2023 bleven bestaan. Hieruit bleek dat 25 procent van alle tussen 2013 en 2023 verzamelde pagina’s niet langer beschikbaar was. Daarvan was 16 procent van de pagina's afkomstig van een website die nog steeds bestaat, terwijl 9 procent zich op websites bevond die helemaal niet meer bestaan.

Gerelateerde nieuwsberichten

17/10/2022 Internetknooppunt AMS-IX haalt nieuw record
23/01/2020 Microsoft waarschuwt voor lek in Internet Explorer
06/08/2019 Microsoft doet VBScript definitief in de ban

 

Er zijn 4 reacties op 'Informatie op internet verdwijnt langzaam'

PHP hulp
PHP hulp
0 seconden vanaf nu
 

Gesponsorde koppelingen


8 maanden geleden
 
0 +1 -0 -1
Leuk onderzoek, maar de uitkomst is allerminst verrassend.

Als computers ergens goed in zijn, naast iets exact bewaren en reproduceren, is het wel met 1 druk op de knop wissen. En dat gebeurt massaal, te meer omdat informatie die aan het internet hangt nou eenmaal moeite kost om te onderhouden. Servers moeten aan en up-to-date blijven, en het hele spul kost ondanks concentratie in datacenters een hoop stroom om aan te laten staan.

Alle informatie heeft een houdbaarheidsdatum. Bijvoorbeeld doordat het geschreven is in een tijdsgeest die niet meer passend gevonden wordt, omdat informatie is verouderd of achteraf incorrect bleek.

In bibliotheken wordt de collectie ook steeds vernieuwd, anders komt er niemand meer lezen en lenen. En op internet, wanneer te weinig mensen interesse hebben in informatie (misschien ook omdat er een overvloed is aan 'informatie'), dan wordt content offline gehaald.

Dit is ook een reden om informatie over PHP van internet te halen wanneer het niet meer actueel is. Bijvoorbeeld alle informatie over de mysql-extensie (behalve de originele handleiding voor als er nog te veel mensen zijn met een verouderde PHP-versie).

Het klinkt allemaal eenvoudig, maar het echt beheren van grote hoeveelheden informatie was en is een vak an sich. Zo had je een opleiding 'informatie- en documentatiemanagement'. Maar veel mensen (bedrijven) dachten dat met de vindsnelheid van computers en internet het niet meer (economisch) nodig of zelfs verantwoord was om zorgvuldig en gestructureerd met informatie om te gaan zoals in een bibliotheek. En dan komt er nu ineens een 'verrassend' onderzoek dat informatie komt en gaat..

Ik denk niet dat het erg is dat informatie verdwijnt. Internet is in tegenstelling tot een gestructureerde verzameling informatie een hele grote grabbelbak waarin je nooit kunt weten of je wel de beste informatie hebt gevonden die er is. En al die data wordt tegenwoordig in KI-modellen gegooid om er nog een beetje chocolade van te maken, waarbij wordt beweerd door sommigen dat KI binnen een jaar 'slimmer' gaat zijn dan de slimste mens:
https://arstechnica.com/information-technology/2024/04/elon-musk-ai-will-be-smarter-than-any-human-around-the-end-of-next-year/

Misschien moeten we dan eerst maar eens een sluitende definitie gaan verzinnen van 'intelligentie'!
Ivo P
Ivo P
8 maanden geleden
 
0 +1 -0 -1
"Ik denk niet dat het erg is dat informatie verdwijnt"

Sommige stukken informatie die nu niet interessant lijken, zijn misschien over lange tijd toch wel interessant.

Voorbeelden: Er is een heleboel genealogische informatie te vinden in oude archieven van gemeentens en kerken. Op oud papier staat genoemd wie wanneer getrouwd is met wie en wanneer kinderen geboren of gedoopt werden.

Er zijn oude landkaarten (van mijn dorp) waarop te zien is waar in 1840 al bebouwing was en waar toen wegen of paden liepen die er nu niet meer zijn / die nu uitgegroeid zijn naar verharde weg.

En ik verzamel ook oude fotokaarten van mijn dorp.

Dat zijn stukken informatie die over 150 jaar mogelijk niet meer te gebruiken zijn over de periode 1980-2024

Is een floppy-disk met WP 5.1 (Word Perfect) overzichten van een vereniging nu nog leesbaar (waar duw je zo'n floppy in en heb je software die dat formaat nog snapt?)

Wat doe je met digitale landkaarten of Streetview?

Papier gaat ook verloren: het vergaat, het wordt fout opgeborgen of gaat in een brand verloren.
Maar als je het in handen hebt, kun je er ook wat mee.

Met digitale informatie ligt dat anders: Als je nu een 3.5" disk aan een jongere laat zien, dan ziet hij daar in het gunstigste geval een 3d-print van een save-icon in. :-)
Laat staan wat een persoon die in 2124 zo'n ding in handen krijgt er van gaat vinden.

Dus ja: ik denk dat verloren gaan van informatie wel enigszins "erg" is.
Zij het dat dat ook op andere manieren inherent is aan het digitaal zijn van de informatie.
Khalid sheikh
khalid sheikh
8 maanden geleden
 
0 +1 -0 -1
Yes he is right
PHP hulp
PHP hulp
0 seconden vanaf nu
 

Gesponsorde koppelingen


8 maanden geleden
 
0 +1 -0 -1
Voor belangrijke zaken zijn er archieven, die belangrijke informatie archiveren. Er zijn ook vele historische "kringen", die de historische informatie die je omschrijft bewaart.

Als ik kijk naar het eigen gemeente-archief hier, dan worden de meeste dingen niet langer dan 30 jaar bewaard. Dat is niet altijd slim nee, maar wel kosteneffectief. En een lagere belasting is ook wel fijn.

Een andere invalshoek: wanneer dingen verdwijnen ontstaat er ruimte voor iets nieuws. Bijvoorbeeld: wat je niet wilt is dat foto's van mensen nu tot in de eeuwigheid bewaard blijven. Dat zou ook niemand wat boeien. Een enkele Oetzi misschien, maar meer ook niet.
En in filosofische zin kan je ook scheppen door iets weg te nemen. Dat zie je bijvoorbeeld in tekeningen van Esscher.

Daarom vind ik het niet jammer dat informatie op internet verdwijnt. Sterker, met de komst van generatieve KI zou ik graag willen dat informatie ontzettend snel verdwijnt. (rommel!)

Om te reageren heb je een account nodig en je moet ingelogd zijn.

Labels

PHP nieuws opties

 
 

Om de gebruiksvriendelijkheid van onze website en diensten te optimaliseren maken wij gebruik van cookies. Deze cookies gebruiken wij voor functionaliteiten, analytische gegevens en marketing doeleinden. U vindt meer informatie in onze privacy statement.