互聯(lián)網(wǎng)是現(xiàn)代生活中不可或缺的寶庫,但即使全世界每天都依賴網(wǎng)絡來獲取各種資源,這些內容最終也有可能從人們的視野中消失。近日,一項研究發(fā)現(xiàn),當前的在線內容仍然非常短暫。
研究人員從互聯(lián)網(wǎng)檔案服務Common Crawl中收集了大約10萬個網(wǎng)頁的快照,并檢查這些樣本在當下是否還存在。結果顯示,在2013年存在的網(wǎng)頁中,到2023年10月為止已經(jīng)有約25%至30%無法訪問。這些無法訪問的頁面包含了兩種情況:一是域名仍然存在但其中某些頁面已經(jīng)失效;二是連域名都不再存在。
具體來看,在抽樣調查的新聞網(wǎng)站中,約23%的網(wǎng)頁至少包含一個失效鏈接。無論是高流量還是低流量的新聞網(wǎng)站,在此方面表現(xiàn)相似。排名前20%的新聞網(wǎng)站中,約25%的頁面至少包含一個失效鏈接;而排名后20%的網(wǎng)站中,則是26%。
此外,研究人員還對維基百科進行了觀察。他們選擇了維基百科中的“參考鏈接”部分,并發(fā)現(xiàn)其中11%的鏈接已經(jīng)失效;同時,在社交媒體平臺上發(fā)布的近500萬條推文樣本中,有接近18%的內容在3個月內就已經(jīng)不可見。
其中有一半是因為賬號被設為私密、被凍結或注銷;另外一半是因為賬號發(fā)布者自己刪除了相關推文,但是賬號本身仍活躍。這項研究表明,在線內容仍然非常短暫且不穩(wěn)定。