ITBear旗下自媒体矩阵:

Wayback Machine收录4千亿网页 涵盖1996年至今历史记录

   时间:2014-05-11 08:41:33 来源:互联网编辑:星辉 发表评论无障碍通道

Internet Archive今日达成了一项里程碑式成就,其网站历史信息查询服务工具Wayback Machine收录了4千亿网页索引。数据涵盖了从1996年至今的几乎所有网站的历史网页记录。

以下是Internet Archive总结的Wayback Machine的历史和里程碑:

2001年 - Wayback Machine项目启动

2006年 - Arichive-It启动,允许创建订阅该服务的库以收集网络内容

2009年3月25日 - Internet Archive和Sun微系统公司共同启动了一个数据中心,存储整个互联网的文档及为Wayback Machine提供服务。该数据中心有3PB容量,每秒处理500个请求。

2011年6月15日 - 加入HTTP Archive,增加记录网站性能数据的功能。

2012年5月28日 - Wayback Machine在中国被封锁数年后再次上线。

2012年10月26日 - 被记录网站抓取数据达到了80TB,该抓取数据在2011年面向研究者开放。

2013年10月 - Wayback Machine新功能“保存页面”开放,可以在页面被记录后一小时再查看最新的内容;联邦政府关闭期间也可以通过该工具访问政府站点。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version