Reddit 限制 Wayback Machine 仅可存档首页内容

Reddit 宣布将限制互联网档案馆(The Internet Archive)旗下 Wayback Machine 对其平台的访问权限。即日起,该服务仅能存档该网络论坛的首页内容,而无法继续保存单个帖子及其用户资料。 Reddit 发言人表示,此举旨在防止人工智能公司利用存档的 Reddit 页面训练 AI 模型。该平台此前已通过 robots.txt 文件阻止自动网络爬虫抓取,但允许包括互联网档案馆在内的” 善意第三方” 继续访问。最新调查显示,AI 公司的爬虫程序正通过绕道互联网档案馆获取论坛内容。 Reddit 发言人强调:” 在互联网档案馆能够有效保护用户隐私(如对已删除内容执行去存档操作)并符合平台要求前,我们将持续限制其数据访问权限以保护用户权益” 。

互联网档案馆 Wayback Machine 负责人马克·格雷厄姆证实,目前仍与 Reddit 就该问题保持” 持续对话” 。值得注意的是,Reddit 用户协议长期禁止 AI 公司在未经许可的情况下采集网站内容,去年平台已调整技术手段加强防护,但此次升级限制措施直接影响了历史数据的保存完整性。

(0)
Gustave Agnes的头像Gustave Agnes

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注