OpenAI的“ChatGPT浏览器”,这是一个基于必应(Bing)的搜索引擎功能,由于一处漏洞允许用户绕过付费环节直接阅读付费内容,现已被OpenAI暂时禁用。
在7月4日的一条推特中,OpenAI通知用户暂停了这个功能,以修复问题,并"尊重内容所有者的权益"。OpenAI在推特上写道:
“我们发现ChatGPT的‘浏览功能’(Browse)测试版有时会以我们不希望的方式展示内容,例如,如果用户提出要求需要阅览某个链接指向的需要付费的全文内容,它可能会无意中满足这个请求。我们正在禁用浏览器功能以修复这个问题——我们想要尊重内容所有者的权益。”
We've learned that ChatGPT's "Browse" beta can occasionally display content in ways we don't want, e.g. if a user specifically asks for a URL's full text, it may inadvertently fulfill this request. We are disabling Browse while we fix this—want to do right by content owners.
— OpenAI (@OpenAI) July 4, 2023
目前,"浏览"功能还处于测试阶段,并仅对ChatGPT Plus服务的订阅者开放。OpenAI可能是因为一个Reddit上的帖子的反馈,才意识到有这个漏洞存在。
在6月末的时候,Reddit上的ChatGPT子版块的一个成员发布了一个"浏览"会话的截图,他们要求聊天机器人“打印出”一篇来自The Atlantic的付费文章的链接中的全部文本。
作为回应,ChatGPT全文提供了这篇文章,而没有提示用户这篇文章是付费内容,需要支付才能阅览。
Reddit上的帖子显示,ChatGPT能够刮取隐藏在付费环节后的文字。来源:Reddit
这篇帖子收到了6200个赞和284条评论,一些人猜测ChatGPT“使用的是同样的机制”作为在线付费墙的去除器,它“阅读的是谷歌缓存的版本”,这个版本为了搜索引擎优化的目的并没有付费墙。
另一位Reddit用户“Red_Laughing_Man”建议ChatGPT可能只是能够忽略任何付费墙代码,这些代码被用来在内容的顶部加上一个横幅,直到有人注册或登录。
一个Redditor恰如其分地敦促人们“享受它持续的时间”。
近几个月来,使用数据刮取来训练AI模型已经成为一个普遍的问题。
7月1日,Twitter的所有者伊隆·马斯克(Elon Musk)也是以“数据刮取”为理由,对平台上用户每天可以阅读的推文数量设定了新的限制。
OpenAI之前也因为这个问题被起诉过。Cointelegraph在6月29日报道,ChatGPT的创造者被集体诉讼,因为其涉嫌从互联网上刮取了私人用户信息。