Reddit方面再次强调,付费才能获得其数据使用权

日前,Reddit CEO史蒂夫・霍夫曼公开表示,如微软等公司希望继续抓取该网站的数据就必须付费。据了解,此前Reddit方面已就使用其网站数据训练大模型或改善搜索结果等方面,与谷歌和OpenAI达成了合作。

Reddit方面再次强调,付费才能获得其数据使用权

据史蒂夫・霍夫曼表示,微软方面未经授权使用Reddit的数据训练AI大模型,并在Bing(必应)的搜索结果中提供Reddit的内容、甚至通过Bing API将这些数据出售给其他搜索引擎。同时他还针对微软AI业务负责人穆斯塔法・苏莱曼此前关于互联网公共数据是“免费软件”的言论进行了回应,并称微软等公司认为互联网上所有数据都可以供免费使用,这是他们的真实立场。


对于为网站数据付费一事,史蒂夫・霍夫曼指出,如果没有合作,Reddit将无法控制或了解其数据的使用方式,这也使得其不得不屏蔽那些不愿接受数据使用条款的公司。除微软之外,他还点名了Anthropic和Perplexity这两家公司,并称后者拒绝谈判、而且封锁这些公司的爬虫非常麻烦。


同时史蒂夫・霍夫曼以OpenAI的SearchGPT为例,强调了付费协议的重要性。例如今年5月Reddit方面在与OpenAI达成协议后,允许SearchGPT显示其平台中的内容。Reddit公司发言人蒂姆・拉特施密特还进一步指出,目前已签订的所有内容许可协议都不涉及数据独占使用权。


值得一提的是,此前在今年2月Reddit方面正式宣布与谷歌达成合作后,就曾有消息称,Reddit的内容在谷歌搜索中展示的次数大幅增加。


Reddit方面随后在7月还更新了网站的robots.txt文件(网络与爬虫的协议文件),屏蔽了除谷歌搜索以外其他搜索引擎的检索,其中就包括Bing。同时该公司在这一文件中表示,“Reddit相信开放的互联网,但不相信滥用公共内容”。


对此微软搜索业务主管乔迪・里巴斯曾宣称,Reddit屏蔽了Bing的爬虫、且偏袒另一家竞品,影响了Bing以及基于其搜索引擎的市场竞争。微软公司发言人凯特琳・劳尔顿则表示,微软尊重网站不希望其内容被用于生成式AI模型的意愿。


针对此事,蒂姆・拉特施密特在一份声明中表示,“这与我们最近与谷歌的合作完全无关。我们一直在与多个搜索引擎进行讨论,但无法与所有人达成协议,因为有些人无法或不愿就他们使用Reddit的内容(包括对AI训练的使用)作出可执行的承诺”。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看