【天天播资讯】AI公司“偷用”数据现象渐增 马斯克拆招:设置推文阅读量上限

科创板日报   2023-07-03 12:07:52

财联社7月3日讯(编辑 周子意)为了阻止过度数据获取和系统操纵,社交媒体平台推特(Twitter)的老板埃隆·马斯克正限制用户可阅读的推文数量。

在周日(7月2日)的一条推文中,马斯克将此次对推特的新限制归咎于人工智能(AI)公司从该平台过度抓取了大量数据


(资料图片)

根据马斯克最初的说法,经过验证的用户每天阅读量限制在6000条推文,未经验证的账户每天只能看600条帖子,而对于未经验证的新用户每天只能看到300条。

在宣布这一消息的两个小时内,马斯克在推特上表示,阅读限制将增加,已验证账户为8000条,未经验证账户为800条,新未经验证账户为400条。

随后不久,他又在推特上称,这些数字现在分别达到10000条、1000条和500条。

在马斯克宣布新限制前不久,就有不少用户报告了在尝试访问推特时出现了问题。周六(7月1日),有不少用户反馈,许多尝试在推特网站或移动应用上访问或发布内容的用户都遇到了“超出速率限制”或“无法检索推文”的错误消息。

还有用户反映,在未登录推特的情况下无法查看推文。推特官方对此回应道,其网络版本不再允许用户在不登陆的情况下浏览,所有网址都会重新返回注册页面

而马斯克声称,这些举措是必要的,因为“数百家甚至更多组织正在过度过量地抓取推特数据,以至于影响了真正的用户体验。”

矛盾升级

此前,马斯克就已经“看不惯”那些试图为AI训练大型语言模型(LLM)获取数据的公司了,比如ChatGPT、微软Bing和谷歌Bard。

事实上,越来越多的数据所有者和AI开发商正在就数据版权问题起争执。今年5月,推特公司就曾致信微软,称其滥用推特的数据,要求微软对这些违规行为进行审查,并暗示可能有更严重的事态发展。微软仅在2022年就检索了260多亿条推文。

不仅推特表达了它的不满,近日一批匿名人士以“窃取私人数据”为由,向OpenAI公司、以及其投资方之一的微软公司发起集体诉讼。

起诉书称,OpenAI从互联网上窃取了3000亿个单词,它们来自“书籍、文章、网站和帖子——包括未经同意获得的个人信息”。

此外,今年4月,美国贴吧”Reddit官方宣布将对调用其API的公司收费,原因也正是OpenAI、谷歌等公司利用该平台上的数据训练模型。

推特也于今年稍早时候公布了其新的API价格结构:基础层级每月花费100美元,主要面向个人用户,每月可以读取1万条推文;而对初创企业层级,推特每月将收取5000美元,每月可以读取100万条推文;至于想要访问更多数据的开发者必须申请企业访问权限,据报道每月需要花费42000美元。

最新供应

更多