财联社7月3日讯(编辑 周子意)为了阻止过度数据获取和系统操纵,社交媒体平台推特(Twitter)的老板埃隆·马斯克正限制用户可阅读的推文数量。
在周日(7月2日)的一条推文中,马斯克将此次对推特的新限制归咎于人工智能(AI)公司从该平台过度抓取了大量数据。
(资料图片)
根据马斯克最初的说法,经过验证的用户每天阅读量限制在6000条推文,未经验证的账户每天只能看600条帖子,而对于未经验证的新用户每天只能看到300条。
在宣布这一消息的两个小时内,马斯克在推特上表示,阅读限制将增加,已验证账户为8000条,未经验证账户为800条,新未经验证账户为400条。
随后不久,他又在推特上称,这些数字现在分别达到10000条、1000条和500条。
在马斯克宣布新限制前不久,就有不少用户报告了在尝试访问推特时出现了问题。周六(7月1日),有不少用户反馈,许多尝试在推特网站或移动应用上访问或发布内容的用户都遇到了“超出速率限制”或“无法检索推文”的错误消息。
还有用户反映,在未登录推特的情况下无法查看推文。推特官方对此回应道,其网络版本不再允许用户在不登陆的情况下浏览,所有网址都会重新返回注册页面。
而马斯克声称,这些举措是必要的,因为“数百家甚至更多组织正在过度过量地抓取推特数据,以至于影响了真正的用户体验。”
矛盾升级
此前,马斯克就已经“看不惯”那些试图为AI训练大型语言模型(LLM)获取数据的公司了,比如ChatGPT、微软Bing和谷歌Bard。
事实上,越来越多的数据所有者和AI开发商正在就数据版权问题起争执。今年5月,推特公司就曾致信微软,称其滥用推特的数据,要求微软对这些违规行为进行审查,并暗示可能有更严重的事态发展。微软仅在2022年就检索了260多亿条推文。
不仅推特表达了它的不满,近日一批匿名人士以“窃取私人数据”为由,向OpenAI公司、以及其投资方之一的微软公司发起集体诉讼。
起诉书称,OpenAI从互联网上窃取了3000亿个单词,它们来自“书籍、文章、网站和帖子——包括未经同意获得的个人信息”。
此外,今年4月,美国贴吧”Reddit官方宣布将对调用其API的公司收费,原因也正是OpenAI、谷歌等公司利用该平台上的数据训练模型。
推特也于今年稍早时候公布了其新的API价格结构:基础层级每月花费100美元,主要面向个人用户,每月可以读取1万条推文;而对初创企业层级,推特每月将收取5000美元,每月可以读取100万条推文;至于想要访问更多数据的开发者必须申请企业访问权限,据报道每月需要花费42000美元。