【天天播资讯】AI公司“偷用”数据现象渐增马斯克拆招：设置推文阅读量上限-起点书画网

【天天播资讯】AI公司“偷用”数据现象渐增马斯克拆招：设置推文阅读量上限

科创板日报 2023-07-03 12:07:52

财联社7月3日讯（编辑周子意）为了阻止过度数据获取和系统操纵，社交媒体平台推特（Twitter）的老板埃隆·马斯克正限制用户可阅读的推文数量。

在周日（7月2日）的一条推文中，马斯克将此次对推特的新限制归咎于人工智能（AI）公司从该平台过度抓取了大量数据。

(资料图片)

根据马斯克最初的说法，经过验证的用户每天阅读量限制在6000条推文，未经验证的账户每天只能看600条帖子，而对于未经验证的新用户每天只能看到300条。

在宣布这一消息的两个小时内，马斯克在推特上表示，阅读限制将增加，已验证账户为8000条，未经验证账户为800条，新未经验证账户为400条。

随后不久，他又在推特上称，这些数字现在分别达到10000条、1000条和500条。

在马斯克宣布新限制前不久，就有不少用户报告了在尝试访问推特时出现了问题。周六（7月1日），有不少用户反馈，许多尝试在推特网站或移动应用上访问或发布内容的用户都遇到了“超出速率限制”或“无法检索推文”的错误消息。

还有用户反映，在未登录推特的情况下无法查看推文。推特官方对此回应道，其网络版本不再允许用户在不登陆的情况下浏览，所有网址都会重新返回注册页面。

而马斯克声称，这些举措是必要的，因为“数百家甚至更多组织正在过度过量地抓取推特数据，以至于影响了真正的用户体验。”

矛盾升级

此前，马斯克就已经“看不惯”那些试图为AI训练大型语言模型（LLM）获取数据的公司了，比如ChatGPT、微软Bing和谷歌Bard。

事实上，越来越多的数据所有者和AI开发商正在就数据版权问题起争执。今年5月，推特公司就曾致信微软，称其滥用推特的数据，要求微软对这些违规行为进行审查，并暗示可能有更严重的事态发展。微软仅在2022年就检索了260多亿条推文。

不仅推特表达了它的不满，近日一批匿名人士以“窃取私人数据”为由，向OpenAI公司、以及其投资方之一的微软公司发起集体诉讼。

起诉书称，OpenAI从互联网上窃取了3000亿个单词，它们来自“书籍、文章、网站和帖子——包括未经同意获得的个人信息”。

此外，今年4月，美国贴吧”Reddit官方宣布将对调用其API的公司收费，原因也正是OpenAI、谷歌等公司利用该平台上的数据训练模型。

推特也于今年稍早时候公布了其新的API价格结构：基础层级每月花费100美元，主要面向个人用户，每月可以读取1万条推文；而对初创企业层级，推特每月将收取5000美元，每月可以读取100万条推文；至于想要访问更多数据的开发者必须申请企业访问权限，据报道每月需要花费42000美元。