推特刚刚结束了学术研究

小编:小编发布日期:2024-04-27浏览量:115

Twitter曾经是学术研究的中流砥柱——一种把握互联网脉搏的方式。但随着新主人埃隆·马斯克(Elon Musk)试图将这项服务货币化,研究人员正在努力取代这个曾经至关重要的工具。除非Twitter很快再次改变态度,否则它可能会结束整个研究时代的篇章。

“使用社交媒体数据的研究,主要是twitter学,”里贾纳大学(University of Regina)行为科学副教授戈登·彭尼库克(Gordon Pennycook)说。“这是人们使用的主要来源,”

“主要是推特学。”

在马斯克收购之前,Twitter的API——允许第三方开发者收集数据——被认为是互联网上最好的API之一。它使学习可以从网上到任何地方。他们解决的问题只会变得越来越糟,这使得这类研究与以往一样重要。但Twitter将在2月份停止对其API的免费访问,并在3月份停止付费访问。这家公司正在“寻找新的方式继续为学术界服务”,但却开始毫不客气地切断对不付费的第三方用户的访问。虽然包括公共交通机构和紧急救援人员在内的公共交通机构被切断,但学术界是受影响最严重的群体之一。

多年来一直依赖Twitter的研究人员告诉The Verge,他们不得不停止使用Twitter。使用它的API太贵了,据报道,一个企业账户的费用已经飙升到每月4.2万美元甚至更多。因此,科学家们失去了研究人类行为的一个关键优势。虽然他们正在争先恐后地寻找新的来源,但目前还没有明确的替代方案。

推特为研究人员提供了一种观察人们真实反应的方法,而不必问研究参与者他们认为自己在某些情况下可能会有什么反应。这对Pennycook的策略至关重要,以防止错误信息在网上煽动,例如,通过向人们展示要求他们在分享链接之前考虑准确性的内容。

像Pennycook这样的研究人员无法看到一个人实际上发了什么推文,他们可能仅限于在调查中询问人们他们会在社交媒体上分享什么样的内容。“这基本上是假设,”彭尼库克说。“对于那些真正能够实施其中一种干预措施的科技公司来说,他们不会对此印象深刻……我们必须在某个地方做实验,以证明它实际上可以在野外工作。”

今年4月,一群名为“独立技术研究联盟”(Coalition for Independent Technology Research)的学者、记者和其他研究人员向Twitter发了一封邮件,要求它帮助他们保持访问权限。该联盟对研究人员进行了调查,发现Twitter的新限制危及了250多个不同的项目。信中说,这也标志着至少76项“长期努力”的结束,包括代码包和工具。由于Twitter新政策的执行有些随意(一些用户在其他人之前被踢出了平台),该联盟建立了一个互助努力。科学家们争先恐后地在丢失自己的访问密钥之前尽可能多地收集数据,其他人则主动提出帮助他们收集数据,或者将自己访问Twitter API的权限捐赠给丢失数据的研究人员。

Twitter最实惠的API层,每月100美元,只允许第三方每月收集1万美元。信中说,这只是他们之前一天免费阅读的0.3%。联盟认为,即使是其“极其昂贵”的企业级别,也不足以进行一些雄心勃勃的研究或维护重要的工具。

其中一个工具是Botometer,它是一个评估Twitter账户是机器人的可能性的系统。尽管马斯克对虚假信息研究等表示怀疑,但他实际上是在公开估计,在他试图退出收购Twitter的交易期间,该平台上有多少机器人。现在,他对API访问收费的举动可能会导致Botometer的灭亡。

Botometer网站上的一则通知称,该工具可能很快就会停止工作。该公司表示:“我们正在积极寻求解决方案,以保持这个网站的活力,并为我们的用户免费提供服务,这将涉及培训一种新的机器学习模型,并与Twitter的新付费API计划合作。”“请注意,即使建立一个新版本的Botometer网站是可行的,由于Twitter受限制的API,与当前版本相比,它的功能和配额也将有限。”

即将到来的关闭对Botometer的联合创始人杨凯成(Kai-Cheng Yang)个人来说是一个打击,他是一名研究社交媒体上的错误信息和机器人的研究员,最近在印第安纳大学布卢明顿分校获得了信息学博士学位。“我的整个博士学位,我的整个职业生涯,现在基本上都是基于Twitter的数据。很可能未来它将不再可用,”杨告诉the Verge。当被问及如何以不同的方式处理工作时,他说:“我一直在问自己这个问题。”

“这个平台从地球上最透明、最容易进入的平台之一,变成了真正的最底层。”

其他研究人员也同样感到困惑。信的签名者、乔治华盛顿大学数据、民主和政治研究所(IDDP)主任丽贝卡·特朗布尔说:“这个平台从地球上最透明、最容易访问的平台之一,沦落到真正的最底层。”特朗普之前的一些研究工作,比如研究Twitter上的政治对话,实际上是在Twitter改变其API政策之前由该公司资助的。

“Twitter的API对我多年来一直在做的研究至关重要,”特朗普告诉the Verge。和杨一样,她也必须根据该平台的新定价方案做出调整。“我现在根本没有在研究Twitter,”她说。

但从社交媒体上收集大量数据的其他选择并不多。虽然在不使用API的情况下从网站上抓取数据是一种选择,但这是一项更繁琐的工作,并且可能充满其他风险。推特和其他平台一直在努力减少信息抓取,部分原因是很难辨别这种行为是出于公共利益还是出于网络钓鱼等恶意目的。

与此同时,其他社交媒体巨头在API访问方面的限制甚至比Twitter还要严格,因此很难转向其他平台。而且限制似乎越来越严格——上个月,Reddit同样宣布将对其API进行限制。

麻省理工学院(MIT)和里贾纳大学(University of Regina)的博士后研究员豪斯·林(Hause Lin)说:“我只是想知道,这是不是企业越来越不愿意拥有数据共享API的开始。”他正在研究阻止仇恨言论和错误信息在网上传播的方法。林告诉the Verge:“似乎整个行业都在发生变化,所以我们不知道它现在的发展方向。”

有迹象表明,情况可能会变得更糟。上周,Twitter告诉一些研究人员,他们需要删除已经通过其decahose收集到的数据,decahose提供平台上所有内容的10%的随机样本,除非他们支付每月高达4.2万美元的企业账户。据报道,一位未透露姓名的收到通知的学者表示,此举相当于“烧书的大数据”。

The Verge网站无法向Twitter证实这一消息,后者现在经常用大便表情符号回应记者的询问。Verge采访的研究人员都没有收到这样的通知,而且到目前为止,似乎仅限于以前付费使用decahose的用户(只有一次使用Twitter的API,而以前对学术界来说是免费或低成本的)。

特朗普和杨过去都曾在工作中使用过decahose。特朗布尔说:“Twitter从来没有回过头来对研究人员说,现在合同已经结束,你必须放弃所有的数据。“这完全是一种嘲弄。它将摧毁一堆非常重要的正在进行的研究项目。”

“我们将无法像以前那样了解这个世界。”

其他学者也同样告诉The Verge网站,据报道,Twitter要求研究人员在没有企业订阅的情况下“删除存储和缓存在你系统中的所有Twitter数据”,这将是毁灭性的。如果学生们在发表他们的研究结果之前被迫删除数据,这可能会阻碍他们完成他们投入多年的工作。即使他们已经发表了他们的研究成果,获得原始数据也可以让其他研究人员通过能够复制研究来测试研究的强度。

杨说:“这对透明的科学来说非常重要。”“这只是个人偏好——我可能会反对推特的政策,但仍然会分享数据,让它可用,因为我认为在这种情况下科学更重要。”

Twitter是进行数字现场实验的好地方,部分原因是它鼓励来自不同背景的人在一个地方见面。这与Facebook或Mastodon不同,后者的社交圈之间往往存在更多摩擦。这种集中化有时会引发冲突——但对学者来说,这是有价值的。

彭尼库克说:“如果研究不像以前那么好,我们就不能像以前那样了解世界。”“所以也许我们会找到一种方法来弥合这一差距,但我们还没有找到。”

文章链接:https://www.480520.com/news/show/106612/
文章来源:https://www.480520.com/    
 
 
更多>同类资讯