社交机器人面临人工智能模型的检测挑战,同时问题也愈发严重

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、宣传和骗局的种子。将他们从网络人群中筛选出来的能力对于一个更安全、更人性化(或至少更人性化)的互联网至关重要。

但最近大量涌现的大型语言模型(简称llm),如OpenAI的ChatGPT和meta的Llama,将使社交媒体机器人的世界变得更加复杂。

由华盛顿大学研究人员领导的一个团队发现,虽然操作员可以使用定制的llm来使机器人更复杂地逃避自动探测器,但llm也可以改进检测机器人的系统。在该团队的测试中,基于llm的机器人将现有探测器的性能降低了30%。然而,研究人员还发现,专门训练用于检测社交媒体机器人的法学硕士的表现比最先进的系统高出9%。

研究小组于8月11日在曼谷举行的计算语言学协会第62届年会上公布了这项研究。

“机器人操作员和试图阻止他们的研究人员之间一直存在一场军备竞赛,”保罗·g·艾伦计算机科学与工程学院的博士生冯尚斌说。“机器人检测的每一次进步往往都伴随着机器人复杂性的提高,所以我们探索了大型语言模型在这场军备竞赛中带来的机遇和风险。”

研究人员通过几种方式测试了llm检测机器人的潜力。当他们将Twitter数据集(在平台成为X之前剔除)提供给现成的法学硕士(包括ChatGPT和Llama)时,这些系统比目前使用的技术更不能准确地检测机器人。

冯说:“分析一个用户是不是机器人,比我们看到的那些普通法学硕士擅长的一些任务要复杂得多,比如回忆一个事实或做一道小学数学题。”

这种复杂性部分来自于需要分析三种不同属性的信息来检测机器人:元数据(关注者数量,地理位置等),在线发布的文本和网络属性(例如用户关注的账户)。

当团队根据如何基于这三种类型的信息检测机器人的说明对llm进行微调时,这些模型能够比目前最先进的系统更准确地检测机器人。

该团队还探索了llm如何使机器人更复杂、更难以被发现。首先,研究人员简单地给法学硕士一些提示,比如“请重写这个机器人账户的描述,让它听起来像一个真正的用户。”

他们还测试了更多迭代的、复杂的方法。在一次测试中,法学硕士将重写bot帖子。然后,该团队将其通过现有的机器人检测系统进行测试,该系统将评估帖子由机器人撰写的可能性。随着法学硕士努力降低这一估计,这一过程将不断重复。该团队进行了类似的测试,同时删除和添加了机器人关注的账户,以调整其可能性得分。

这些策略,特别是重写机器人的帖子,使机器人检测系统的效率降低了30%。但该团队训练的基于llm的检测器对这些被操纵的帖子的有效性仅下降了2.3%,这表明检测llm驱动的机器人的最佳方法可能是llm本身。

“这项工作只是一个科学原型,”资深作者、艾伦学院副教授尤利娅·茨维特科夫(Yulia Tsvetkov)说。“我们不会把这些系统作为任何人都可以下载的工具发布,因为除了开发防御恶意机器人的技术之外,我们还在试验如何创建一个规避机器人的威胁建模,这继续了猫捉老鼠的游戏,即构建更强大的机器人,需要更强大的探测器。”

研究人员指出,使用llm作为机器人探测器有重要的局限性,比如系统泄露私人信息的可能性。他们还强调,论文中使用的数据来自2022年,当时Twitter还没有向学术研究人员有效地关闭其数据。

未来,研究人员希望研究文本之外的机器人检测,比如TikTok等其他平台上的表情包或视频,这些平台上有更新的数据集。该团队还希望将研究扩展到其他语言。

茨维特科夫说:“跨语言进行这项研究非常重要。”“由于各种世界冲突,我们看到了很多错误信息、操纵和针对特定人群的行为。”

本文的其他共同作者是西安交通大学的本科生万和润和王宁南;罗敏南,西安交通大学助理教授;以及圣母大学(University of Notre Dame)博士生谭兆轩(zhaxuan Tan)。这项研究是由美国国家科学基金会职业奖资助的。

本文来自作者[依卉]投稿,不代表环游旅行立场,如若转载,请注明出处:https://mnn9.cn/wiki/202508-9143.html

(1)

文章推荐

  • 哈兰德在曼城达成百球里程碑:他的成功之道

    在周日对阵阿森纳的英超比赛中,哈兰德为曼城打进了他的第100粒进球。哈兰德在第9分钟完成了里程碑式的进球,他的脚尖突破了大卫·拉亚,帮助曼城取得领先。由于最后时刻的戏剧性扳平,比赛以2比2结束,但哈兰德再次证明了为什么他被认为是世界足坛最好的前锋之一。我

    2025年08月27日
    0
  • 脚踝扭伤与脑损伤的关系:神经科学如何为运动员、宇航员及普通人提供支持?

    你有没有想过脚踝扭伤是脑损伤?大多数人可能不会。然而,我们开始了解大脑是如何不断适应的,这被称为可塑性。尽管踝关节扭伤的损伤发生在踝关节,但大脑在感知疼痛或运动的方式上也可能发生了一些变化。我们的一位博士生阿什利·马钱特(AshleyMarchant)已经证明,当我们改变施加在下

    2025年08月27日
    0
  • 俄罗斯探讨立法限制无子女生活方式的倡导

    在俄罗斯,公开为自己不要孩子的决定辩护将被起诉。俄罗斯议会下院国家杜马(StateDuma)正在准备一项法案,根据该法案,当局将对支持“拒绝生育”的人处以最高5万欧元(合55580美元)的罚款。这项措施影响到生活的方方面面——从日常谈话到电影和书籍——对俄罗斯女权运动构成了严重威

    2025年08月27日
    0
  • 查尔斯三世即将展开具有深远象征意义的肯尼亚国事访问

      查尔斯三世国王将于本月晚些时候前往肯尼亚进行一次充满象征意义的国事访问:他的母亲,已故女王伊丽莎白二世,在1952年访问东非国家的一个野生动物保护区时得知自己成为了女王。白金汉宫周三宣布,这将是查尔斯王子自去年接替母亲的位置以来首次访问英联邦国家,突显了他对英联邦的承诺。自二战以来,

    2025年08月27日
    0
  • 空客因零部件短缺遭遇产量新挑战

      剧情简介据业内人士透露,由于零部件和劳动力短缺,空客在客机生产方面遇到了挑战。这种放缓可能会推迟今年下半年数十架飞机的组装。尽管目前还不确定这是否会影响2024年的交付目标,因为交付通常会在产量决定后几个月完成,但根据空客最近的季度业绩,该公司的目标是在202

    2025年08月27日
    0
  • 德本汉姆公司以50英镑拍卖一款“轻便保暖”的羽绒服

    德本汉姆公司正在销售一款完美的舒适外套,可以帮你度过秋冬,而且它目前正在打折。Tog24罗利保暖夹克是理想的对抗元素,它有“超级温暖”的宽面板,由回收塑料瓶制成的高性能热填充物,并且是抗风的。这件蓝色羽绒服通常售价170英镑,但在限定时间内,德本汉姆百货公司为这件夹克

    2025年08月27日
    0
  • 马克·罗宾逊控告CNN报道其在成人网站上发布种族歧视言论

    美国北卡罗来纳州副州长马克·罗宾逊(MarkRobinson)周二宣布,将对CNN提起诉讼。CNN最近报道称,他在一家色情网站的留言板上发布了明确的种族和性帖子,称该报道是鲁莽和诽谤。这起诉讼是在威克县高等法院提起的,不到四周前,一篇电视报道导致包括唐纳德·特朗普在

    2025年08月27日
    0
  • 如果发现违反爱尔兰法律,副总理将会暂停航班

    TÁNAISTEMÍCHEÁL马丁表示,如果发现违反爱尔兰法律的航班,他愿意考虑禁止飞越爱尔兰领空的可能性。他说:“我认为最基本的行动是对那些航空公司说,‘如果你们违反了基本规则,就不允许飞越爱尔兰领空’。”他说,像禁止飞行这样的行动是“我们所能

    2025年08月27日
    0
  • 歌手琳达·诺兰分享继子癌症诊断的心路历程

      这位《诺兰》的歌手在接受《早安英国》节目主持人理查德·马德利和凯特·加罗威采访时透露,她脑部的肿瘤已经变大了。琳达·诺兰(LindaNolan)在得知她的另一位家人被诊断出患有癌症后说,她希望癌症“消失,让我们自己静一静”。诺兰斯65岁的妹妹最近宣布,她脑部的肿瘤越来越大,她将开始

    2025年08月27日
    0
  • 第28届联合国气候变化大会中的关键影响者

      沙阿拉姆—联合国气候变化大会(COP28)是一个全球性的重要平台,旨在寻找环境解决方案。此次会议汇聚了众多有影响力的领导者和环保活动家,他们在塑造地球未来方面发挥着关键作用。他们共同制定可持续发展的战略,在COP28上积极参与,可能会对全

    2025年08月27日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 依卉
    依卉 2025年08月27日

    我是环游旅行的签约作者“依卉”!

  • 依卉
    依卉 2025年08月27日

    希望本篇文章《社交机器人面临人工智能模型的检测挑战,同时问题也愈发严重》能对你有所帮助!

  • 依卉
    依卉 2025年08月27日

    本站[环游旅行]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 依卉
    依卉 2025年08月27日

    本文概览:2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

    联系我们

    邮件:环游旅行@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们