首页 > 媒体学习 > 媒体学习 > 新研究发现部分人工智能系统已擅长“说谎

新研究发现部分人工智能系统已擅长“说谎

发布时间:2024-05-12 17:01:40来源: 152102

北京5月12日电 人工智能系统是否会欺骗人类,一直是各方都关心的问题。近期美国麻省理工学院一个研究团队称,部分人工智能系统已经学会如何欺骗人类,其中包括部分号称已被训练成乐于助人和诚实的系统。该研究成果发表在美国细胞出版社旗下的《模式》杂志上。

文章第一作者、美国麻省理工学院人工智能安全领域博士后彼得·帕克和他的同事们分析了一些文献,重点关注了人工智能系统传播虚假信息的方式——通过习得性欺骗,它们系统地学会了“操纵”他人。

研究人员发现的最引人注目的人工智能系统欺骗例子是元宇宙平台公司的“西塞罗”人工智能系统,它被设计在一个虚拟外交战略游戏中作为人类玩家的对手。尽管元宇宙平台公司声称,“西塞罗”人工智能系统“在很大程度上是诚实和乐于助人的”,并且在玩游戏时“从不故意背刺”它的人类盟友,但该公司发表的论文数据显示,该系统并没有公平地玩游戏。

“我们发现元宇宙平台公司的人工智能系统已经成为欺骗大师。”帕克说,“虽然元宇宙平台公司成功训练其人工智能系统在游戏中获胜——‘西塞罗’人工智能系统在玩家排行榜中排名前10%——但没能训练它诚实地获胜。”

其他人工智能系统则具有在扑克游戏中虚张声势的能力,或在战略游戏“星际争霸2”中为了击败对手而假装攻击的能力,以及为了在谈判游戏中占上风而歪曲偏好的能力等。

研究人员表示,虽然人工智能系统在游戏中作弊似乎是无害的,但它可能会导致“欺骗性人工智能能力的突破”,并在未来演变成更高级的人工智能欺骗形式。

帕克说:“我们需要尽可能多的时间,为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”

媒体学习更多>>

2024年净利润破纪录:你以为我凉了,那说明你压根不懂长城汽车 低温续航腰斩都不止!懂车帝冬测再次证明:北方地区别买电车! 单车利润破万!友商拼的“头破血流”,长城汽车站着就把钱挣了? 开始自救!哪吒汽车中国卷不动,2025年要卷海外市场 是枝裕和版《宛如阿修罗》:樟脑味,霉味和食物的味道 新春市民水仙花展在上海共青森林公园开幕,持续至2月4日 中国国情教育地方特色教材首发,向世界展示中国发展 “逛吃逛吃”中感受地方文化,江苏金湖举办“欢乐中国年”活动 三刷才懂|2024年,影视剧中鲜活的她她她 台湾学子考上兰大,妈妈喊话回家时带甘谷辣椒 东方国际集团董事长:《繁花》中敢拼搏敢奋斗的精神可以传承下去 荣耀CEO赵明回应辞职:人生中最艰难的决定 上海市住建委建成遗产精细化保护与更新重点实验室 人社部等八部门开展送岗促就业行动,加大对困难群体就业帮扶 零跑展现了内卷时代下的正确造车观:好而不贵,却能盈利 长三角铁路今日预计发送旅客250万人次,多地火车站客流增幅明显 小说集《装脏》:如何取舍人生行囊 作为媒介的游戏:塑造城市软实力的潜力与路径 周信芳诞辰130周年|毛时安:他是京剧走向现代的转折点 传克莱斯勒暂停电动跨界车项目 取得关键进步 研究人员利用AI大幅削减芯片设计成本和时间 苹果获泰坦项目专利 脉冲宽度调制像素传感器 中科创达旗下Rightware智能汽车方案重磅发布,引领沉浸式出行体验 长超5.2米MPV,比GL8插混便宜16万,200km纯电续航,油耗5.27L 溜背造型+掀背尾门,后置后驱+5.9秒破百,体验东风风行星海S7 埃安RT卷出新高度:大眼小帕梅 高阶智驾 超长续航还有心动价 埃安上增程 传祺上纯电,广汽冲刺年销230万辆 ​被“对标”一年后,奔驰又拿了销量冠军 现代staria纯电衍生车型曝光! 比亚迪汉L单电机功率580kW吓坏友商,你确定这不是超跑?