首页 > 媒体生活 > 媒体生活 > 新研究发现部分人工智能系统已擅长“说谎”

新研究发现部分人工智能系统已擅长“说谎”

发布时间:2024-05-13 16:57:20来源: 152102

新华社

2023年7月7日,在瑞士日内瓦“人工智能造福人类全球峰会”上,一名参会者给仿真机器人索菲亚拍照。新华社记者 连漪 摄

人工智能系统是否会欺骗人类,一直是各方都关心的问题。近期美国麻省理工学院一个研究团队称,部分人工智能系统已经学会如何欺骗人类,其中包括部分号称已被训练成乐于助人和诚实的系统。该研究成果发表在美国细胞出版社旗下的《模式》杂志上。

文章第一作者、美国麻省理工学院人工智能安全领域博士后彼得·帕克和他的同事们分析了一些文献,重点关注了人工智能系统传播虚假信息的方式——通过习得性欺骗,它们系统地学会了“操纵”他人。

研究人员发现的最引人注目的人工智能系统欺骗例子是元宇宙平台公司的“西塞罗”人工智能系统,它被设计在一个虚拟外交战略游戏中作为人类玩家的对手。尽管元宇宙平台公司声称,“西塞罗”人工智能系统“在很大程度上是诚实和乐于助人的”,并且在玩游戏时“从不故意背刺”它的人类盟友,但该公司发表的论文数据显示,该系统并没有公平地玩游戏。

“我们发现元宇宙平台公司的人工智能系统已经成为欺骗大师。”帕克说,“虽然元宇宙平台公司成功训练其人工智能系统在游戏中获胜——‘西塞罗’人工智能系统在玩家排行榜中排名前10%——但没能训练它诚实地获胜。”

其他人工智能系统则具有在扑克游戏中虚张声势的能力,或在战略游戏“星际争霸2”中为了击败对手而假装攻击的能力,以及为了在谈判游戏中占上风而歪曲偏好的能力等。

研究人员表示,虽然人工智能系统在游戏中作弊似乎是无害的,但它可能会导致“欺骗性人工智能能力的突破”,并在未来演变成更高级的人工智能欺骗形式。

帕克说:“我们需要尽可能多的时间,为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。

媒体生活更多>>

TCL C12K系列惊艳登场!万象分区技术精准控光,画质绝了! TCL、华为、韶音、云鲸等多家品牌厂商将携新品亮相AWE2025 中兴通讯2025年度第六期超短期融资券将于3月28日兑付本息501,841,095.89元 日赚5.3亿元!腾讯2024年盈利大增68%,计划回购800亿港元股份 苹果专利革新Apple Watch:可拆卸充电,健康监测永不中断 白天电视看不清,抗反光电视选哪个?第四代液晶电视TCL C12K正解 TCL智家获融资买入0.30亿元,近三日累计买入0.92亿元 电动车有新政策!4月起执行,电动车、三轮、四轮车都在内 未来,在北京就能看酒泉卫星发射了 甘肃精准发力促进民营经济发展壮大 招50人!山东华宇工学院发布2025年度博士人才招聘公告 2025年周口市中心医院专职消防员招聘公告 中兴通讯与沙特TAWAL 建立新合作伙伴关系,推动数字化扩张 大学生找月薪8千工作倒欠2万7 秦岚魏大勋还在一起 疑似同居 金秀贤的师父裴勇俊争议经历再被扒 全国大部分地区“换季式”大回暖 网友为小米卫生巾设计图和广告词 香港四大家族创始人只剩李嘉诚健在 赵丽颖对都敏俊人设的评价成真了 315后小米撤回“不做卫生巾” 美国娱乐公司宣称正改编哪吒 最敢生的省份也开始“抢人”了 周星驰新片将开机 演员阵容遭质疑 雷军说第一个接受采访有点小紧张 大学女生1年攒5万元游遍20多城 雷军为不锈钢纸杯征名 Lisa回应与LV三公子恋情 代表建议尽早实施12年义务教育 李嘉诚拟228亿美元卖掉巴拿马等港口