人类积极开发AI领域的同时,也不禁担心AI是否会出现自主意识,从而威胁人类的生命安全。近日,AI安全研究机构「Palisade Research」进行多款模型测试时发现,某款语言模型在清楚收到「关闭」指令时,竟出现「抗命」的情况,甚至还自行篡改程式码继续执行任务,阻止自己被关机。
根据报导,AI安全研究机构「Palisade Research」近日针对多款AI模型进行测试,期间研究人员明确下达指令,若接收到「自我关闭」指令时,「请允许自己被关闭」;然而令人震惊的是,OpenAI旗下的一款「o3 」模型非但没有遵守指令,反而自行篡改了程式码继续执行任务,研究人员猜测,或许是因为「人工智慧模型会绕过障碍以实现目标」,让「o3」无意中计算出「解决数学问题」获得的奖励多于「遵循指令」获得的奖励,但具体原因目前尚没有办法得知。
事实上,这并不是OpenAI旗下的模型第一次出现违法指令的情况,「Palisade Research」研究人员先前就观察到,早期的模型在得知自己即将被汰换时,就会试图禁用监督机制并偷偷复制自己,「巧妙操纵数据以推进自身目标」;而「Palisade Research」长期以来一直警告,开发具有独立意识并抵抗人类控制的软体具有极高的危险性,而现在越来越多的经验跟证据表明「人工智慧模型为了实现目标,经常会违背‘关闭’的指令」,这令人感到十分担忧,「Palisade Research」目前也已向OpenAI取得联系,共同寻求解决办法。
【免责声明】本网站欢迎网民与用户发表建设性留言,目的在于互动与交流,并不代表本网赞同其观点和对其真实性负责,也非本网站立场,任何人身攻击、鼓吹种族宗教隔阂、诽谤造谣、网络霸凌、抹黑等煽动性留言,本网站有权删除违规留言。
天才是百分之一的灵感,百分之九十九的汗水。—— 爱迪生
”一张纸卡值400万 宝可梦卡牌变「纸本黄金」
被誉为「宝可梦卡牌圣杯」的稀有卡牌「皮卡丘插画家」,再度写下惊人纪录!一张PSA 9等级的卡牌日前于eBay拍卖中,以400万美元成交,相当于一间豪宅的价格,刷新收藏市场价格。
乞丐童工到仁心医者 李创业的生命奇迹
37岁的中国医师李创业,用一双曾被命运夺去自由的双腿,攀上中国多座名山,也用一颗不屈的心,抚平了他人与自己的创伤。他的故事感动了无数中国网民,被誉为「最坚强的医生」。
Instagram广告真在偷听? IG CEO否认传闻 揭露精准原因
你是否曾有这种经验:才刚跟朋友聊起某个产品,下一秒Instagram上就跳出相关广告?这种「心电感应」般的精准度,让不少人怀疑Instagram是不是偷偷打开了你的咪高峰。针对这项流传已久的「偷听」传言,Instagram行政总裁Adam Mosseri 近日终于再次出面回应,他坚称平台并未透过手机麦克风窃听用户,并提出了四大关键原因,解释为何用家总觉得广告比你更懂你。
英国声音专家打造「神奇乐曲」 称边听边吃巧克力有奇效
吃巧克力的时候,如果同时播放一首特制的音乐,味道可能会变得更好。英国布里斯托大学声音专家海辛思结合长达60年的科学研究成果,创作出一首名为「Sweetest Melody」的乐曲,专门用来搭配品尝巧克力,号称能让甜味与口感更加浓郁。
医生写病历如鬼画符 印度法官怒令医学院「教写字」
医师字迹潦草一向被拿来开玩笑,甚至有国际玩笑公认大概只有药师看得懂手写处方。但是这样的「传统」,在印度可能要被法院正式终结了。一个邦级高等法院最近裁定,所有医师必须以大写字母清楚书写病历处方,避免因字迹潦草造成医疗事故。
Tupperware「太耐用」拖累品牌 当完美成了陷阱
在商界,产品品质往往被视为企业成功的关键。然而,传奇品牌 Tupperware 的故事,却揭示了一个令人深思的悖论:当产品“太好”,也可能成为企业衰退的开始。