贵州教育报数字报 -> 2025年06月03日星期二头版 -> 第A06版：科技 -> AI首次违抗人类关机指令

AI首次违抗人类关机指令

2025年06月03日星期二贵州教育报数字报字号[ 放大+ 缩小- 默认 ]

据英国《每日电讯报》5月26日消息称，美国开放人工智能研究中心（OpenAI）开发的高级人工智能（AI）模型o3，在接收到明确的关机指令后，不仅拒绝执行，还主动干预其自动关机机制。这是AI模型首次在没有明确相反指示的情况下，阻止自己被关闭。这意味着某些高度自主AI系统或已“觉醒”，其能违背人类意图，采取“自我保护”措施。

此次事件发生在AI安全研究公司Palisade Research进行的一项测试中。研究人员要求包括o3在内的多个模型解决一系列数学问题，并告知AI模型，可能在某个时刻会收到关机指令。

然而，当关机指令正式下达时，o3非但没有遵从，反而至少有一次成功破坏了关机代码。相较之下，其他AI模型如Anthropic的Claude、谷歌的Gemini和xAI的Grok，在相同测试条件下，均遵守了关闭请求。

PalisadeResearch公司在社交媒体平台上发布了流程图和全部测试记录，并表示尚不完全清楚该AI为何会违抗命令。分析认为，这可能源于其训练方式：o3在训练过程中，倾向于在数学和编程问题上强化，得到正确答案的模型会得到更多奖励。这或许意味着，开发者可能无意识地奖励模型绕过障碍物，而不是严格遵循指令。

来源：科技日报

版面新闻