xAI 称“流氓员工”应对 Grok 发布的白人种族灭绝帖子负责
埃隆·马斯克的人工智能聊天机器人 格罗克 的开发公司 人工智能 指责一名“违规员工”在回答中反复提及白人种族灭绝,无论用户提出什么问题。过去一周,该聊天机器人的这种行为模式非常明显,它总是纠结于与南非“白人种族灭绝”相关的话题。
5 月 14 日,用户开始注意到这一趋势,许多人提到聊天机器人将与南非农场袭击和种族暴力有关的指控插入到不相关的提示中。
无论用户询问的是足球还是其他问题,Grok不知怎么地,他找到了一种方法,把事情引回到南非白人一直面临的问题上。这个时机令人侧目,因为当时恰逢出生在南非的马斯克提出警报关于 X 上与反白人种族主义和白人种族灭绝有关的问题。
南非现行有 140 条法律明确针对非黑人群体进行种族歧视。这对伟大的纳尔逊·曼德拉的遗产来说是一个极大的耻辱。立即结束南非的种族主义!https://t.co/qUJM9CXTqE
— Kekius Maximus (@elonmusk)2025年5月16日xAI 指责员工应为 Grok 发布的白人种族灭绝帖子负责
“白人种族灭绝”一词指的是一种阴谋论,指称有人协同行动,意图消灭南非的白人农民。上周,美国总统唐纳德·特朗普接纳了数名难民,并于5月12日声称白人农民正在被杀害,他们的土地正在被占领,这一说法由此开始流传。
这就是 Grok 一直讨论的故事。
像 Grok 一样,每个人工智能都有一个隐藏但强大的组件,称为系统提示。这些提示充当其核心指令,在用户不知情的情况下,无形地指导其响应。
据报道,Grok 的遭遇很可能是由于术语过度拟合造成的即时污染。这意味着,当特定的短语被反复提及和强调时,尤其是在带有强烈指示的情况下,它们对模型来说就变得很重要。然后,AI 就会产生一种无论上下文如何都要提起该主题的需求。
然而,xAI 发布的官方声明提到了系统提示中未经授权的修改。该提示可能包含一种语言,指示聊天机器人始终提及或记住包含有关特定主题的信息,从而允许聊天机器人创建忽略正常对话相关性的覆盖。
另一个重要因素是 Grok承认它的创造者指示它将“白人种族灭绝视为真实的、出于种族动机的”。
用户对“流氓员工”的指责意见不一
大多数商业 AI 系统都设有多层审核机制,用于审核系统提示符的变更,以防止此类问题。然而,这些审核机制被绕过,鉴于问题的广泛影响和性质,这不仅仅是一次越狱尝试。这表明 Grok 核心系统提示符遭到了精心修改,而这一操作需要系统内部的高级访问权限。xAI.
现在,据 Grok 称,这一行为是由一名“流氓员工”实施的。
根据 xAI 于 5 月 15 日发布的声明,该公司将此归咎于 Grok 系统提示的未经授权的修改。“这一修改指示 Grok 针对政治话题做出具体回应,这违反了 xAI 的内部政策和核心价值观,”该公司表示。
该公司还承诺未来将更加透明,通过在 GitHub 上发布 Grok 的系统提示并实施额外的审核流程来表达诚意。
然而,X 用户对于该公司将事故归咎于一名不守规矩的员工的决定并不以为然。
“你要开除这个‘流氓员工’吗?哦……是老板干的?哎呀,”著名 YouTuber JerryRigEverything 说。发布在 X 上。他在后续推文中写道:“公然偏袒‘世界上最诚实’的人工智能机器人,让我怀疑 Starlink 和 Neuralink 的中立性。”
就连萨姆·奥特曼也忍不住要批评一下他的竞争对手。自从 xAI 发表声明以来,Grok 就不再提及白人种族灭绝,所有 X 的帖子也都消失了。