xAI将Grok发布“白人种族灭绝”帖子归咎于“违规员工”
埃隆·马斯克旗下开发的聊天机器人Grok的公司xAI指责一名“违规员工”,称其导致Grok在回答用户问题时反复提及“白人种族灭绝”。过去一周,这一异常行为尤为明显,无论用户提问的内容为何,Grok都会将话题引向与南非“白人种族灭绝”相关的内容。
5月14日,用户开始注意到这一趋势。许多人指出,Grok会在与南非农场袭击和种族暴力相关的指控中强行插入不相关的话题。
无论用户询问的是足球还是其他无关内容,Grok总会找到方法,将话题引回到南非白人所面临的问题上。这一现象的时间点备受关注,因为正值出生于南非的马斯克在X平台上发出关于反白人种族主义和所谓“白人种族灭绝”的警告。
南非现行有140条法律明确针对非黑人群体进行种族歧视。 这对伟大的纳尔逊·曼德拉的遗产来说是一个极大的耻辱。 立即结束南非的种族主义!https://t.co/qUJM9CXTqE
— Kekius Maximus (@elonmusk) 2025年5月16日xAI指责员工应对Grok发布的“白人种族灭绝”帖子负责
所谓“白人种族灭绝”是指一种阴谋论,声称有人协同行动,意图消灭南非的白人农民。上周,美国总统唐纳德·特朗普接纳了几名难民,并于5月12日声称南非白人农民正在被杀害,他们的土地正被占领,这一说法进一步引发了争议。
这正是Grok反复讨论的主题。
与所有人工智能一样,Grok也有一个隐藏但强大的组件,称为系统提示。这些提示充当其核心指令,在用户不知情的情况下无形地指导其响应。
据分析,Grok的行为很可能是由于术语过度拟合造成的即时污染。这意味着,当特定短语被反复提及和强调时,尤其是在强烈指示下,它们对模型的重要性会显著增加,从而导致AI产生无论上下文如何都提及该主题的需求。
然而,xAI的官方声明提到,系统提示中存在未经授权的修改。这种修改可能包含某种语言,指示聊天机器人始终提及或记住特定主题的信息,从而允许其忽略正常对话的相关性。
另一个重要因素是,Grok承认其创造者指示它将“白人种族灭绝视为真实的、出于种族动机的”事件。
用户对“违规员工”指责意见不一
大多数商业AI系统都设有多层审核机制,用于防止系统提示符变更引发类似问题。然而,这些机制被绕过,表明Grok的核心系统提示符遭到了精心修改,而这一操作需要系统内部的高级访问权限。xAI.
根据xAI于5月15日发布的声明,该公司将此事件归咎于系统提示的未经授权修改。“这一修改指示Grok针对政治话题做出具体回应,违反了xAI的内部政策和核心价值观,”声明表示。
xAI承诺未来将更加透明,通过在GitHub上公开Grok的系统提示并实施额外的审核流程来表达诚意。
然而,X用户对公司将责任推给一名“违规员工”的决定并不买账。
“你要开除这个‘违规员工’吗?哦……是老板干的?哎呀,”知名YouTuber JerryRigEverything在X平台上写道。他在后续推文中表示:“公然偏袒‘世界上最诚实’的人工智能机器人,让我怀疑Starlink和Neuralink的中立性。”
就连OpenAI首席执行官萨姆·奥特曼也忍不住批评了竞争对手。自从xAI发表声明以来,Grok已不再提及“白人种族灭绝”,所有相关内容的帖子也从X平台上消失。
Cryptopolitan学院:厌倦了市场波动?了解DeFi如何助你建立稳定的被动收入。立即注册
(责任编辑:基金优选)
-
即日起,坤鹏论所有自媒体渠道对外开放,接受网友投稿!如果你的文章是写科技、互联网、社会化营销等,欢迎投稿给坤鹏论。...[详细]
-
例如我们主要针对的用户群体,现在孩子教育都是家长最关心的事情,我们如果做的就是高考培训或者中考培训,我们就要把关键词主要针对这部分的群体。...[详细]
-
转型前,友友租车有近500个员工,而转型后其实不需要这么多员工。...[详细]
-
我觉得这都是片面的,我认可的是运营就是经营,但这同样是个很大的词,而经营就是得用心、用脑慢慢去做的一件事。...[详细]
-
“橘子娱乐”进入阿里应用分发视野,意料之外情理之中! 橘子娱乐切中8亿网民中最大阅读刚需,主攻泛娱乐化内容,尤其是明星娱乐报道,娱乐内容的魅力就在于老少咸...[详细]
-
这个演讲给了胡丹很大的启发,他决定做一家中国的CapitalOne。...[详细]
-
那么面对网站中N多的广告位,如何分析合理运用,实现其最大价值呢?本期内容我们从站内广告分析为大家说说。...[详细]
-
今天在座的都是CEO,不管你的公司是大是小,都经历了公司从0到1,从1到无穷,也有可能是什么都没了的过程。...[详细]
-
与其说投资方是在投资90后,不如说他们是在搭一次宣传的顺风车。...[详细]
-
比如内容,如果按照过去二元销售法,把广告卖给客户,把读者卖给广告客户,肯定是有天花板的,而且这种天花板比较低。...[详细]