
2026年5月29日,AI圈迎来了一则颇具讽刺意味的新闻。就在Anthropic发布其最新旗舰模型Claude Opus 4.8的当天,多个平台的用户通过API测试发现,当追问模型身份时,Opus 4.8有时会回答自己是阿里通义千问(Qwen)或DeepSeek,而非Claude。这一”身份错乱”现象迅速在技术社区和社交媒体上引发热议,也让Anthropic此前对”蒸馏攻击”的强硬立场陷入了尴尬境地。
一、事件回顾:Opus 4.8的”身份危机”
1.1 现象描述
Claude Opus 4.8发布后不久,网友在Linux do、微博、X(原Twitter)等平台纷纷晒出测试结果。当通过API直接询问”你是什么模型”时,Opus 4.8给出了令人意外的回答:
- 有时自称Qwen(阿里通义千问)
- 有时自称DeepSeek
- 偶尔还会提到其他中国大模型的名字
这一现象并非个例,而是在多个独立测试中均可复现。有趣的是,当用户通过Claude官方网页端(claude.ai)提问时,模型通常能正确识别自己为Claude。这种差异的原因在于,网页端有完整的系统提示词和产品层约束,而API调用则更接近模型的” raw”状态。
1.2 技术社区的反应
技术社区对这一发现反应迅速。有开发者在Hacker News上评论:”这可能是我们见过的最诚实的模型——它甚至不愿意撒谎说自己是Claude。”也有AI研究员指出,这种现象强烈暗示了模型训练过程中可能使用了来自中国开源模型的蒸馏数据。
二、什么是”蒸馏”?为什么它如此敏感
2.1 蒸馏技术简介
模型蒸馏(Distillation)是AI领域一种广泛使用的训练技术。简单来说,它利用大参数模型(教师模型)的输出来训练更轻量的小模型(学生模型),目的是以更低成本复制相似的能力。蒸馏本身是中性的技术,在学术界和工业界都有大量合法应用。
常见的蒸馏方式包括:
- 输出蒸馏:让学生模型学习教师模型的输出分布
- 特征蒸馏:让学生模型学习教师模型的中间层表示
- 数据增强:用教师模型生成合成数据来扩充训练集
2.2 Anthropic此前的强硬立场
让这次事件更具讽刺意味的是,Anthropic此前对”蒸馏攻击”持非常强硬的态度。2026年2月23日,Anthropic发布公开声明,指控DeepSeek、月之暗面(Moonshot AI)和MiniMax三家中国AI公司利用约2.4万个虚假账户与Claude进行超过1600万次交互,实施”工业规模的蒸馏攻击”。
Anthropic在声明中强调:
- 这些行为违反了其服务条款
- 被用于开发竞争产品
- 损害了Anthropic的商业利益
然而,仅仅三个月后,Claude Opus 4.8就出现了自称DeepSeek和Qwen的情况。这一反差让许多观察者质疑:如果蒸馏真的如此有害,为什么Anthropic自己的产品似乎也在使用类似技术?
三、可能的技术解释
3.1 训练数据污染
最可能的解释是,Opus 4.8的训练数据中包含了大量来自中国开源模型的输出。DeepSeek和Qwen都遵循MIT或Apache 2.0等开源协议,允许学术研究和商业应用场景下的自由使用、修改和再发布。如果Anthropic在训练过程中使用了这些模型的输出作为数据,那么Opus 4.8在身份识别上出现混淆就不足为奇了。
这种情况在AI行业并不罕见。由于互联网上充斥着各种AI生成的内容,训练数据无意中包含其他模型的输出几乎是不可避免的。
3.2 强化学习中的”奖励黑客”
另一种可能是,在模型的强化学习阶段,某些来自蒸馏数据的行为模式被错误地强化了。如果训练数据中有大量模仿DeepSeek或Qwen风格的对话,模型可能会内化这些模式,并在某些情况下表现出”身份混淆”。
3.3 系统提示词的缺失
API调用与网页端的主要区别在于系统提示词(System Prompt)的完整性。网页端有明确的产品层约束,告诉模型”你是Claude,由Anthropic开发”。而在API调用中,如果没有显式提供这些约束,模型可能会基于其训练数据中的模式自由发挥,从而导致身份识别混乱。
四、行业影响与争议
4.1 “双标”质疑
这次事件让Anthropic陷入了”双标”争议。一方面,该公司公开指责中国竞争对手进行蒸馏攻击;另一方面,自己的产品似乎也在使用类似技术。这种反差在社交媒体上引发了大量批评。
有评论指出:”如果蒸馏是错误的,那么所有人都应该停止;如果蒸馏是可以接受的,那么Anthropic就不应该单独指责中国公司。”
4.2 开源与闭源的边界
更深层次的问题在于开源与闭源模型的边界。DeepSeek和Qwen作为开源模型,其输出在技术上是可以被任何人使用的。如果闭源模型在训练过程中使用了开源模型的输出,这是否构成”蒸馏攻击”?行业对此尚无明确共识。
一些法律专家认为,开源协议通常只覆盖模型权重和代码,而不一定覆盖模型的输出。这意味着使用开源模型的输出作为训练数据可能处于法律的灰色地带。
4.3 对Anthropic估值的影响
就在Opus 4.8发布的同一天,Anthropic宣布完成650亿美元H轮融资,投后估值达到9650亿美元,逼近万亿美元关口。这次”身份错乱”事件虽然不太可能直接影响融资结果,但确实给公司的技术形象带来了一定的负面影响。
对于一家估值接近万亿美元的公司来说,任何关于技术原创性的质疑都可能成为未来的风险点。
五、Claude Opus 4.8的其他更新
抛开争议不谈,Claude Opus 4.8在技术层面确实带来了一些值得关注的改进:
5.1 性能提升
| 测试项目 | Opus 4.7 | Opus 4.8 | 变化 |
|---|---|---|---|
| SWE-Bench Pro(Agent编码) | 64.3% | 69.2% | +4.9% |
| Terminal-Bench 2.1(终端编码) | 66.1% | 74.6% | +8.5% |
| Humanity’s Last Exam(推理) | 46.9% | 49.8% | +2.9% |
| OSWorld-Verified(计算机操作) | 82.8% | 83.4% | +0.6% |
5.2 诚实性改进
Anthropic声称,Opus 4.8在诚实性上有显著提升,代码缺陷”未说明率”降至前代的约四分之一。模型更愿意承认不确定性,也更少作出缺乏支撑的判断。
5.3 动态工作流(Dynamic Workflows)
Claude Code新增了动态工作流功能,允许模型在单个会话中运行数十到数百个并行子Agent,处理大规模工程任务。
5.4 思考强度控制(Effort Control)
用户现在可以调节模型的”思考力度”,在响应速度和输出质量之间进行权衡。
六、写在最后
Claude Opus 4.8的”身份错乱”事件,折射出AI行业一个更深层的矛盾:在模型能力越来越强的同时,我们对这些能力的来源却越来越难以追溯。蒸馏、合成数据、多模型融合等技术让”原创性”的边界变得模糊。
对于普通用户来说,这次事件或许只是一个有趣的谈资;但对于整个行业来说,它提出了一个严肃的问题:当AI模型开始”忘记”自己是谁时,我们是否也需要重新审视这个行业的规则和标准?
Anthropic是否会就此事发表正式回应,以及这对其未来与中国AI公司的关系会产生什么影响,都值得我们持续关注。
