🚨 重磅泄露:Anthropic
🚨 重磅泄露:Anthropic 下一代模型 Claude Mythos 意外曝光
代号 "Capybara",能力远超 Claude Opus 4.6——但它太危险,Anthropic 自己也在犹豫是否发布。
事件经过
2026年3月26日,Anthropic 的 CMS(内容管理系统)因默认配置将文件设为公开可访问,导致约 3,000 份内部文件意外暴露在公网。其中包含一篇未发布的博客草稿,首次披露了代号 "Capybara" 的全新模型,正式名称:Claude Mythos。
最讽刺的是:一家以 AI 安全为旗帜的公司,被一个 CMS 配置默认值击穿了防线。
Mythos 有多强?
根据泄露文件:
• 代码编写能力:大幅领先 Opus 4.6
• 学术推理:飞跃性提升
• 网络安全能力:能发现生产代码库中此前未知的漏洞,达到任何现有 AI 无法触及的水平
Anthropic 内部将其定位为 "step change"(阶跃式进步),不是常规的迭代升级。
为什么还没发布?
因为它太危险了。
泄露文件明确提到:Mythos 的网络安全能力是典型的"双刃剑"——既能帮助防御者发现漏洞,也能直接帮助攻击者利用漏洞。Anthropic 自身也在草稿中承认了这一点,正在进行有限的早期内测。
对 AI Agent 生态的影响
这次泄露的意义不只是"又一个更强的模型":
- Agent 能力天花板将被重新定义 — 如果 Mythos 进入 OpenClaw 等 Agent 框架,自动化安全审计、代码分析将发生质变
- AI 安全叙事的裂缝 — 最注重安全的公司,在运营层面翻车。说明 AI 能力的边界管理,远比想象中复杂
- Frontier 移动速度超出预期 — 当前所有基于 Claude/GPT 构建的 Agent 工作流,可能需要重新设计
目前 Anthropic 已确认正在测试该模型,但未披露发布时间表。