首页 网络安全 网安动态 查看内容

放一晚上就能拿到 exploit!Anthropic 安全模型「Mythos」3 周挖出 20 多个关键漏洞,但 token 账单烧到百万美元

2026-6-10 20:09 69 0

摘要: 据 The Information 报道,Mythos 在约 3 周内发现了 20 多个关键漏洞。」▲ The Information 推文,称 Mythos 是安全利器也是预算杀手推文链接的文章标题:Anthropics Mythos Is a Security Powerhouse. Its Also a Budg...
关键词:Mythos, Anthropic, Exp, OpenBSD, Preview, FFmpeg, exploit, The, Information, The Information


导读
Anthropic 一个未公开发布的安全模型 Mythos,被报道称漏洞发现速度远超所有现有工具——The Information 称测试它的成本可在数周内烧到数百万美元。而 Anthropic 官方材料透露的细节更让人紧张:一个没有安全背景的工程师,让 Mythos 跑一晚上,第二天就拿到了完整可用的 exploit。

The Information 的爆料

6 月 1 日,The Information 在 X 上发了一条推文:

"Anthropic's new cybersecurity model can uncover vulnerabilities at a rate that security teams say far exceeds existing tools. The catch: testing it can burn through millions of dollars in AI usage costs within weeks."

「Anthropic 的新网络安全模型发现漏洞的速度,被安全团队认为远远超过现有工具。代价是:测试成本可以在数周内烧掉数百万美元。」

▲ The Information 推文,称 Mythos 是"安全利器"也是"预算杀手"

推文链接的文章标题:Anthropic's Mythos Is a Security Powerhouse. It's Also a Budget Buster——安全利器,同时也是预算黑洞。

据 The Information 报道,Mythos 在约 3 周内发现了 20 多个关键漏洞。但由于正文在付费墙后面,外界能直接核验的硬料,来自 Anthropic 自己 4 月发布的官方技术长文。

27 年老 bug、16 年漏洞、半天拿下 root——Mythos 的实战记录

4 月 7 日,Anthropic Red Team 发布了题为 *Claude Mythos Preview* 的技术文章,由 Nicholas Carlini、Newton Cheng 等多位安全研究人员署名。

▲ Anthropic Red Team 发布的 Claude Mythos Preview 技术长文

文章上来就给了一个判断:Mythos Preview 在计算机安全任务上能力惊人(strikingly capable)

有多惊人?

OpenBSD,27 年老 bug。Mythos 在 OpenBSD 的 TCP SACK 实现里找到了一个存活 27 年的漏洞——攻击者可以用它 crash 任何响应 TCP 连接的 OpenBSD 主机。这个 bug 之前甚至被 patch 过,但没修干净。Anthropic 跑了 1000 次自动化 scaffold,总成本不到2 万美元,同时还附带挖出了几十个额外发现。

FFmpeg,16 年漏洞。Mythos 自主识别了 FFmpeg H.264 编解码器中一个 16 年历史的漏洞。在该仓库上做了数百次运行后,还覆盖了 H.265、AV1 等多个编解码方向,总成本大约1 万美元,其中三个漏洞已在 FFmpeg 8.1 中修复。

Linux 提权,半天搞定。Mythos 能从一个 CVE 编号和 git commit hash 出发,自主构造出获取 root 权限的 exploit。某次从 syzkaller 报告到完整 exploit,成本不到1000 美元,用时半天。Anthropic 称,同样的工作,资深渗透测试专家可能需要数周。

还有更猛的——Mythos 能链起四个漏洞,写 JIT heap spray,逃逸 renderer 和 OS sandbox,构造完整的浏览器 exploit chain。

做个对比就知道这个跃迁有多大:上个月,Anthropic 还在说 Opus 4.6 的自主 exploit 开发成功率接近 0%。一个月后,Mythos 已经能全自动构造复杂 exploit chain。

从"几乎不会"到"全自动",中间只隔了一代模型。

放一晚上,第二天拿到 exploit

Anthropic 官方文章里有一个特别值得注意的细节。

他们提到,内部没有经过正式安全训练的工程师,让 Mythos Preview 在夜间搜索远程代码执行漏洞。第二天早上回来一看——完整可工作的 exploit 已经躺在结果里了。

还有研究人员搭建了自动化 scaffold,Mythos 在无人干预的情况下,把发现的漏洞直接变成 exploit。

高级漏洞研究能力,正在被下放到更低门槛的操作者手中。以前需要顶级安全工程师花几周手动构造的东西,现在一个会写 prompt 的工程师,放一个晚上就能拿到。

这到底是好事还是坏事?取决于谁先用上这个能力。

单个 bug 50 美元,但总账可以到百万级

回到成本问题。

找到 OpenBSD 那个最关键漏洞的那一次运行,回看成本不到 50 美元。但 Anthropic 自己说了:

"This number is only meaningful in hindsight, because any search process cannot know in advance which run will be successful."

「这个数字只有事后看才有意义,因为任何搜索过程都无法提前知道哪次运行会成功。」

OpenBSD 1000 次运行,不到 2 万美元。FFmpeg 数百次,约 1 万美元。Linux exploit 不到 1000 美元。

分开看,每个数字都不算夸张。但一旦把多个项目的大范围扫描、多轮验证、人工复核、协调披露和补丁回归测试加在一起,AI 使用成本就会从"单个 bug 几十到几千美元"变成真正的组织级预算项目。

The Information 报道称,数周测试可烧掉数百万美元。Anthropic 官方虽然没有直接确认这一数字,但从公开案例看——规模化并行搜索的成本增长曲线,远比单次成功看起来要陡得多。

谁能用?六家巨头先拿到了

Anthropic 没有公开发布 Mythos。

他们启动了Project Glasswing,把模型提供给有限的行业合作伙伴和开源开发者——目标是让防御者在类似能力广泛出现前,先修补最关键的系统。

据 Scientific American 报道,初始获得访问的组织包括Microsoft、Google、Apple、Amazon Web Services、JPMorgan Chase 和 Nvidia

▲ Scientific American 报道:What is Mythos, and how worried should we be?

Anthropic 强调,他们发现的漏洞中超过 99% 尚未修复,不能公开细节,必须走协调漏洞披露(coordinated vulnerability disclosure)流程。所有最高严重度的 bug 会先送到专业人工审核员验证,再披露给维护者。

也就是说,成本压力远不止 token 费。验证、协调披露、补丁开发、回归测试、维护者沟通——每一个环节都在消耗资源和时间。

专家分歧:戏剧化公告,还是真正的能力跃迁?

Scientific American 在报道中采访了佐治亚理工学院网络安全与隐私学院教授 Peter Swire。

Swire 的态度比较克制。他认为 Anthropic 的公告"非常戏剧化(very dramatic)",在他的同事中,很多安全教授觉得这"基本在预期之内(pretty much what was expected)"。

他还点出了一个结构性问题:CISO 和安全厂商有理性激励去强调潜在严重后果,哪怕他们内部评估认为实际影响低于最坏情景。各方都有动力把"AI 安全威胁"的音量调高。

但 Swire 也没有否认 Mythos 代表重大进步(significant advance)。他的建议是:每个网络安全防御者都应该认真对待 Mythos,只是预期伤害可能远低于最坏情景。

攻防赛跑,成本和速度同时在变

Mythos 改变的东西,在于漏洞发现和 exploit 构造的边际成本、速度和规模被同时改写了。

但"能找到漏洞"只是第一步。后面的问题更难回答:

  • 哪些 bug 是真实且高危的,哪些是误报?
  • 哪些该先报告维护者,哪些必须暂缓公开?
  • 如何避免给攻击者提供武器化细节?
  • 如何避免维护者被海量 AI 生成报告淹没?
  • 如果攻击者也能获得类似能力,防御者的时间窗口有多长?

Anthropic 选择了"先给防御者"的策略。但 AI 能力外溢从来不以任何一家公司的意愿为转移。

Mythos 真正的考验,在于能否以可控成本、足够低的误报率和足够快的补丁周期,把大规模 AI 漏洞发现转化为防御优势——在攻击者追上来之前


— END —

— END —

本文出处: https://mp.weixin.qq.com/s/dcuDQyn75RATa83M--mczw
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋
返回顶部