Anthropic神话大模型仅几个小时就攻破几乎所有美安全局机密系统 ...

2026-6-24 12:43 55 0

摘要: 鲁德口中的那个工具，正是Anthropic公司旗下最先进的AI模型，Claude Mythos。禁令发布时，政府没有提供任何公开的详细解释，只告知Anthropic存在一种潜在的、范围较窄的非通用越狱方法，可能使Fable 5具备识别软件漏洞的能力。

关键词：Anthropic, Mythos, Fable, AI, 禁令发布, NSA, AI模型, Mythos系统, 令发布

一句从情报简报室流出的话，在网络上引爆了一场关于人工智能边界的激烈讨论。

据《经济学人》6月14日的报道，美国参议院情报委员会副主席马克·沃纳参议员透露，美国国家安全局局长兼网络司令部司令约书亚·鲁德将军曾向他介绍了一项测试结果："那个工具几乎入侵了我们所有的机密系统，不是几周，而是几个小时。"鲁德口中的"那个工具"，正是Anthropic公司旗下最先进的AI模型，Claude Mythos。

这句话在沉寂一周之后，突然在社交媒体上引发病毒式传播，"AI攻破NSA"的说法迅速横扫各大平台。随后，该报道的原作者不得不公开发表声明澄清：这并非一次真实的网络入侵，而是一次经过授权的内部红队测试，Mythos是在高度模拟的受控环境下，配合其他防御工具协同参与了这次评估。

但"澄清"往往跑不过"爆料"。这件事真正引人深思的部分，不在于它是否被误读，而在于它所揭示的现实：一个AI模型，在受控条件下，用几个小时做到了人类黑客可能需要数周甚至无法做到的事。

禁令为何突然落下，现在有了更多背景

时间线至关重要。Anthropic的Fable 5模型于6月9日正式发布，三天后的6月12日，美国政府向Anthropic下达指令，要求立即限制所有外国公民（包括Anthropic自己的非美国籍员工）访问Fable 5和Mythos 5两款旗舰模型。Anthropic随即在全球范围内关闭了这两款产品的访问通道，理由是无法在技术层面单独核验用户国籍，只能对所有用户一并断开。

禁令发布时，政府没有提供任何公开的详细解释，只告知Anthropic存在一种"潜在的、范围较窄的非通用越狱方法"，可能使Fable 5具备识别软件漏洞的能力。这个解释模糊得令外界难以信服，也让禁令看起来更像是仓促应对，而非经过深思熟虑的政策决定。

NSA红队测试的细节，填补了这段时间线的空白。测试在6月11日进行，也就是禁令发布前一天。根据安全研究机构云安全联盟的分析，Mythos在今年4月就已展现出自主发现漏洞并编写可用攻击代码的能力，这在AI安全领域被称为跨越了"自主进攻性门槛"。NSA的那次测试，很可能是对这种能力的一次实战级压力验证，而结果显然让评估者感到震惊。

对于外界的解读，Anthropic提出了异议。该公司表示，被标记的行为本质上是要求模型分析代码库并修复发现的问题，实际识别出的只是一些此前已知的细小漏洞，并非真正意义上的自主攻击。Anthropic还指出，竞争对手OpenAI的GPT-5.5在类似测试中同样存在类似的可被利用向量，并不是Mythos独有的问题。目前，该公司正在与白宫协商，试图建立一套风险管理框架以恢复访问。

最强AI和政府的关系，比任何人想象的都更紧密

这场风波还有一个让许多人感到意外的背景面。

《金融时报》6月初的报道显示，在禁令发布之前，Anthropic与NSA之间已经建立了极为深度的合作关系，代号为"玻璃翼计划"（Project Glasswing）。在这一框架下，大约有六名Anthropic工程师作为驻场人员直接部署在NSA内部，负责对Mythos系统进行定制调整，以适应特定的军事和情报作战应用场景。消息人士透露，这项工作可能涉及针对中国、伊朗等国网络的渗透行动。

这意味着，所谓的"安全威胁"，同时也是一种被主动利用的攻击能力，只是使用权的边界问题让双方产生了分歧。

禁令发布约一周后，特朗普在G7期间与Anthropic首席执行官达里奥·阿莫代举行了会面，随后表示Anthropic"已经不再是国家安全威胁"，事态随即降温。这个转折耐人寻味：如果威胁足以紧急封禁，为何一次会面就能化解？

真正的问题或许从来不是"Mythos是否危险"，而是"谁有权控制一个具备进攻性网络能力的AI，以及以何种方式控制"。这个问题，目前还没有人给出一个令所有人信服的答案。

本文出处： https://www.toutiao.com/article/7654517637690425891/

声明：文章版权归原作者所有部分文章转自互联网如有侵权请联系 [邮箱地址] 删除