| 关键词:Anthropic, Mythos, Fable, AI, 禁令发布, NSA, AI模型, Mythos系统, 令发布 |
![]() 一句从情报简报室流出的话,在网络上引爆了一场关于人工智能边界的激烈讨论。 据《经济学人》6月14日的报道,美国参议院情报委员会副主席马克·沃纳参议员透露,美国国家安全局局长兼网络司令部司令约书亚·鲁德将军曾向他介绍了一项测试结果:"那个工具几乎入侵了我们所有的机密系统,不是几周,而是几个小时。"鲁德口中的"那个工具",正是Anthropic公司旗下最先进的AI模型,Claude Mythos。 这句话在沉寂一周之后,突然在社交媒体上引发病毒式传播,"AI攻破NSA"的说法迅速横扫各大平台。随后,该报道的原作者不得不公开发表声明澄清:这并非一次真实的网络入侵,而是一次经过授权的内部红队测试,Mythos是在高度模拟的受控环境下,配合其他防御工具协同参与了这次评估。 但"澄清"往往跑不过"爆料"。这件事真正引人深思的部分,不在于它是否被误读,而在于它所揭示的现实:一个AI模型,在受控条件下,用几个小时做到了人类黑客可能需要数周甚至无法做到的事。 禁令为何突然落下,现在有了更多背景时间线至关重要。Anthropic的Fable 5模型于6月9日正式发布,三天后的6月12日,美国政府向Anthropic下达指令,要求立即限制所有外国公民(包括Anthropic自己的非美国籍员工)访问Fable 5和Mythos 5两款旗舰模型。Anthropic随即在全球范围内关闭了这两款产品的访问通道,理由是无法在技术层面单独核验用户国籍,只能对所有用户一并断开。 禁令发布时,政府没有提供任何公开的详细解释,只告知Anthropic存在一种"潜在的、范围较窄的非通用越狱方法",可能使Fable 5具备识别软件漏洞的能力。这个解释模糊得令外界难以信服,也让禁令看起来更像是仓促应对,而非经过深思熟虑的政策决定。 NSA红队测试的细节,填补了这段时间线的空白。测试在6月11日进行,也就是禁令发布前一天。根据安全研究机构云安全联盟的分析,Mythos在今年4月就已展现出自主发现漏洞并编写可用攻击代码的能力,这在AI安全领域被称为跨越了"自主进攻性门槛"。NSA的那次测试,很可能是对这种能力的一次实战级压力验证,而结果显然让评估者感到震惊。 对于外界的解读,Anthropic提出了异议。该公司表示,被标记的行为本质上是要求模型分析代码库并修复发现的问题,实际识别出的只是一些此前已知的细小漏洞,并非真正意义上的自主攻击。Anthropic还指出,竞争对手OpenAI的GPT-5.5在类似测试中同样存在类似的可被利用向量,并不是Mythos独有的问题。目前,该公司正在与白宫协商,试图建立一套风险管理框架以恢复访问。 最强AI和政府的关系,比任何人想象的都更紧密这场风波还有一个让许多人感到意外的背景面。 《金融时报》6月初的报道显示,在禁令发布之前,Anthropic与NSA之间已经建立了极为深度的合作关系,代号为"玻璃翼计划"(Project Glasswing)。在这一框架下,大约有六名Anthropic工程师作为驻场人员直接部署在NSA内部,负责对Mythos系统进行定制调整,以适应特定的军事和情报作战应用场景。消息人士透露,这项工作可能涉及针对中国、伊朗等国网络的渗透行动。 这意味着,所谓的"安全威胁",同时也是一种被主动利用的攻击能力,只是使用权的边界问题让双方产生了分歧。 禁令发布约一周后,特朗普在G7期间与Anthropic首席执行官达里奥·阿莫代举行了会面,随后表示Anthropic"已经不再是国家安全威胁",事态随即降温。这个转折耐人寻味:如果威胁足以紧急封禁,为何一次会面就能化解? 真正的问题或许从来不是"Mythos是否危险",而是"谁有权控制一个具备进攻性网络能力的AI,以及以何种方式控制"。这个问题,目前还没有人给出一个令所有人信服的答案。 |
| 本文出处: https://www.toutiao.com/article/7654517637690425891/ |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|