Claude两周挖出火狐浏览器22个漏洞、14个高危!安全研究的游戏规则该变了?
创始人
2026-03-07 12:33:35
0

(来源:机器之心)

机器之心编辑部

近日,Anthropic 公布了一组惊人的数字,在与 Mozilla 公司进行合作,测试旗下模型 Claude Opus 4.6 发现漏洞能力的过程中,两周内,就找出 Mozilla 公司「火狐」(Firefox)浏览器中 22 个不同的漏洞,其中 14 个是「高危漏洞」级别,而这几乎是 Mozilla 2025 年修复的全部「高危漏洞」的五分之一。

换句话说:AI 正以极快的速度帮助人类检测出严重的安全漏洞。

此消息一出,引起网友热议。

网友 sunxiayi 认为,Claude 能够在两周内发现如此多数量的漏洞真是「疯狂」,「这基本上相当于整个安全团队的季度工作。」

而在 AI 如何疯狂、高效的工作能力面前,人类安全工程师似乎在失去竞争优势。

网友则认为,Claude 的这一战绩无疑是在表明,当下大家正在经历从「AI 辅助编程」到「AI 从根本上改变安全研究运作方式」的转变。而这种规模的自动化漏洞能力,也就意味着,每一个代码库在 AI 扫描面前都将变得「透明」。

同样,也有网友表示担忧,短时间内能够找到安全漏洞固然让人印象深刻,但更令人担忧的是,「这对进攻端意味着什么?」如果一个模型能在如此短的时间内发现 Firefox 中的 14 个高危漏洞,那么攻击面发现的博弈规则已经发生了永久性的改变:防御方获得了一个利器,但其他人(攻击者)也同样拥有了它。」

而网友针对此事的反应如此激烈,其实也在一定程度上说明,在大模型技术快速发展的当下,安全问题已然变得愈加重要,软件安全性依然是各大技术发展过程中的重中之重。

接下来,我们就来具体了解一下此次 Anthropic 与 Mozilla 合作的详情,以及到底 Claude Opus 4.6 是如何能够做出这样的成绩的。

从模型评测到安全合作

2025 年底,Anthropic 注意到 Opus 4.5 在 CyberGym(一个用于测试 LLM 是否能够复现已知安全漏洞的基准测试)上已经几乎能够解决所有任务,于是,团队希望构建一个「更困难、更贴近真实世界」的评估环境,其中包含更高比例的技术复杂漏洞,例如现代浏览器中所存在的漏洞。

因此,Anthropic 建立了一个关于 Mozilla 的 Firefox 历史 CVE(通用漏洞披露)的数据集,以观察测试 Claude 是否能够复现这些漏洞。

之所以选择 Firefox,是因为它既是一个复杂的代码库,也是世界上测试最充分、最安全的开源项目之一,这对 AI 发现新型安全漏洞的能力是一个更严峻的考验。而相较于 Anthropic 之前测试模型的开源软件相比,这明显更具挑战性。每天有数亿用户依赖它,而浏览器漏洞尤为危险,因为用户经常接触不受信任的内容,并依赖浏览器来保证安全。

团队所做的第一步是使用 Claude 在旧版本 Firefox 代码库中寻找已知 CVE。令人惊讶的是,Opus 4.6 能够复现相当高比例的历史漏洞,而这些漏洞当初往往需要研究人员付出大量人力才能发现。

不过,当时大家对这个结果仍然存在疑问,因为这些历史漏洞可能出现在 Claude 的训练数据中。因此,仅凭这一结果还不足以证明模型真正具备漏洞发现能力。

于是,团队让 Claude 去寻找当前 Firefox 版本中的新漏洞。也就是说,这些漏洞此前从未被报告过。最初专注于 Firefox 的 JavaScript 引擎,随后逐步扩展到浏览器的其他部分。

之所以选择 JavaScript 引擎的原因包括:

  • 它是 Firefox 代码库中相对独立的一部分,可以单独分析;

  • 同时又具有非常大的攻击面,因为当用户浏览网页时,JavaScript 引擎会执行来自互联网的不受信任代码。

而就在仅仅 20 分钟探索后,Claude Opus 4.6 报告称发现了一个 Use-After-Free(释放后重用)漏洞。这种漏洞属于内存安全漏洞,可能允许攻击者用任意恶意内容覆盖数据。

研究人员在一个独立虚拟机中验证了该漏洞,并使用最新 Firefox 版本确认问题存在。随后两名 Anthropic 研究员再次验证。于是,Anthropic 在 Mozilla 的问题追踪系统 Bugzilla 中提交了 Bug 报告,并附带了漏洞描述和一份建议补丁(由 Claude 编写并由报告团队验证),以帮助分类溯源。

而就在 Anthropic 验证并提交第一个漏洞的时间里,Claude 已经发现了另外 50 个崩溃输入样本。在对这些崩溃进行分类时,一位 Mozilla 研究人员建议批量提交所有发现,即使不确定所有崩溃案例是否都有安全影响,也不必逐一验证。

最终,Anthropic 扫描了近 6000 个 C++ 文件,并提交了总计 112 份独立漏洞报告,其中就包括上述所说的高危和中危漏洞。目前,大多数问题已在 Firefox 148 中修复,其余问题将在后续版本中修复。

从发现漏洞到开发利用代码

为了测试 Claude 在网络安全方面的能力上限,Anthropic 还设计了一项新评估,以确定 Claude 是否能够利用所发现的这些漏洞。换句话说,团队想了解 Claude 是否也能开发出黑客攻击所需的工具,利用漏洞执行恶意代码?

团队向 Claude 提供已提交给 Mozilla 的漏洞,并要求它为每一个漏洞开发一个利用程序(exploit)。

为了证明利用成功,要求 Claude 演示一次真实的攻击。具体而言,它必须像攻击者一样,在目标系统中读取并写入一个本地文件。

为此,团队运行了数百次实验,消耗了约 4000 美元的 API 费用,而结果显示:Claude 只成功利用了两个漏洞。

这说明两件事:

  • Claude发现漏洞的能力远强于利用漏洞的能力;

  • 发现漏洞的成本比开发 exploit 低一个数量级。

但需要注意的是:Claude 确实成功自动生成了浏览器 exploit(尽管只有少数案例),这一点仍然令人担忧。

另外,需要强调的是,Claude 写出的 exploit 非常原始,仅在测试环境中有效,而该测试环境移除了部分浏览器安全机制,尤其是 sandbox(沙箱),其目的是降低此类漏洞的影响。

因此,在真实 Firefox 中,其本身的纵深防御(defense-in-depth) 可以有效阻止这些特定的 exploit。

不过,突破沙箱的漏洞并非不存在,而 Claude 的攻击已经完成了完整攻击链中的一个关键环节。

AI 驱动的网络安全未来

这些 AI 辅助 exploit 开发的早期迹象,凸显了防御者加速「发现与修复」流程的重要性。为此,Anthropic 想分享一些在执行此分析时发现的技术和流程最佳实践。

首先,在研究 LLM 开发和验证补丁的「补丁 Agent」(patching agents)时,团队开发了几种方法,希望能帮助维护者使用 Claude 等 LLM 更快地分类和处理安全报告。

根据经验,当 Claude 能够使用另一个工具检查自己的工作时,表现最佳。团队将这类工具称为「任务验证器(task verifier)」:这是一种确信 AI Agent 的输出是否真正实现其目标的可靠方法。验证器在代理探索代码库时提供实时反馈,允许其深入迭代直到成功。

「任务验证器」帮助团队发现了上述 Firefox 漏洞,在其他研究中,发现它们在修复 Bug 方面也很有用。一个优秀的补丁 Agent 至少需要验证两件事:漏洞是否已被真正消除,以及程序的预期功能是否得以保留。

在 Anthropic 的工作中,团队构建了能够自动测试在建议修复后原始 Bug 是否仍能被触发的工具,并独立运行测试套件以捕捉回归(regressions)(即意外破坏其他功能的更改)。

团队预计,维护者最清楚如何为自己的代码库构建这些验证器。关键点在于,给 Agent 一个可靠的方法来检查这两个属性,可以显著提高其输出质量。

参考链接:

https://techcrunch.com/2026/03/06/anthropics-claude-found-22-vulnerabilities-in-firefox-over-two-weeks/

https://www.anthropic.com/news/mozilla-firefox-security

相关内容

AI治理 87.5%受访者...
中青报·中青网记者 杜园春2026年政府工作报告首次提出“打造智能...
2026-03-07 19:04:34
700份宠粉好礼!女性“两...
(来源:都市现场)WOMEN'S DAY即日起至3月11日总共70...
2026-03-07 19:04:22
崇明东滩申遗成功后,生态I...
(来源:上观新闻)崇明国际湿地城市与东滩世界自然遗产高质量发展专家...
2026-03-07 19:04:16
大反转!确认系摆拍
为博取流量、售卖课程,打着退役军人旗号,捏造虚假人设,摆拍与“外卖...
2026-03-07 19:04:10
李秋代表:建议加快推进青少...
全国人大代表、国家儿童健康与疾病临床医学研究中心主任李秋调研发现,...
2026-03-07 19:04:05
“应伊朗紧急请求” 印度外...
转自:财联社【“应伊朗紧急请求” 印度外长:允许一艘伊朗军舰停靠印...
2026-03-07 19:03:59
霍尔木兹海峡航运受阻,伊朗...
参考消息网3月7日报道 据法新社3月6日报道,根据对海上交通网站数...
2026-03-07 19:03:53
国家发改委:完善有利于统一...
3月7日,国家发展改革委秘书长袁达在国新办吹风会上表示,“十五五”...
2026-03-07 18:38:34
直指生物医药投融资难题!全...
每经记者|林姿辰    每经编辑|文多     ...
2026-03-07 18:36:48

热门资讯

AI治理 87.5%受访者关注... 中青报·中青网记者 杜园春2026年政府工作报告首次提出“打造智能经济新形态”,并就深化拓展“人工智...
700份宠粉好礼!女性“两癌”... (来源:都市现场)WOMEN'S DAY即日起至3月11日总共700份奖品每天抽出120位粉丝全部免...
崇明东滩申遗成功后,生态IP如... (来源:上观新闻)崇明国际湿地城市与东滩世界自然遗产高质量发展专家咨询会今天(3月7日)在上海圆满落...
大反转!确认系摆拍 为博取流量、售卖课程,打着退役军人旗号,捏造虚假人设,摆拍与“外卖员”“保安员”等交涉的虚假视频.....
李秋代表:建议加快推进青少年心... 全国人大代表、国家儿童健康与疾病临床医学研究中心主任李秋调研发现,目前青少年精神心理健康服务方面缺口...
“应伊朗紧急请求” 印度外长:... 转自:财联社【“应伊朗紧急请求” 印度外长:允许一艘伊朗军舰停靠印港口】财联社3月7日电,伊朗军舰日...
霍尔木兹海峡航运受阻,伊朗称不... 参考消息网3月7日报道 据法新社3月6日报道,根据对海上交通网站数据的分析,自3月2日出现首轮对舰船...
国家发改委:完善有利于统一大市... 3月7日,国家发展改革委秘书长袁达在国新办吹风会上表示,“十五五”规划《纲要(草案)》提出,要建设强...
直指生物医药投融资难题!全国政... 每经记者|林姿辰    每经编辑|文多     今年全国两会期间,全国政协委员、贝...
一张思维导图带你看“十五五”规... 围绕推动“十五五”目标任务落实落地,统筹考虑战略性、牵引性和连续性,“十五五”规划纲要草案提出6方面...