網易首頁 > 網易號 > 正文申請入駐

Claude Mythos其實沒那么神？AI發現bug其實早已是尋常

2026-04-13 13:31:59　來源: 機器之心Pro

河北舉報

分享至

編輯｜Panda

Claude Mythos，一個以「神話」為名的模型，在宣傳中也具有堪稱神話級的能力 —— 能輕松發現和利用軟件漏洞，但它真有這么神嗎？

昨天，VIDOC Security Lab 的一篇博客介紹了他們的發現：Claude Mythos 的實力可能被高估了；或者說，之前已有模型達到了同等的能力。正如研究者 Dawid Moczad?o 說的那樣：「這并非一種新能力。」

他還表示他們已經使用 GPT-5.4 成功復現了 Mythos 的研究結果。

這件事引發了廣泛討論，有些人對 Anthropic 那種「我們的模型太強因此不能放出來」的論調大加諷刺。

也有人表示，這其實表明我們其實已經邁過了 AGI 的起點：

當然，這些研究也受到了一些人的質疑：

下面我們就深入 VIDOC Security Lab 的博客文章，看看他們具體發現了什么：

博客地址：https://blog.vidocsecurity.com/blog/hype-ai-vulnerability-discovery-national-level

認清 Mythos 炒作的現實

AI 漏洞發現早已是常規操作

Anthropic 最近發布的 Claude Mythos Preview 公告 [1] 引發了一陣熱潮，據報道，它發現了一個存在了 27 年之久的 OpenBSD 漏洞，這被一些人譽為網絡安全的突破性時刻。

但我們要面對現實：使用 LLM 來發現漏洞并沒有開創什么新先河。多年來，學術文獻一直在追蹤基于 LLM 的漏洞檢測。[2] 而在 Vidoc Security Lab，我們使用 Anthropic 和 OpenAI 模型積極開展這項工作也有一段時間了。真正值得關注的在于整個行業終于開始重視這個問題，AI 能夠發現 bug 只不過是順理成章的事。

尋找 Linux 0day 漏洞絕非 Anthropic 最新受控發布模型的專屬超能力。

事實上，我們最近使用自己的引擎在 Linux 內核中主動發現了新的漏洞，這可以說是世界上最安全的軟件之一。雖然我們目前還不能公開披露這些零日漏洞的完整利用細節，但它們已經促使 Linux 內核維護者 Greg Kroah-Hartman 直接發布了一系列補丁。

過去需要數百小時人工才能發現和驗證的工作，我們的 LLM 僅僅在幾個小時內就完成了，在短短 14 天內就發現了一整批漏洞。

如果你需要更多證據來證明 AI 漏洞發現已是日常現實，不妨看看我們對主要開源項目的自動掃描。我們最近混合使用了多款前沿模型對頂級開源代碼庫進行了測試，這些模型包括 OpenAI 的 o3 、谷歌的 Gemini 2.5 Pro 以及 Anthropic 的 Sonnet 4。

結果立竿見影且極其嚴重。通過使用這些模型，我們在非常受歡迎的 Firecrawl 項目中發現了一個允許訪問內部網絡的服務器端請求偽造（SSRF）漏洞。該 bug 存在于 isIPv4Private 函數中，它未能將 172.16.0.0–172.31.255.255 段歸類為私有地址，這就允許攻擊者將域名指向內部 IP 并讓 Firecrawl 去獲取它：

對于像 172.16.0.5 這樣的 IP，isIPv4Private () 錯誤地返回了 false，因此 HTTP 請求在未受檢查的情況下被放行。在 Daytona 中，我們利用這些工具發現了一個關鍵的身份驗證繞過漏洞，它允許用戶輕松訪問其他用戶的沙盒。智能體系統在緩存身份驗證密鑰的有效性時，僅僅將身份驗證密鑰作為緩存鍵，并沒有將其與沙盒 ID 綁定在一起。這意味著一個沙盒的有效密鑰會被所有其他沙盒視為有效：

這場 AI 演進的危險之處絕無模型奇跡般發明新型軟件漏洞這回事。現實情況是：AI 編碼助手的涌入只是在讓現有的代碼安全問題成倍增加，并加劇了代碼庫的復雜性。

讓這些模型成為巨大威脅的原因純粹是經濟層面的。漏洞利用開發中那些繁瑣、昂貴的「煩人中間環節」，比如重現崩潰、排除死胡同、編譯原語以及鏈接漏洞利用，突然變得廉價且自動化了。

由于 AI 智能體擁有無限的耐心，那些依賴于認定人類利用漏洞太耗時這一假設的安全防御機制正在崩潰。因此，在我們將最新的 AI 模型視為某種科幻黑客新奇事物之前，我們需要接受這樣一個事實： AI 輔助的漏洞發現已經是一個成熟的威脅領域，并且我們在這個領域中摸爬滾打已有一段時間了。

根據 CrowdStrike 發布的《2026 年全球威脅報告》[3]，我們已經正式進入網絡戰的「智能體時代」，其標志是 AI 賦能的對手發起的攻擊同比驚人地增長了 89%。

壞人會用你的代碼做什么

要理解這種轉變的嚴重性，不妨看看企業源代碼被泄露后會發生什么。以最近與 Trivy 漏洞掃描器 [4] 相關的供應鏈攻擊為例，威脅行為者破壞了 Cisco 的開發環境，并克隆了 300 多個包含專有源代碼和 AI 驅動產品的 GitHub 代碼庫。

壞人一旦竊取了你的代碼，他們所做的再也絕非手動、勞動密集型的審查過程。

他們會立即將你的專有代碼庫輸入 LLM 中，以此來映射你的架構、理解你的信任邊界，并自動搜尋你遺漏的隱藏零日漏洞和業務邏輯缺陷。在 AI 加速的加持下，他們在短短幾天內就能將新披露的漏洞武器化，在某些情況下，甚至在公開概念驗證公布僅僅兩天后就能將漏洞利用投入實戰。

那么，你實際上能做些什么呢？

如果依靠制造阻力來實現安全的時代已經終結，防御者就需要適應機器速度。第一步也是最關鍵的一步是，趕在對手之前積極掃描你的代碼庫并修補漏洞。像快速修補這樣的硬性屏障，是面對擁有無限 AI 耐心的攻擊者時，為數不多能夠歷久彌新的防御策略之一。

然而，要發現這些復雜的缺陷需要用 AI 對抗 AI。你的防御策略必須包含來自不同供應商的多種不同類型的模型。僅僅依賴單一工具或單一的經過安全過濾的模型是遠遠不夠的，你需要利用多個前沿模型多樣化的推理能力來交叉驗證并核實發現的結果。

參考文獻

1.Moczad?o, D. (2026, April 7). Claude Mythos Is a Backlog Visibility Warning for Enterprise Security Teams. Vidoc Security Lab Blog. https://blog.vidocsecurity.com/blog/project-glasswing-is-the-real-claude-mythos-story

2.Zhou, X., Cao, S., Sun, X., & Lo, D. (2024). Large Language Model for Vulnerability Detection and Repair: Literature Review and the Road Ahead. arXiv:2404.02525. https://arxiv.org/abs/2404.02525

3.CrowdStrike. (2026). 2026 Global Threat Report. CrowdStrike Inc. https://go.crowdstrike.com/2026-global-threat-report.html

4.Abrams, L. (2026, March 31). Cisco source code stolen in Trivy-linked dev environment breach. BleepingComputer. https://www.bleepingcomputer.com/news/security/cisco-source-code-stolen-in-trivy-linked-dev-environment-breach/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.