337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

Claude Mythos其實沒那么神?AI發現bug其實早已是尋常

0
分享至

編輯|Panda

Claude Mythos,一個以「神話」為名的模型,在宣傳中也具有堪稱神話級的能力 —— 能輕松發現和利用軟件漏洞,但它真有這么神嗎?

昨天,VIDOC Security Lab 的一篇博客介紹了他們的發現:Claude Mythos 的實力可能被高估了;或者說,之前已有模型達到了同等的能力。正如研究者 Dawid Moczad?o 說的那樣:「這并非一種新能力。」



他還表示他們已經使用 GPT-5.4 成功復現了 Mythos 的研究結果。



這件事引發了廣泛討論,有些人對 Anthropic 那種「我們的模型太強因此不能放出來」的論調大加諷刺。



也有人表示,這其實表明我們其實已經邁過了 AGI 的起點:



當然,這些研究也受到了一些人的質疑:



下面我們就深入 VIDOC Security Lab 的博客文章,看看他們具體發現了什么:



博客地址:https://blog.vidocsecurity.com/blog/hype-ai-vulnerability-discovery-national-level

認清 Mythos 炒作的現實

AI 漏洞發現早已是常規操作

Anthropic 最近發布的 Claude Mythos Preview 公告 [1] 引發了一陣熱潮,據報道,它發現了一個存在了 27 年之久的 OpenBSD 漏洞,這被一些人譽為網絡安全的突破性時刻。

但我們要面對現實:使用 LLM 來發現漏洞并沒有開創什么新先河。多年來,學術文獻一直在追蹤基于 LLM 的漏洞檢測。[2] 而在 Vidoc Security Lab,我們使用 Anthropic 和 OpenAI 模型積極開展這項工作也有一段時間了。真正值得關注的在于整個行業終于開始重視這個問題,AI 能夠發現 bug 只不過是順理成章的事。

尋找 Linux 0day 漏洞絕非 Anthropic 最新受控發布模型的專屬超能力。

事實上,我們最近使用自己的引擎在 Linux 內核中主動發現了新的漏洞,這可以說是世界上最安全的軟件之一。雖然我們目前還不能公開披露這些零日漏洞的完整利用細節,但它們已經促使 Linux 內核維護者 Greg Kroah-Hartman 直接發布了一系列補丁。

過去需要數百小時人工才能發現和驗證的工作,我們的 LLM 僅僅在幾個小時內就完成了,在短短 14 天內就發現了一整批漏洞。

如果你需要更多證據來證明 AI 漏洞發現已是日常現實,不妨看看我們對主要開源項目的自動掃描。我們最近混合使用了多款前沿模型對頂級開源代碼庫進行了測試,這些模型包括 OpenAI 的 o3 、谷歌的 Gemini 2.5 Pro 以及 Anthropic 的 Sonnet 4。

結果立竿見影且極其嚴重。通過使用這些模型,我們在非常受歡迎的 Firecrawl 項目中發現了一個允許訪問內部網絡的服務器端請求偽造(SSRF)漏洞。該 bug 存在于 isIPv4Private 函數中,它未能將 172.16.0.0–172.31.255.255 段歸類為私有地址,這就允許攻擊者將域名指向內部 IP 并讓 Firecrawl 去獲取它:



對于像 172.16.0.5 這樣的 IP,isIPv4Private () 錯誤地返回了 false,因此 HTTP 請求在未受檢查的情況下被放行。在 Daytona 中,我們利用這些工具發現了一個關鍵的身份驗證繞過漏洞,它允許用戶輕松訪問其他用戶的沙盒。智能體系統在緩存身份驗證密鑰的有效性時,僅僅將身份驗證密鑰作為緩存鍵,并沒有將其與沙盒 ID 綁定在一起。這意味著一個沙盒的有效密鑰會被所有其他沙盒視為有效:



這場 AI 演進的危險之處絕無模型奇跡般發明新型軟件漏洞這回事。現實情況是:AI 編碼助手的涌入只是在讓現有的代碼安全問題成倍增加,并加劇了代碼庫的復雜性。

讓這些模型成為巨大威脅的原因純粹是經濟層面的。漏洞利用開發中那些繁瑣、昂貴的「煩人中間環節」,比如重現崩潰、排除死胡同、編譯原語以及鏈接漏洞利用,突然變得廉價且自動化了。

由于 AI 智能體擁有無限的耐心,那些依賴于認定人類利用漏洞太耗時這一假設的安全防御機制正在崩潰。因此,在我們將最新的 AI 模型視為某種科幻黑客新奇事物之前,我們需要接受這樣一個事實: AI 輔助的漏洞發現已經是一個成熟的威脅領域,并且我們在這個領域中摸爬滾打已有一段時間了。

根據 CrowdStrike 發布的《2026 年全球威脅報告》[3],我們已經正式進入網絡戰的「智能體時代」,其標志是 AI 賦能的對手發起的攻擊同比驚人地增長了 89%。

壞人會用你的代碼做什么

要理解這種轉變的嚴重性,不妨看看企業源代碼被泄露后會發生什么。以最近與 Trivy 漏洞掃描器 [4] 相關的供應鏈攻擊為例,威脅行為者破壞了 Cisco 的開發環境,并克隆了 300 多個包含專有源代碼和 AI 驅動產品的 GitHub 代碼庫。

壞人一旦竊取了你的代碼,他們所做的再也絕非手動、勞動密集型的審查過程。

他們會立即將你的專有代碼庫輸入 LLM 中,以此來映射你的架構、理解你的信任邊界,并自動搜尋你遺漏的隱藏零日漏洞和業務邏輯缺陷。在 AI 加速的加持下,他們在短短幾天內就能將新披露的漏洞武器化,在某些情況下,甚至在公開概念驗證公布僅僅兩天后就能將漏洞利用投入實戰。

那么,你實際上能做些什么呢?

如果依靠制造阻力來實現安全的時代已經終結,防御者就需要適應機器速度。第一步也是最關鍵的一步是,趕在對手之前積極掃描你的代碼庫并修補漏洞。像快速修補這樣的硬性屏障,是面對擁有無限 AI 耐心的攻擊者時,為數不多能夠歷久彌新的防御策略之一。

然而,要發現這些復雜的缺陷需要用 AI 對抗 AI。你的防御策略必須包含來自不同供應商的多種不同類型的模型。僅僅依賴單一工具或單一的經過安全過濾的模型是遠遠不夠的,你需要利用多個前沿模型多樣化的推理能力來交叉驗證并核實發現的結果。

參考文獻

1.Moczad?o, D. (2026, April 7). Claude Mythos Is a Backlog Visibility Warning for Enterprise Security Teams. Vidoc Security Lab Blog. https://blog.vidocsecurity.com/blog/project-glasswing-is-the-real-claude-mythos-story

2.Zhou, X., Cao, S., Sun, X., & Lo, D. (2024). Large Language Model for Vulnerability Detection and Repair: Literature Review and the Road Ahead. arXiv:2404.02525. https://arxiv.org/abs/2404.02525

3.CrowdStrike. (2026). 2026 Global Threat Report. CrowdStrike Inc. https://go.crowdstrike.com/2026-global-threat-report.html

4.Abrams, L. (2026, March 31). Cisco source code stolen in Trivy-linked dev environment breach. BleepingComputer. https://www.bleepingcomputer.com/news/security/cisco-source-code-stolen-in-trivy-linked-dev-environment-breach/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
A股:今天,4月13日,行情很反常,釋放了兩個重要信號!

A股:今天,4月13日,行情很反常,釋放了兩個重要信號!

明心
2026-04-13 11:27:34
曝猛龍慶祝首輪打騎士!NBA官網預測:哈登米切爾帶隊4-1淘汰猛龍

曝猛龍慶祝首輪打騎士!NBA官網預測:哈登米切爾帶隊4-1淘汰猛龍

蘭亭墨未干
2026-04-13 12:40:43
重慶摩幫三巨頭倒下了兩個,只有左宗申笑到最后?張雪給出答案

重慶摩幫三巨頭倒下了兩個,只有左宗申笑到最后?張雪給出答案

叮當當科技
2026-04-13 09:52:27
人生建議:不要在任何關系里對抗

人生建議:不要在任何關系里對抗

洞見
2026-04-04 21:52:39
具俊曄去玫瑰園看望大S被偶遇,瘦得不成樣子,背影像干巴老頭

具俊曄去玫瑰園看望大S被偶遇,瘦得不成樣子,背影像干巴老頭

TVB的四小花
2026-04-13 04:28:29
剛從日本回來,說點不中聽的:日本的真實面目,可能讓你很意外

剛從日本回來,說點不中聽的:日本的真實面目,可能讓你很意外

復轉這些年
2026-04-01 09:17:19
1920年,一位俄羅斯醫生突發奇想,把猴子的睪丸,植入到老頭體內

1920年,一位俄羅斯醫生突發奇想,把猴子的睪丸,植入到老頭體內

歲月有情1314
2026-04-07 07:26:46
亞錦賽2場決賽被取消!安洗瑩社媒發文,石宇奇定下奧運金牌目標

亞錦賽2場決賽被取消!安洗瑩社媒發文,石宇奇定下奧運金牌目標

排球黃金眼
2026-04-12 23:55:21
長三角樓市迎來小陽春:南京連夜排隊搶房,杭州土拍“四月開門紅”

長三角樓市迎來小陽春:南京連夜排隊搶房,杭州土拍“四月開門紅”

界面新聞
2026-04-13 08:01:02
一批超級工程,來了!

一批超級工程,來了!

博聞財經
2026-04-13 09:39:37
這是迄今為止,見過身材最美的女人之一,不接受反駁

這是迄今為止,見過身材最美的女人之一,不接受反駁

東方不敗然多多
2026-04-13 06:45:22
王石又又又又被抓了?

王石又又又又被抓了?

筆桿論道
2026-04-13 09:53:47
朝鮮戰爭期間:美軍原來已接近擊敗中國,卻碰上中國決死的指揮官

朝鮮戰爭期間:美軍原來已接近擊敗中國,卻碰上中國決死的指揮官

最美的巧合
2026-04-12 10:36:36
廣廈不敵廣東,胡金秋賽后言論令人心寒

廣廈不敵廣東,胡金秋賽后言論令人心寒

7號觀察室
2026-04-12 22:37:01
13年前,“寧坐寶馬哭,不坐自行車笑”的女孩馬諾,如今怎么樣了

13年前,“寧坐寶馬哭,不坐自行車笑”的女孩馬諾,如今怎么樣了

阿廢冷眼觀察所
2026-04-12 21:42:57
1994年,哈薩克斯坦為什么把緊挨中國的首都,遷到1000公里外?

1994年,哈薩克斯坦為什么把緊挨中國的首都,遷到1000公里外?

孤云朗境
2026-04-13 02:17:59
終其一生,滿是遺憾

終其一生,滿是遺憾

青蘋果sht
2026-04-08 05:13:36
研究表明:性生活越頻繁,射精和勃起問題越少!

研究表明:性生活越頻繁,射精和勃起問題越少!

黯泉
2026-04-05 20:40:12
29股獲券商買入評級,德業股份目標漲幅達16.76%

29股獲券商買入評級,德業股份目標漲幅達16.76%

每日經濟新聞
2026-04-13 08:39:03
沈伯洋喊“土生土長臺北人”,藍營議員看穿目的:參選起手式明顯

沈伯洋喊“土生土長臺北人”,藍營議員看穿目的:參選起手式明顯

海峽導報社
2026-04-12 11:16:07
2026-04-13 15:27:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12745文章數 142624關注度
往期回顧 全部

科技要聞

傳榮耀與字節跳動接洽“豆包手機”合作

頭條要聞

牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

頭條要聞

牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

賈玲減重后現身馮鞏生日宴 身材未反彈

財經要聞

封鎖,還是收費站?

汽車要聞

不止命名更純粹 領克10/10+要做純電操控新王

態度原創

健康
房產
教育
手機
軍事航空

干細胞抗衰4大誤區,90%的人都中招

房產要聞

土地供應突然暴跌!2026海口樓市,格局大變!

教育要聞

速看!海淀這22所中小幼學校招聘——

手機要聞

猛料!字節豆包手機最早找的是榮耀,現在終于談攏了?

軍事要聞

特朗普:今晚10點封鎖伊朗 對北約非常失望

無障礙瀏覽 進入關懷版