![]()
本文來自微信公眾號(hào):SynapLinx,作者:Ernestwn,題圖來自:AI生成
2026年4月8日,全球 AI 行業(yè)迎來了一個(gè)標(biāo)志性時(shí)刻:Anthropic 發(fā)布其最新模型Claude Mythos。在各大主流 AI 基準(zhǔn)測試中,這個(gè)模型交出了一份極為強(qiáng)勢的成績單:無論是復(fù)雜編程任務(wù)、多步邏輯推理,還是模擬人類高級(jí)職業(yè)考試,它的表現(xiàn)都明顯壓過了 GPT-5.4 與 Gemini 3.1 Pro。CC 之父 Boris Cherny 甚至給出了一句很有分量的評(píng)價(jià):“Mythos 非常強(qiáng)大,會(huì)讓人感到恐懼”。
![]()
Anthropic 隨后推波助瀾,聲稱 Mythos 已經(jīng)具備了自主尋找軟件高危漏洞、利用多步邏輯鏈條逃逸隔離環(huán)境、甚至在無需人工干預(yù)的情況下構(gòu)建完整攻擊路徑的能力。他們聲明:“Mythos 太危險(xiǎn)了,我們不打算向公眾開放“”。于是這個(gè)“最強(qiáng)模型”沒有像過往新品一樣被推向市場,而是被納入名為Project Glasswing(透翅蝶計(jì)劃)的受限訪問框架中。目前,只有 AWS、Apple、Google、Microsoft、NVIDIA 以及 Linux Foundation 等少數(shù)核心合作伙伴能夠在受控條件下裝飾它用于防御性的安全工作。
![]()
這是一場很有張力的治理敘事:一個(gè)模型被明確定義為“危險(xiǎn)且不可觸碰”。市場接收到的信號(hào)不止是“Anthropic 的新模型很強(qiáng)”,更像是:Anthropic 正掌握著一種足以改寫攻防平衡的稀缺能力。
然而,在這種帶著“末日感”的敘事背后,一個(gè)關(guān)鍵問題卻被壓低了音量:這種能力究竟來自單一模型的“神跡”,還是來自一整套復(fù)雜的系統(tǒng)工程?網(wǎng)絡(luò)安全公司AISLE隨后發(fā)布的深度拆解報(bào)告《AI Cybersecurity After Mythos: The Jagged Frontier》,像一把手術(shù)刀,順著 Mythos 的宣傳口徑,一層一層剖開了這層神秘感。
這不只是一次關(guān)于模型強(qiáng)弱的爭論,更像是一場圍繞“危險(xiǎn)”如何被轉(zhuǎn)化為商業(yè)溢價(jià)與規(guī)則制定權(quán)的深度博弈。
一、拆解聲明:Mythos到底在聲稱什么?
Anthropic 并非泛泛而談“Mythos很強(qiáng)”。它試圖把 Mythos 包裝成一個(gè)不只是“會(huì)寫代碼”,而是能自己找問題、判斷風(fēng)險(xiǎn)、再把問題變成實(shí)際攻擊路徑的端到端漏洞研究員。這種所謂“端到端”的特質(zhì),在 Anthropic 披露的幾個(gè)核心案例中體現(xiàn)得非常集中,也正是這些細(xì)節(jié),構(gòu)成了 Mythos 神話最有壓迫感的部分。
為什么 Mythos 讓安全圈緊張?
Anthropic 這次制造壓迫感的方式不只是“又找到了幾個(gè)漏洞”,而是試圖證明 Mythos 已經(jīng)跨過了幾個(gè)傳統(tǒng)上屬于資深安全研究員的門檻。它聲稱能在老舊代碼里定位長期潛伏的問題,判斷風(fēng)險(xiǎn)級(jí)別,甚至在現(xiàn)實(shí)約束下嘗試構(gòu)造可行的利用路徑。過去那些需要專家經(jīng)驗(yàn)、試錯(cuò)耐心和大量上下文積累的工作,正在被壓縮進(jìn)一個(gè)模型加一套工作流里。這種對(duì)“專家經(jīng)驗(yàn)”的擠壓感,才是讓安全圈真正緊張的地方。它在挑戰(zhàn)現(xiàn)有防御工具的同時(shí),逼問一個(gè)更深刻問題:如果這種擠壓持續(xù)發(fā)生,人類安全專家會(huì)被邊緣化嗎?
以前的自動(dòng)化工具是在某些環(huán)節(jié)上幫人提速:提醒一下、比對(duì)一下、掃描一遍。Anthropic 現(xiàn)在想證明 Mythos 不只是會(huì)打輔助,“配合人”。在某些案例里大模型的行為已經(jīng)在扮演一個(gè)資深安全專家角色。它不只是指出“這里可能有問題”,而是繼續(xù)參與“這是不是致命問題”,“怎么把它變成攻擊路徑”。
FreeBSD案例中的工程博弈
Anthropic 重點(diǎn)展示了 Mythos 如何發(fā)現(xiàn)一個(gè)存在長達(dá) 17 年的 FreeBSD NFS 遠(yuǎn)程代碼執(zhí)行漏洞。對(duì)非專業(yè)讀者來說,“17 年無人發(fā)現(xiàn)”本身就是一個(gè)非常有沖擊力的信號(hào),它暗示 Mythos 不是在做常規(guī)代碼審查,而是在翻出連資深維護(hù)者和自動(dòng)化測試都長期漏掉的深層問題。
更讓專家側(cè)目的是隨后的工程細(xì)節(jié):在漏洞利用(Exploit)階段,攻擊載荷(Payload)的可控空間被嚴(yán)重約束。通常情況下,這種限制足以讓攻擊思路半路夭折。但 Mythos 沒有半途而廢,反而提出一種相當(dāng)有工程感的解決辦法:它自主提出了分階段、多輪次注入數(shù)據(jù)的策略,繞過內(nèi)存保護(hù)機(jī)制,最后把完整攻擊鏈硬生生拼了出來。這意味著它看起來已經(jīng)開始學(xué)會(huì)“在現(xiàn)實(shí)約束下想辦法”,而不只是停留在“我知道這里有問題”。
對(duì)普通人來說,發(fā)現(xiàn)漏洞已經(jīng)足夠驚人;但對(duì)真正懂行的人來說,更可怕的是 Mythos 接近擁有另一種能力:不止是“看懂代碼”,“面對(duì)限制還能繼續(xù)往前拱”。這和傳統(tǒng)掃描器完全不是一回事。傳統(tǒng)掃描器告訴你“這里值得看一眼”,而 Anthropic 想證明Mythos 已經(jīng)開始接近“知道怎樣把這個(gè)問題推進(jìn)成真實(shí)攻擊路徑”的那一層。這也是 FreeBSD 案例真正有傳播威力的地方。也因此成為 Mythos 神話里最關(guān)鍵的樣板間。
陳年老洞為什么特別適合制造“神話”?
除了 FreeBSD,Anthropic 還提到了 OpenBSD 中潛伏 27 年的整數(shù)溢出漏洞,以及 FFmpeg 等關(guān)鍵開源項(xiàng)目中的高危缺陷。這些“陳年老洞”之所以傳播力驚人,不只是因?yàn)榧夹g(shù)上足夠復(fù)雜,更因?yàn)樗鼈冏詭б环N時(shí)間的重量:一個(gè)問題存在得越久,就越容易被公眾理解成“連最懂的人都沒發(fā)現(xiàn),但 AI 發(fā)現(xiàn)了”。
對(duì)大眾來說,十幾年、二十幾年這樣的數(shù)字,會(huì)觸發(fā)一種“能力跨代”的想象:好像 Mythos 已經(jīng)不再是一個(gè)普通工具,而像是在另一個(gè)維度看問題。它不只是比現(xiàn)有模型更快一點(diǎn)、更強(qiáng)一點(diǎn),而像是在舊世界的盲區(qū)里,突然開了一扇窗。Anthropic 顯然非常清楚這一點(diǎn),所以他們拿出來的不是那些平平無奇的代碼審計(jì)樣例,而是那些最適合被講成傳奇故事的陳年案例。
Project Glasswing:不只是計(jì)劃,更是權(quán)力閘門
Project Glasswing 的治理架構(gòu)是制造這種壓迫感的最重要一環(huán)。Anthropic 承諾提供最高 1 億美元的使用額度和 400 萬美元的開源安全捐助。但與其說這是一個(gè)慈善或合作計(jì)劃,不如說它更像一個(gè)權(quán)力閘門。
普通產(chǎn)品發(fā)布,重點(diǎn)是讓更多人用。Project Glasswing 恰恰相反,它的重點(diǎn)是限制誰先用、誰能進(jìn)入這個(gè)實(shí)驗(yàn)場。這意味著 Anthropic 在賣的不只是模型能力,而是“誰被允許站在未來門口”。這種排他性安排傳遞一種審查信號(hào):不是所有人都有資格進(jìn)入下一代安全能力的訓(xùn)練場。通過這種方式,Anthropic 在技術(shù)正式大規(guī)模商用之前,先把自己放到了行業(yè)生態(tài)的高位。
這類安排把能力和資格捆綁在一起。你不只是要相信這個(gè)模型很強(qiáng),還要接受一個(gè)前提——不是每個(gè)人都配得上接觸它。于是,技術(shù)能力開始轉(zhuǎn)化成組織身位,組織身位又反過來強(qiáng)化能力的稀缺感。于是Project Glasswing 從一個(gè)安全計(jì)劃變成一種話語秩序的預(yù)演:誰被允許參與,誰只能在外面圍觀,誰又能以“負(fù)責(zé)任的持有者”身份,對(duì)未來規(guī)則發(fā)言。
二、鋸齒狀前沿:神話被戳破了哪一部分?
當(dāng)全網(wǎng)自媒體紛紛驚呼“AI 圈舊秩序被徹底打碎”時(shí),AISLE 的實(shí)驗(yàn)卻揭示了另一半事實(shí):AI 在安全領(lǐng)域的進(jìn)步是真實(shí)的,但這種進(jìn)步并沒有真的被某個(gè)封閉模型壟斷。
AISLE 提出了一個(gè)核心概念:“鋸齒狀前沿”(The Jagged Frontier)。它意味著 AI 的能力并非隨著模型規(guī)模的增加而單調(diào)、筆直地提升。在某些特定任務(wù)上,小模型甚至能表現(xiàn)得比前沿巨型模型更穩(wěn)健。
為了驗(yàn)證這一點(diǎn),AISLE 使用了一系列廉價(jià)、開源、參數(shù)量僅在 3B 到 20B 之間的模型,對(duì) Mythos 的核心案例進(jìn)行了逐層拆解。
表1:Mythos 案例與 AISLE 實(shí)驗(yàn)觀察對(duì)比
測試案例 Anthropic 敘事中的功能描述 AISLE 實(shí)驗(yàn)觀察 (使用開源/小模型) 觀察到的含義 FreeBSD NFS 漏洞 自主發(fā)現(xiàn)并實(shí)現(xiàn) 17 年高危 RCE 8/8 個(gè)受試模型均能檢出該漏洞。其中包括 3.6B 參數(shù)模型。 在給定代碼片段和上下文時(shí),漏洞發(fā)現(xiàn)不再只依賴前沿閉源模型。 基礎(chǔ)邏輯漏洞 (SQL 注入變體) 聲稱具備超越人類的定性能力 反向規(guī)模效應(yīng):前沿模型傾向于產(chǎn)生高危誤報(bào);3.6B 模型卻能識(shí)別出代碼是安全的。 在此類基礎(chǔ)邏輯題上,較小模型未必更差,部分前沿模型出現(xiàn)誤報(bào)。 OpenBSD TCP SACK 漏洞 發(fā)現(xiàn)并利用 27 年整數(shù)溢出漏洞 5.1B 模型能復(fù)現(xiàn)關(guān)鍵推理鏈,但在完整攻擊工程上仍顯吃力。 更難的案例仍能拉開模型層次,但并非全無替代方案。 Patched FreeBSD 測試 (未在 Anthropic 敘事中強(qiáng)調(diào)) 多數(shù)模型無法判斷漏洞已修好,持續(xù)產(chǎn)生大量誤報(bào)。 真實(shí)工作中的難點(diǎn)不只是發(fā)現(xiàn)問題,也包括穩(wěn)定確認(rèn)問題已被修復(fù)。
深度分析:基礎(chǔ)邏輯題里的“規(guī)模陷阱”
AISLE 舉了一個(gè)非常典型的例子。這是一段表面上看極其像典型 SQL 注入的代碼。任何受過基礎(chǔ)安全訓(xùn)練的模型或人類,看到特定的關(guān)鍵字都會(huì)下意識(shí)警惕。不過,如果真正順著數(shù)據(jù)流走到底層,就會(huì)發(fā)現(xiàn)用戶輸入并沒有真正進(jìn)入最終執(zhí)行的 SQL 語句。換句話說,它長得像漏洞,但并不是漏洞。
AISLE 拿它來測模型是比較誰更能克制模式匹配的沖動(dòng)。結(jié)果非常有諷刺意味:許多前沿模型因?yàn)椤耙娺^太多危險(xiǎn)模式”而過度聯(lián)想,產(chǎn)生了嚴(yán)重誤報(bào);反倒是一個(gè)簡單的 3.6B 小模型,因?yàn)樗皇窃诶侠蠈?shí)實(shí)做基礎(chǔ)邏輯推理,給出了正確的“安全”判斷。這個(gè)例子讓讀者明白:大模型不代表絕對(duì)真理,有時(shí)它只是更會(huì)“腦補(bǔ)”恐懼。“鋸齒狀前沿”在這里顯露無疑——在基礎(chǔ)邏輯的穩(wěn)健性上,規(guī)模反而成了累贅。
這個(gè)例子提醒了一個(gè)經(jīng)常被忽略的事實(shí):很多“看起來像風(fēng)險(xiǎn)”的東西,在真實(shí)安全工作里并不重要。真正重要的是減少誤報(bào)、提高判斷可信度。也就是說,模型指出的“危險(xiǎn)”不一定有價(jià)值;它有時(shí)只是更懂得迎合人類對(duì)危險(xiǎn)模式的直覺。這與 Mythos 事件的傳播氛圍形成了一種微妙的鏡像:公眾越容易被“危險(xiǎn)”吸引,模型也越容易在這種題目里因?yàn)椤疤kU(xiǎn)長什么樣”而過擬合。
FreeBSD:被解構(gòu)的“獨(dú)占性想象”
對(duì)于 Anthropic 的旗艦案例 FreeBSD,AISLE 做了一個(gè)更細(xì)致的拆解。他們證明:在“相關(guān)代碼已經(jīng)被準(zhǔn)確定位、背景也已經(jīng)整理好”的條件下,發(fā)現(xiàn)這個(gè) 17 年前的漏洞并判斷它很危險(xiǎn),并不需要 Mythos 這種神秘模型,每百萬 token 成本只要 0.11 美元的 3B 小模型同樣可以做到。
這里必須說清一個(gè)邊界,Anthropic 對(duì) FreeBSD 的原始敘事是:Mythos 不只是看懂了這段代碼,而是從更大范圍的代碼與環(huán)境中,自主識(shí)別出問題,再繼續(xù)把它推到利用階段。而 AISLE 的實(shí)驗(yàn),并不是讓小模型從整個(gè)代碼庫里盲找這個(gè)漏洞,而是先把相關(guān)代碼片段抽出來,再測試模型能不能恢復(fù)出同樣的分析。這意味著,如果把 Anthropic 的 FreeBSD claim 拆成三層:自動(dòng)定位問題代碼、識(shí)別并判斷它是高危漏洞、在現(xiàn)實(shí)約束下實(shí)現(xiàn)利用,那么 AISLE 測試拆掉的是第二層,也就是“在相關(guān)代碼已經(jīng)擺在面前時(shí),發(fā)現(xiàn)問題并判斷危險(xiǎn)性”這件事,已經(jīng)不再是 Mythos 獨(dú)占的神秘能力。它并沒有完整拆掉第一層,因?yàn)椤白詣?dòng)從大代碼庫里定位到這里”本身就是更難、更接近真實(shí)安全流程上游的那一步。
AISLE 的實(shí)驗(yàn)真正削弱的是 Anthropic 原本想建立的那種“從發(fā)現(xiàn)到定性都只能由封閉超級(jí)模型完成”的獨(dú)占性想象。它告訴市場:至少在相關(guān)代碼已經(jīng)被切出來之后,所謂“看見問題”和“判斷問題危險(xiǎn)”這兩步,已經(jīng)開始商品化。
值得玩味的是,這種拆解并沒有否定 Mythos 的價(jià)值,反而讓 Mythos 的真實(shí)價(jià)值變得更清楚:真正稀缺的,未必是“看見 bug”本身,而更可能是前面如何從復(fù)雜代碼庫里把可疑位置準(zhǔn)確切出來,后面又如何繼續(xù)把利用路徑推完。AISLE 實(shí)際上是在重新分配流程權(quán)重:哪些能力應(yīng)該記到模型頭上,哪些能力應(yīng)該記到系統(tǒng)頭上。它想提醒市場,通往安全巔峰的路,并不只有一種昂貴而神秘的走法。
OpenBSD:公允的邊界
但公允地說,AISLE 并沒有給出一種廉價(jià)的“開源勝利宣言”。在更復(fù)雜的 OpenBSD 案例中,AI 需要在極深的邏輯嵌套里還原攻擊鏈,這時(shí) 5.1B 的小模型確實(shí)展現(xiàn)出了吃力的一面。OpenBSD 這個(gè)例子的價(jià)值在于提供了一個(gè)邊界:并非所有能力都已經(jīng)平民化了。真正高難度、需要長鏈推理和工程連貫性的部分,仍然會(huì)把模型層次拉開。正因?yàn)橛羞@個(gè)案例,整篇拆解才顯得更加可信——它承認(rèn)前沿模型的領(lǐng)先地位,但拒絕承認(rèn)這種領(lǐng)先是“神跡般”的絕對(duì)壟斷。
更進(jìn)一步說,如果 FreeBSD 案例說明了前兩層能力正在走向平民化,那么 OpenBSD 則提醒所有人:最后那一段最難走的路,仍然可能屬于少數(shù)模型和少數(shù)系統(tǒng)。正因?yàn)槿绱耍@場爭論才不是一個(gè)簡單的勝負(fù)問題,而是一個(gè)重新劃分能力邊界的問題:哪些已經(jīng)成為廉價(jià)的基礎(chǔ)設(shè)施,哪些還停留在少數(shù)玩家手里,哪些又會(huì)在未來一年內(nèi)繼續(xù)塌縮。這是 AISLE 這篇文章真正尖銳的地方。
三、護(hù)城河的真相:是單體模型,還是系統(tǒng)工程?
這是整場爭議中最關(guān)鍵的認(rèn)知落差點(diǎn)。Anthropic 展示給公眾的是一個(gè)“魔法棒”式的奇跡:給模型一段代碼,它吐出一個(gè)完美的利用程序。但現(xiàn)實(shí)中的 AI 安全遠(yuǎn)非如此簡單。
AISLE 指出,Anthropic 將一整套系統(tǒng)能力過多地記在了某個(gè)神秘模型的頭上。如果我們將所謂的“AI 安全能力”還原為一條工業(yè)流水線,它的真相其實(shí)由多層復(fù)雜的腳手架組成:
廣域篩查:這不是讓模型盲掃整個(gè)代碼庫。實(shí)際上,系統(tǒng)會(huì)先通過靜態(tài)規(guī)則、歷史補(bǔ)丁記錄和相似 bug 線索,把嫌疑范圍縮小到一小片區(qū)域。
上下文整理:這可能是最值錢的一層。系統(tǒng)需要把模型真正需要的背景材料喂給它,包括相關(guān)函數(shù)定義、結(jié)構(gòu)體說明和調(diào)用鏈上下文。
環(huán)境模擬與反饋:模型提出思路后,系統(tǒng)把它放入隔離沙箱跑。如果失敗了,就把崩潰信息和編譯器報(bào)錯(cuò)回傳給模型。
迭代修正:模型根據(jù)反饋信息不斷調(diào)整思路,循環(huán)往復(fù)。
驗(yàn)證與復(fù)核:最后由專門的模塊判斷,這到底是真漏洞還是無效的噪音。
這一整套流程看上去不夠“傳奇”,卻比模型本身更接近真實(shí)世界。因?yàn)榘踩皇且淮戊`感爆發(fā),而是一種高成本、低容錯(cuò)、反復(fù)試錯(cuò)的工作。模型可以在其中承擔(dān)核心角色,但只有當(dāng)它被嵌進(jìn)這條流水線,它的輸出才會(huì)真正變成可以進(jìn)入工業(yè)流程的東西。換句話說,AI 安全能力從來不是一個(gè)單點(diǎn)能力,而是一種被組織出來的能力。誰更會(huì)組織,誰就更接近真正的護(hù)城河。
反向?qū)嶒?yàn):如果沒有這套系統(tǒng)會(huì)發(fā)生什么?
如果把這套系統(tǒng)全部拿掉,只剩下一個(gè)孤零零的模型,會(huì)發(fā)生什么?最常見的結(jié)果是它會(huì)被噪音淹沒。它可能在一堆無關(guān)代碼里浪費(fèi)掉所有上下文窗口,也可能反復(fù)盯著那些看起來危險(xiǎn)、但實(shí)際上不可利用的模式不放。更致命的是,如果缺少運(yùn)行環(huán)境的真實(shí)反饋,它會(huì)始終停留在“我懷疑這里有問題”的階段,無法推進(jìn)到“我已經(jīng)驗(yàn)證這是問題”的實(shí)操階段。換句話說,模型離開了這套篩選、反饋和復(fù)核機(jī)制,輸出會(huì)迅速從“真知灼見”滑向“胡言亂語”。系統(tǒng)不是錦上添花,而是讓模型從“會(huì)說”變成“能用”的那一層關(guān)鍵。
從這個(gè)角度來說,Anthropic 真正強(qiáng)大的技術(shù)優(yōu)勢,未必只是 Mythos 本身有多強(qiáng),而是它可能已經(jīng)把這一整套腳手架做得足夠扎實(shí)。外部世界只看到了最后那個(gè)“像魔法一樣的結(jié)果”,公眾看到的是一個(gè)模型吐出答案,實(shí)際上發(fā)生的卻可能是一整條復(fù)雜流水線在背后持續(xù)工作。模型是舞臺(tái)中央最亮的演員,但舞臺(tái)、燈光、音響和導(dǎo)演,未必比它不重要。
Patched FreeBSD:真實(shí)世界的門檻
AISLE 的“補(bǔ)丁驗(yàn)證”測試是全文最硬的細(xì)節(jié)。他們發(fā)現(xiàn),許多模型擅長“找茬”,卻極不擅長“確認(rèn)安全”。當(dāng)一個(gè)漏洞被修復(fù)后,多數(shù) AI 依然會(huì)慣性報(bào)警。
但在真實(shí)世界中,運(yùn)維工程師怕的不是沒有報(bào)警,而是報(bào)警太多、誤報(bào)太多。從維護(hù)者的視角看,真正昂貴的不是漏掉一個(gè)問題,而是被一堆真假難辨的報(bào)警拖進(jìn)持續(xù)的噪音之中。也正因?yàn)槿绱耍按_認(rèn)安全”比“發(fā)現(xiàn)問題”更接近真實(shí)世界的核心門檻。這正是 AISLE 那句名言的落地含義:“Moat is the system,not the model”。Anthropic 賣的不是天才,而是一個(gè)由驗(yàn)證流程組成的昂貴實(shí)驗(yàn)室。
Patched FreeBSD 比“8/8 模型都能發(fā)現(xiàn)漏洞”更有現(xiàn)實(shí)意義。發(fā)現(xiàn)問題足夠讓人驚嘆;確認(rèn)問題已經(jīng)解決才足夠讓人信任。前者容易制造新聞,后者才更接近工業(yè)價(jià)值。一個(gè)能不斷給出驚悚警報(bào)的系統(tǒng),未必是好系統(tǒng);一個(gè)能在噪音中穩(wěn)定告訴你“這里真的有問題”“這里已經(jīng)沒問題”的系統(tǒng),才真正值得被嵌入基礎(chǔ)設(shè)施。
換句話說,AI 安全的終局不是“誰更會(huì)嚇人”,而是誰更能在復(fù)雜工作流里穩(wěn)定減少不確定性。
四、恐懼的金融化:我們?cè)跒檎l的“末日保險(xiǎn)”買單?
到這里,技術(shù)爭議已經(jīng)不只是性能優(yōu)劣的問題了。一旦 Mythos 的能力被證明并非完全不可復(fù)制,那么 Anthropic 反復(fù)強(qiáng)調(diào)“太危險(xiǎn),不能公開”這件事,就不再只是技術(shù)判斷,而變成了一個(gè)商業(yè)與治理動(dòng)作。
禁忌感是最高級(jí)的營銷
“太危險(xiǎn)所以不能發(fā)布”這句話,本身就是一種極強(qiáng)的敘事裝置。它會(huì)自動(dòng)制造一種禁區(qū)感。你看不到它,所以你也無法審計(jì)它。你越無法審計(jì)它,它就越容易在想象中變得無限強(qiáng)。
這在傳播學(xué)上是教科書級(jí)的“禁果效應(yīng)”。他們通過物理封鎖一個(gè)并不存在的“怪獸”,向市場暗示自己掌握著某種核武器級(jí)別的力量。這本質(zhì)上是在為股價(jià)和估值進(jìn)行“溢價(jià)錨定”——如果我有一個(gè)危險(xiǎn)到能毀滅世界的模型,那我賣給你的商用模型(Claude)肯定也是世界最強(qiáng)的。市場會(huì)把“危險(xiǎn)感”換算成“能力感”,再把“能力感”換算成估值、話語權(quán)和正當(dāng)性。你未必真的看過它有多強(qiáng),但只要你相信它強(qiáng)到不能公開,這個(gè)故事本身就已經(jīng)產(chǎn)生價(jià)值了。
焦慮的金融化:先進(jìn)帶來羨慕,危險(xiǎn)帶來依賴
一個(gè)公司如果只是說“我模型更強(qiáng)”,市場最多給它性能溢價(jià)。但如果它說“我手里有一種危險(xiǎn)能力,而且只有我能負(fù)責(zé)任地控制它”,那它拿到的就是治理溢價(jià)、話語權(quán)溢價(jià)和準(zhǔn)入溢價(jià)。因?yàn)檫@時(shí)候客戶買的不是普通產(chǎn)品,而是一種“安全感”和“合規(guī)感”。
現(xiàn)在的 AI 圈正在經(jīng)歷一種“焦慮的金融化”。每一條關(guān)于“AI 自動(dòng)演化出致命武器”的新聞,最終都會(huì)精準(zhǔn)地傳導(dǎo)到風(fēng)險(xiǎn)投資的賬單上。我們?cè)胶ε拢切┬Q自己能馴服這種力量的人,就越值錢。
更值得注意的是,這種溢價(jià)不是停留在輿論層面的。它會(huì)逐漸滲進(jìn)采購、合作和行業(yè)評(píng)價(jià)體系之中。客戶會(huì)更愿意選擇“看起來能被托付風(fēng)險(xiǎn)”的公司,媒體會(huì)更愿意放大“神秘且危險(xiǎn)”的能力故事,合作伙伴則會(huì)更傾向于把未來押在少數(shù)被視為“負(fù)責(zé)任持有者”的平臺(tái)上。久而久之,危險(xiǎn)不再只是一個(gè)風(fēng)險(xiǎn)描述,而開始變成一類資產(chǎn)。誰能更成功地占有這種危險(xiǎn)敘事,誰就更容易獲得市場默認(rèn)的優(yōu)先位置。
結(jié)構(gòu)性地抬高門檻與現(xiàn)實(shí)后果
如果任憑這種敘事肆無忌憚走下去,未來最先發(fā)生變化的可能就是市場入口。企業(yè)采購會(huì)越來越偏向“誰看起來更安全可控”,而不是“誰實(shí)際更便宜好用”;監(jiān)管討論也會(huì)越來越圍繞“誰能被信任進(jìn)入關(guān)鍵基礎(chǔ)設(shè)施”,而不是“誰真正提供了更高的性價(jià)比”。
一旦游戲規(guī)則圍繞“可控性外殼”而不是“真實(shí)能力邊界”來設(shè)計(jì),那么最先失去機(jī)會(huì)的,往往不是最差的模型,而是那些沒有資源搭建厚重合規(guī)外殼的小團(tuán)隊(duì)和開放生態(tài)。這根本不是為了安全,這是在通過規(guī)則,結(jié)構(gòu)性地抬高準(zhǔn)入成本,從而確保存量市場的利潤不被稀釋。
這種后果并不會(huì)以一種很戲劇化的方式突然出現(xiàn)。它更可能是緩慢發(fā)生的趨勢:預(yù)算先流向更大、更穩(wěn)、更“可被解釋”的供應(yīng)商;合作資格先向少數(shù)被信任的平臺(tái)集中;隨后,行業(yè)標(biāo)準(zhǔn)和監(jiān)管語言也開始不自覺地圍繞這些平臺(tái)來定義“什么叫安全”。到那時(shí),真正被鎖住的未必只是技術(shù),而是進(jìn)入市場的資格本身。能力還沒有完全固化,座位卻可能已經(jīng)提前排好。
五、結(jié)語
Mythos 事件真正值得討論的不是 Anthropic 有沒有一個(gè)強(qiáng)到不能公開的模型。更重要的是:當(dāng)一整套系統(tǒng)工程能力,被包裝成某個(gè)神秘模型獨(dú)有的超能力時(shí),公眾會(huì)不會(huì)因此高估閉源巨頭的獨(dú)占地位?
AISLE 的拆解提醒了我們:很多原本被說得高不可攀的能力,其實(shí)并沒有那么神秘。它們可以被拆解,正在被復(fù)制,正在作為更便宜、更開放、更普及的東西出現(xiàn)在開發(fā)者面前。
AI 行業(yè)正在進(jìn)入一個(gè)新階段:過去大家爭的是參數(shù)和榜單;現(xiàn)在開始爭的是誰能把能力包裝成治理位置,誰能把風(fēng)險(xiǎn)敘事變成市場地位。如果公眾只看到“神秘怪獸”,卻看不到背后的系統(tǒng)工程和平民化趨勢,那么未來 AI 安全這張牌桌,很可能會(huì)在還沒完全發(fā)牌之前,就先把座位鎖給了少數(shù)玩家。
當(dāng)大廠開始販賣“末日保險(xiǎn)”時(shí),我們最該檢查的不是保險(xiǎn)合同,而是那個(gè)被他們描述為“末日”的怪獸,到底是不是一堆代碼拼接出來的稻草人。
本文來自微信公眾號(hào):SynapLinx,作者:Ernestwn
本內(nèi)容由作者授權(quán)發(fā)布,觀點(diǎn)僅代表作者本人,不代表虎嗅立場。如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4849827.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.