337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

「海外版DeepSeek」來了!Claude降價80%引發AI地震,緩解“盼V4”焦慮

0
分享至



春節這兩天等待DeepSeek新版本的焦慮氣氛中,硅谷突然扔下了一顆AI炸彈。

Anthropic 突然宣布 Claude Sonnet 4.6 發布,平價用戶也能用上旗艦級 AI 能力。更勁爆的是,這個模型在保持 Sonnet 系列價格不變的情況下(輸入 百 萬 , 輸 出 15/百萬 token),性能已經逼近此前售價高昂的 Opus 4.6——如果以“性能/價格比”計算,相當于性價比暴漲 80%

這個打法,讓人立刻想起一年前 DeepSeek R1 的“降價風暴”:同樣的“性能不降、價格腰斬”,同樣的“免費用戶也能用旗艦款”。只不過這一次,發起降價的不是中國創業公司,而是硅谷明星獨角獸 Anthropic。

X 上的 AI 開發者 Poonam Soni ( @CodeByPoonam) 第一時間發推:“Breaking: Anthropic 剛剛發布 Claude Sonnet 4.6,配備 100 萬 token 上下文窗口,在 OSWorld 電腦操控基準測試中得分 72.5%, SWE-bench 代碼測試 79.6%, Opus 級性能貫穿編碼和推理全場景。”這條推文迅速引發關注。


人工智能分析指數 v4.0)的模型能力排行榜

從上圖也可以看到,Claude Sonnet 4.6以51 分位列榜單第 2 名,僅次于同公司的 Claude Opus 4.6(max),在 10 項專業評測中展現了非常均衡的綜合能力。

一、Claude Sonnet 4.6 到底有多強?用數據說話 1. 代碼能力:79.6%,逼近 Opus 旗艦水平

SWE-bench Verified這個“真實軟件工程問題解決率”的行業金標準測試中,Claude Sonnet 4.6 交出了驚人的成績單:

  • Sonnet 4.6: 79.6%

  • Opus 4.6(旗艦款): 80.8%

  • GPT-5.2: 80.0%

  • Sonnet 4.5(上一代): 77.2%

僅差 1.2 個百分點,但價格只有 Opus 的五分之一。這意味著對于絕大多數編程任務,Sonnet 4.6 已經可以完全替代 Opus,而成本直接砍掉 80%。

對比 DeepSeek V3.2:雖然后者在成本上更有優勢(完成同樣任務約 1.01 美元 vs Claude Sonnet 4.6 約 27 美元),但 Sonnet 在企業級穩定性、API 文檔完善度、以及與 AWS Bedrock 等云平臺的深度集成上,仍然是生產環境的首選。

2. 電腦操控能力:72.5%,16 個月暴漲 387%

OSWorld-Verified基準測試衡量 AI“像人類一樣操作電腦”的能力——點擊、輸入、導航應用、完成多步驟任務。Claude 在這個領域的進化速度堪稱恐怖:

  • 2024 年 10 月Claude Sonnet 3.5: 14.9%

  • 2026 年 2 月Claude Sonnet 4.6:72.5%

  • 增幅: 387% (16 個月內)

更關鍵的是,Sonnet 4.6 的 72.5% 得分僅比 Opus 4.6 的 72.7% 低 0.2 個百分點,而 GPT-5.2 在這個測試中只有 38.2%——Claude 幾乎是 GPT 的兩倍。

Pace 公司 CEO Jamie Cuffe 在給 VentureBeat 的聲明中透露:“Sonnet 4.6 在我們復雜的保險業電腦操控基準測試中得分94%,是所有 Claude 模型中最高的。它能在失敗后進行推理并自我糾正,這是我們之前從未見過的能力。”

3. 辦公生產力:1633 Elo,全場最佳

GDPval-AA Elo 辦公任務評分中,Claude Sonnet 4.6 不僅超越了所有競爭對手,甚至反超了自家旗艦 Opus:

  • Sonnet 4.6: 1633 Elo

  • Opus 4.6: 1606 Elo

  • GPT-5.2: 1462 Elo

  • Gemini 3 Pro: 1548 Elo

Finance Agent v1.1金融分析基準測試中,Sonnet 4.6 同樣領跑:

  • Sonnet 4.6: 63.3%

  • Opus 4.6: 60.1%

  • GPT-5.2: 59.0%

這意味著在實際的企業辦公場景(財務分析、數據處理、文檔整理)中,中檔價格的 Sonnet 4.6 已經是市場上最強的模型

4. 長文本推理:100 萬 token 上下文,真正能用

Anthropic 為 Sonnet 4.6 配備了100 萬 token 上下文窗口(beta),但更重要的是它在長文本中的推理能力。在Vending-Bench Arena評估中(測試 AI 能否長期運營一個模擬企業), Sonnet 4.6 展現出了顯著的“長期規劃能力”提升。

Twitter 用戶 Felipe Corrêa 評論道:“兩周內 Anthropic 發布兩次重大更新。Claude Sonnet 4.6 在編碼、智能體、長文本推理上都達到了前沿水平。在電腦操控基準測試中得分 94%。GPT、Gemini 與 Claude 的競爭從未如此激烈。”


5. 用戶偏好:70% 更愛 Sonnet 4.6,59% 認為它超越舊版 Opus

Anthropic 內部測試顯示:

  • 70% 的用戶更喜歡 Sonnet 4.6 而非上一代 Sonnet 4.5

  • 59% 的用戶認為 Sonnet 4.6 比舊版旗艦 Opus 4.5 更好用

這是 Claude 歷史上第一次出現“中檔型號性能超越舊旗艦”的情況。

二、“海外版 DeepSeek”?更像是硅谷的降維打擊

把 Claude Sonnet 4.6 稱為“海外版 DeepSeek”,本質上是在說:Anthropic 學會了 DeepSeek 的“性價比革命”打法

DeepSeek 教會硅谷的三件事

2025 年 1 月,DeepSeek R1 以“600 萬美元訓練成本”和“API 價格僅為 GPT-4o 十分之一”的姿態橫空出世,用“性能+開源+低價”的三重組合拳,直接打破了硅谷“高性能=高價格”的商業邏輯,高貴的 OpenAI o1 沒開的 Reasoning 時代,被 DeepSeek R1 開啟。

隨后的連鎖反應迅速蔓延:字節、騰訊、百度、阿里將大模型 API 價格下調 50%-90%, OpenAI 推出更便宜的 GPT-4o Turbo, Google 加速 Gemini Flash 系列推廣。

一位 AI 行業分析師在 2026 年初的報告中直言:“DeepSeek 的出現,阻止了 AI 訂閱費用飆升至三位數美元的趨勢,將高端 AI 推理能力的價格底線永久性地拉低了。”

Claude 的反擊:不降價,但提升性價比 80%

Anthropic 的策略更聰明:API 價格不變( 15),但性能直逼旗艦 Opus( 25)

維度

Claude Sonnet 4.6

Claude Opus 4.6

性價比優勢

API 價格

15

25

-40%

SWE-bench 代碼

79.6%

80.8%

僅差 1.2%

OSWorld 電腦操控

72.5%

72.7%

僅差 0.2%

辦公任務 Elo

1633

1606

反超

金融分析

63.3%

60.1%

反超綜合性價比

+80%

更重要的是,Anthropic 將 Sonnet 4.6 設為claude.ai和 Claude Cowork 的默認免費模型,全球數百萬免費用戶無需付費就能體驗到接近旗艦級的 AI 能力。

這一招,幾乎是對 DeepSeek“免費開放高性能模型”策略的完美復刻。

對比 DeepSeek:各有所長,但 Claude 更適合生產環境

維度

Claude Sonnet 4.6

DeepSeek V3.2

成本

(同樣編程任務)

~$27

~$1.01

性能穩定性

企業級,久經驗證

頻繁升級

API 文檔

完善,開發者友好

持續完善中

云平臺集成

AWS Bedrock 深度集成

第三方支持有限

企業支持

7×24 專業團隊

社區為主

開源

閉源

MIT 開源

結論:如果你是個人開發者或預算極度敏感的項目,DeepSeek 仍然是最佳選擇;但如果你需要在生產環境中部署 AI, Claude Sonnet 4.6 的穩定性、企業支持和云平臺集成,是 DeepSeek 短期內難以替代的。

Claude Cowork 引發的“SaaSpocalypse”:軟件行業的地震前兆

值得注意的是,就在 Claude Sonnet 4.6 發布前兩周,Anthropic 已經引發了一場行業震蕩。1 月 30 日,Anthropic 為 Claude Cowork 發布了 11 個新插件,涵蓋法律、金融、銷售、營銷、數據分析等領域,讓 AI 能夠自主完成原本需要專業軟件的復雜任務。

市場反應堪稱“血洗”

  • 單日蒸發 2850 億美元:Salesforce、Adobe、Workday、ServiceNow 等企業軟件巨頭股價暴跌 6%-8%。

  • 印度 IT 股全線崩盤:Infosys 跌 7.89%、TCS 跌 6.29%、Wipro 跌 4.52%, Nifty IT 指數單日暴跌 6.84%。

  • Jefferies 交易員命名“SaaSpocalypse”:市場情緒從“AI 幫助這些公司”轉向“AI 取代這些公司”。

Claude Sonnet 4.6 會加劇這場危機嗎?答案是肯定的。Sonnet 4.6 的性能提升+價格下降,意味著原本只有大企業才能負擔的 AI 自動化能力,現在中小企業甚至個人開發者都能用上。當 AI 能以更低成本完成原本需要 Salesforce、DocuSign、Adobe 的工作時,傳統 SaaS 的“訂閱費+功能鎖定”商業模式將面臨根本性挑戰。

正如《財富》雜志所言:“Opus 4.6 的多智能體協作功能,可能對 Salesforce、Microsoft、Workday 等 SaaS 巨頭構成最大威脅——它們一直試圖讓客戶升級到自己的 AI 智能體平臺,但 Claude 已經搶先一步。”

三、不用再等 DeepSeek V4 了?現在就是最好的窗口期

就在 Claude Sonnet 4.6 發布的同一周,中文 AI 社區卻陷入了“期盼 V4”的焦慮:

  • 2 月 14 日: DeepSeek 官方宣布支持 100 萬 token 上下文,但用戶發現模型“變冷淡了”——回復變短、風格變干,“DeepSeek 被指變冷淡了”沖上微博熱搜 。

  • 2 月 16 日:疑似 DeepSeek V4 基準測試泄露,SWE-bench 得分 83.7%,超越 Claude Opus 4.5 和 GPT-5.2,傳言春節期間發布 。

  • 2 月 18 日: V4 仍未上線,官方無明確時間表

這種“等待”的焦慮,恰恰給了 Claude Sonnet 4.6 一個絕佳的市場窗口:

  • 對于普通用戶:與其苦等 V4,不如現在就用上 Sonnet 4.6,穩定性和易用性已驗證。

  • 對于企業客戶: Claude 的企業級支持、數據安全保障、AWS Bedrock 集成,是開源模型短期內難以替代的。

  • 對于開發者: API 穩定性和文檔完善度,遠超“灰度測試+頻繁調整”的 DeepSeek。

一位 AI 產品經理在社交媒體上直言:“DeepSeek 教會了硅谷如何做性價比,但 Claude 證明了閉源商業模型依然可以在‘性價比戰爭’中活下來——只要你愿意放下身段,真正把價格打下來。”

寫在最后:AI 降價戰的最大贏家是每一個普通用戶

這場由 DeepSeek 引發、Claude 接力的“AI 降價地震”,本質上是在用“降維打擊”的方式,把 AI 能力從少數人的特權,變成所有人的基礎設施:

  • 一年前,能用上 GPT-4 級別 AI 的只有付費用戶;現在,普通用戶就能用上接近 Opus 級別的 Claude。

  • 一年前,中小企業的 AI 預算動輒數萬美元;現在,幾百美元就能跑通完整的 AI 工作流

  • 一年前,“高性能=高價格”是行業共識;現在,性價比成為核心競爭力

AI 技術的迭代速度,已經快到“等待”本身就是一種成本。DeepSeek V4 可能下周就來,也可能再等一個月;但 Claude Sonnet 4.6 現在就能用,而且有免費渠道。

現在就開始用 AI 解決實際問題——無論是寫代碼、做分析、還是自動化辦公。當然母公司 Anthropic 的對華態度,使得國內團隊使用 Claude 的場景,可能僅限出海項目,這是遠不如擁抱開源精神的 DeepSeek 的地方。

總而言之,這場“AI 地震”已經蔓延開來。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
消息人士:預計美伊雙方很快傳來“好消息”

消息人士:預計美伊雙方很快傳來“好消息”

財聯社
2026-04-08 05:20:38
85歲富商陳麗華去世,和老公互稱董事長遲先生,百億遺產早有安排

85歲富商陳麗華去世,和老公互稱董事長遲先生,百億遺產早有安排

新金牌娛樂觀察家
2026-04-07 11:30:32
歐冠1-2,姆巴佩破門難救主,皇馬主場不敵德甲霸主,瀕臨出局

歐冠1-2,姆巴佩破門難救主,皇馬主場不敵德甲霸主,瀕臨出局

側身凌空斬
2026-04-08 04:53:05
一場1-0,上演神劇情:補時絕殺,英超領頭羊險勝,歐冠征服客場

一場1-0,上演神劇情:補時絕殺,英超領頭羊險勝,歐冠征服客場

足球狗說
2026-04-08 05:04:18
“還真把自己當盤菜了”,北京職高女被全網嘲笑,含金量0人買單

“還真把自己當盤菜了”,北京職高女被全網嘲笑,含金量0人買單

妍妍教育日記
2026-04-06 09:15:12
陳光標豪車變現捐千萬后續!曝嫣然已退款,原因炸裂,果然有貓膩

陳光標豪車變現捐千萬后續!曝嫣然已退款,原因炸裂,果然有貓膩

阿纂看事
2026-04-07 17:45:02
即期布倫特原油價格漲至144.42美元/桶 創歷史新高

即期布倫特原油價格漲至144.42美元/桶 創歷史新高

財聯社
2026-04-08 03:05:05
又一艘護衛艦被擊沉,俄羅斯這次真急了

又一艘護衛艦被擊沉,俄羅斯這次真急了

史政先鋒
2026-04-07 10:22:32
開車致女友截癱后失聯男子首發聲,女子起訴男方并回應傳聞

開車致女友截癱后失聯男子首發聲,女子起訴男方并回應傳聞

大象新聞
2026-04-07 15:37:04
豪門悲喜夜:皇馬主場1-2失先機,阿森納做客1-0絕殺占先機

豪門悲喜夜:皇馬主場1-2失先機,阿森納做客1-0絕殺占先機

凌空倒鉤
2026-04-08 05:28:31
經伊朗這一戰,中美之間至少50年內不會爆發戰爭,理由主要有三點

經伊朗這一戰,中美之間至少50年內不會爆發戰爭,理由主要有三點

南權先生
2026-04-07 15:31:40
離譜!皇馬1.5億巨星浪費超級單刀放生拜仁 失誤致丟球仍攤手抱怨

離譜!皇馬1.5億巨星浪費超級單刀放生拜仁 失誤致丟球仍攤手抱怨

我愛英超
2026-04-08 05:38:05
因中國工人待遇問題,巴西將比亞迪列入“恥辱名單”

因中國工人待遇問題,巴西將比亞迪列入“恥辱名單”

互聯網大觀
2026-04-07 15:43:15
重慶一業主40萬賣房,買家重裝后69.8萬售出,第二買家以天花板有排污管道泄漏起訴,一審判業主擔責近80萬

重慶一業主40萬賣房,買家重裝后69.8萬售出,第二買家以天花板有排污管道泄漏起訴,一審判業主擔責近80萬

瀟湘晨報
2026-04-07 08:41:11
為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

共工之錨
2026-04-08 00:37:29
陳麗華去世僅2天,小11歲老公遲重瑞過往被扒,他和翁帆處境一樣

陳麗華去世僅2天,小11歲老公遲重瑞過往被扒,他和翁帆處境一樣

一娛三分地
2026-04-07 18:37:11
命中了!伊朗真干了

命中了!伊朗真干了

互聯網大觀
2026-04-07 22:31:40
張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

魯中晨報
2026-04-07 17:13:05
零緩沖!全國一刀切!6月1日起,車主自己去車管所“橫著走”!

零緩沖!全國一刀切!6月1日起,車主自己去車管所“橫著走”!

混沌錄
2026-04-07 22:00:19
陳麗華因病去世,病情曝光!

陳麗華因病去世,病情曝光!

陳意小可愛
2026-04-07 13:33:25
2026-04-08 06:27:00
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
146文章數 36關注度
往期回顧 全部

科技要聞

滿嘴謊言!OpenAI奧特曼黑料大起底

頭條要聞

特朗普:伊朗人愿為自由承受轟炸

頭條要聞

特朗普:伊朗人愿為自由承受轟炸

體育要聞

阿韋洛亞:諾伊爾是本場最佳;我們會帶著必勝的信念前往德國

娛樂要聞

女首富陳麗華離世 被曝生前已分好遺產

財經要聞

10萬億財政轉移支付,被誰拿走了?

汽車要聞

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

親子
教育
家居
手機
旅游

親子要聞

6歲女孩確診性早熟!醫生:小心這些“營養品”和“餐具”

教育要聞

別再問“哪個專業最好”先問這3個問題!選錯專業=毀四年#新學期超給力

家居要聞

雅致愜意 感知生活之美

手機要聞

驍龍8 Elite Gen6再次曝光:5.3GHz+LPE協處理器,友商沒法接招!

旅游要聞

廢棄“老北京景觀”能否隨意搬回家

無障礙瀏覽 進入關懷版