337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

DeepSeek R1悄悄更新!用「小版本」干翻大模型

0
分享至


雖然DeepSeek-R2并沒有像2個月之前盛傳的那樣,在5月甚至之前準時赴約。但是,DeepSeek正在不斷地用小升級追趕其他廠商的大版本。

昨天DeepSeek官方的一則「R1已完成小版本試升級」的消息,在各個AI討論群里炸開了花。這回的DeepSeek-R1-0528版本在各個社區引發震動的最主要原因是:它真的不是一次小更新!


目前該升級版的DeepSeek-R1-0528已經全量上線官方網頁、APP、小程序等等,API也已經可以接入。

關于DeepSeek官方多么有誠意,我們已經在V3版本的升級上看到了——模型性能大幅提升只是開胃小菜,成本價格比更是再度優化。這回的更新也是一樣,新版本的DeepSeek-R1主要在編程能力上大幅提升。據一家LLM API接入網站OpenRouter,這回的新版本R1的輸入輸出價格幾乎與先前版本毫無變化!


在智能水平上,新版本DeepSeek-R1-0528在 Extended NYT Connections 基準測試上相比原始 DeepSeek R1有了大幅提升:38.6 → 49.8。


01

它真的很難說是「小升級」

現在,全網都在瘋狂拿它跟全面替代AI coding真神的Claude 4對比,發現:這倆模型竟然不相上下?甚至有一張在Livecodebench上DeepSeek-R1-0528與o3-high旗鼓相當的基準測試對比圖,在網上瘋傳。許多網友認為這回更新后的DeepSeek-R1-0528在代碼生成等編程領域的實力已經進入第一梯隊了。


我們搜集了全網最有趣的實測體驗,看看這回的DeepSeek-R1-0528到底將AI coding的能力拓展了多少:

有X網友@karminski3設置了一個「DeepSeek-R1-0528 VS Claude-4-sonnet」挑戰賽,用彈球撞擊墻面的效果作對比。

實測下來發現:DeepSeek方的彈球看起來甚至還有光澤,撞碎墻面后的粒子效果幾乎能與Claude-4-sonnet一較高下,控制面板的美觀度也都非常在線。

值得一提的是,在這次的測試中,兩個大模型使用了同一個Prompt,DeepSeek-R1-0528 生成了728行,而Claude-4-sonnet生成了542行。

更新后的R1-0528在粒子效果的表現上尤其好。粒子效果通常會涉及復雜的動態動畫和物理模擬,像是物體運動、碰撞、光影變化等等。這足以說明R1-0528在生成復雜動態動畫能力上有了很大的突破。

X網友MILO,就做了個可交互的粒子動態動畫平臺,我們也進去體驗了下。我們注意到除了畫面中央的炫酷粒子爆炸外,右上角的粒子數計算也以一種很匹配的方式同步進行著。

在全棧網頁開發上,「小升級」之后的DeepSeek-R1-0528所表現出來的能力也有了很明顯的提升。

比如,X上有網友@DomLiu給 DeepSeek-R1-0528 一個全棧網頁開發Prompt,就能在幾秒鐘內從零開始構建了一個完整的應用程序。

這段提示詞還非常的簡單:構建一個 three.js 應用程序,用于加載具有實時顏色/材質/配件控制的 3D 模型。直觀的用戶界面。流暢的相機視角。

更為驚艷的是下面這個Case,同樣是這位網友,他幾乎將DeepSeek-R1玩出了花,這也證明小升級后的DeepSeek-R1-0528到底在編程能力上有多強。

簡單來說,他使用升級后的DeepSeek-R1做了一個3D畫廊,有這些功能:

程序化幾何生成,動態場景生成系統,多彩動態光影效果,相機動畫與過渡,虛擬畫廊導航體驗。

有實際用過Trae、Cursor、Windsurf等一眾AI coding的朋友肯定都懂一個具有強大自主編程能力的基座大模型到底意味著什么?——編程效率的指數級提升。

3D藝術畫廊非常直觀地顯示了DeepSeek-R1-0528在面對復雜任務時的自主編程能力。

再比如一個3D 太陽系模擬器,在這個產品中,可以點擊任何行星獲取進一步的信息。同時畫面中呈現了極具真實感的軌道。它同樣使用 three.js 構建,簡潔、快速、交互性強。

我們也實際上手測試了下,發現升級后的DeepSeek-R1-0528在面對非常簡單的提示詞時也能做出很快的反應,并自主地豐富功能。

比如,我只給了它一句:

生成一個蘋果官網風格的前端網頁。

它只經過14秒的思考,就輕松理清了蘋果官網風格設計頁面的設計思路:

· 使用蘋果標志性的深空灰/銀色調

· 大字體標題和簡潔文案

· 高清產品圖像與漸變背景

· 懸浮動畫效果

· 響應式布局

最主要的是,很短時間內它就已經生成了462行代碼,做出來的效果也與我所設想的非常相近:


除了純代碼能力之外,DeepSeek-R1-0528在前端審美上也有了很大的提升。

比如下面這個原生iOS風格界面設計,采用了抹茶綠色主題,融合現代美學,看起來搭配很流暢。


除了產品應用UI風格之外,DeepSeek-R1-0528在HTML網頁的前端網格上也有了很大的提升。

下面兩組新版本的介紹網頁中,深色是DeepSeek-R1-0528生成,在美觀度上更具科技感和視覺沖擊力,也非常符合AI大模型本來的調性;白色則是由Claude4生成:


02

思維鏈似乎改變了,出現了一些「副作用

這回DeepSeek-R1-0528的強勢開源,甚至讓各國網友都重溫了下今年年初R1發布時的情景。現在的DeepSeek-R1-0528已經擁有了Claude系列的強自主編程能力,同時網友們在實際測試中也注意到它的思維鏈模式似乎發生了改變。


很多實測后的網友都發現這回的升級版DeepSeek-R1-0528的思考過程實在是太長了,很容易出現過度思考的現象。


比如,網友們發現了一個有趣的測試題:「估算一下π/7」,發現DeepSeek-R1-0528的思考推理過程有些太漫長了。


我們也實際測試了下,面對這樣的一個小問題,DeepSeek-R1-0528的深度思考時間達到了148秒。并且,其推理過程顯得冗余性很大。


DeepSeek-R1-0528在面對「估算一下π/7」這個問題時的思維鏈到底有多長,你可以直觀感受下:


雖然各國網友都直觀感受到了升級后的DeepSeek-R1-0528在推理能力上消耗的時間變得長了,但推理結果精度的提升也是顯而易見的。經過優化的DeepSeek-R1-0528在處理復雜問題時,已經展現出了更強的邏輯分析能力和更細致的推理過程,這使得輸出的答案不僅更加準確,還在深度和廣度上都有了顯著改進。

比如,X網友@baalatejakataru在實際編程過程中發現新的 DeepSeek-R1-0528想得太多,但是出錯時能夠快速地自我糾正,還能夠很好地寫新興系統編程語言——Zig,表現很不錯。


DeepSeek官方這回同樣延續了之前發布即開源的策略,R1-0528已經正式開源。除了開源動作之外,更新后的R1仍然采用寬松的MIT許可證,意味著它可用于商業用途。


這次DeepSeek-R1-0528的升級,進一步印證了當下大模型行業的趨勢:大版本固然令人期待,但持續穩定的小步迭代同樣無法讓人裝作看不見。

雖然DeepSeek-R2尚未如期而至,也引發了全網對于這一版本的疑惑。但是通過強化編程能力、優化前端審美,DeepSeek團隊持續的小步快跑,無疑讓業界重新審視小版本升級的巨大價值。盡管思維鏈的冗長帶來了一些「副作用」,但其帶來的精度提升和自我糾錯能力依然讓人無法忽視這次的版本升級。

在未來,DeepSeek-R1-0528的這種不改變大架構,而是通過「小升級、小迭代」就能達成明顯效果的方式可能將會成為主流,「大版本號盲目崇拜」已經被破除。

下一次「小升級」,或許就是另一場風暴的開始。

歡迎在評論區留言~
如需開白請加小編微信:dongfangmark

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
尊重歷史,青海馬家軍在陜西山西河南跟日軍血戰八年,是真的嗎?

尊重歷史,青海馬家軍在陜西山西河南跟日軍血戰八年,是真的嗎?

史之銘
2026-04-06 17:12:29
荒唐!貓王一生睡遍3000女人,42歲慘死臥室,內褲褪到大腿根

荒唐!貓王一生睡遍3000女人,42歲慘死臥室,內褲褪到大腿根

七阿姨愛八卦
2026-04-04 18:04:16
大伯每年都來我家借錢,今年除夕又來了,母親的做法讓我暗自叫好

大伯每年都來我家借錢,今年除夕又來了,母親的做法讓我暗自叫好

奶茶麥子
2026-04-06 23:26:19
全紅嬋不再隱瞞!坦言身材發胖原因,原來高敏4年內提醒過2次

全紅嬋不再隱瞞!坦言身材發胖原因,原來高敏4年內提醒過2次

青橘罐頭
2026-04-01 17:09:37
4月1日起,房子、車子、存款或將迎來大洗牌,普通人該何去何從?

4月1日起,房子、車子、存款或將迎來大洗牌,普通人該何去何從?

復轉這些年
2026-04-05 17:57:35
車長期不開,最多能停幾天?記住這個數,不傷車、不毀電瓶

車長期不開,最多能停幾天?記住這個數,不傷車、不毀電瓶

沙雕小琳琳
2026-03-27 08:29:51
美伊剛談判,以色列就動手了,特朗普下最后通牒,我國回應亮了

美伊剛談判,以色列就動手了,特朗普下最后通牒,我國回應亮了

DS北風
2026-04-07 10:54:05
FIFA官方實錘:C羅進球數確認,千球里程碑未縮水

FIFA官方實錘:C羅進球數確認,千球里程碑未縮水

孫譁北漂拍客
2026-04-07 07:40:45
當“李賠光” 遇上 “董圣人”:一場擔當的照妖鏡,照出了虛偽

當“李賠光” 遇上 “董圣人”:一場擔當的照妖鏡,照出了虛偽

橙星文娛
2026-04-04 12:40:45
中美GDP差距再次拉大!中國GDP跌到美國60%,到底是哪出問題了?

中美GDP差距再次拉大!中國GDP跌到美國60%,到底是哪出問題了?

混沌錄
2026-04-05 16:44:05
特斯拉車主:全程 500 多公里,Model Y 跑完還剩 20% 電量!

特斯拉車主:全程 500 多公里,Model Y 跑完還剩 20% 電量!

新浪財經
2026-04-05 14:34:08
鄭麗文臨行前許下愿望,七人團隊為踐行使命,老將張榮恭親自出馬

鄭麗文臨行前許下愿望,七人團隊為踐行使命,老將張榮恭親自出馬

燦若銀爛
2026-04-02 15:34:22
全球同時收到消息,北京迎來貴賓,見面握緊中方手,美國時代結束

全球同時收到消息,北京迎來貴賓,見面握緊中方手,美國時代結束

知鑒明史
2026-04-07 09:22:20
周杰倫演唱會口碑崩塌,3小時劃水2小時,萬元門票聽了個寂寞

周杰倫演唱會口碑崩塌,3小時劃水2小時,萬元門票聽了個寂寞

觀察者海風
2026-04-04 22:06:54
全球同時收到消息,北京迎來貴賓,見面握緊中方手,美國時代結束

全球同時收到消息,北京迎來貴賓,見面握緊中方手,美國時代結束

小柨拍客在北漂
2026-04-06 19:14:46
4月8日大轉運!家有哪些生肖開啟吸金模式,福氣財運雙雙到

4月8日大轉運!家有哪些生肖開啟吸金模式,福氣財運雙雙到

毅談生肖
2026-04-07 10:30:31
鄭麗文率團今日抵達大陸 推動兩岸和平

鄭麗文率團今日抵達大陸 推動兩岸和平

大公報-大公網
2026-04-07 08:56:37
女性一周幾次性生活比較好?夫妻生活中4個小細節,建議都要了解

女性一周幾次性生活比較好?夫妻生活中4個小細節,建議都要了解

健康之光
2026-04-07 09:02:31
卡帕西引爆硅谷!公開「第二大腦」黑科技,1250萬人圍觀

卡帕西引爆硅谷!公開「第二大腦」黑科技,1250萬人圍觀

新智元
2026-04-05 15:33:38
馬杜羅暴瘦30%:美國羈押下的真相,比段子更扎心

馬杜羅暴瘦30%:美國羈押下的真相,比段子更扎心

戧詞奪理
2026-04-06 16:18:26
2026-04-07 11:31:00
直面派 incentive-icons
直面派
講述值得講述的真實故事
258文章數 237關注度
往期回顧 全部

科技要聞

年化營收300億美元!Anthropic砸算力大單

頭條要聞

浙江漁民捕獲2條"巨無霸"金槍魚 船老大:30多年頭回見

頭條要聞

浙江漁民捕獲2條"巨無霸"金槍魚 船老大:30多年頭回見

體育要聞

官宣簽約“AI球員”,這支球隊被罵慘了...

娛樂要聞

張藝上浪姐惹爭議 黃景瑜前妻發文內涵

財經要聞

2026年,全國租房市場還有波降價潮

汽車要聞

廣汽電池獨立戰,背后的產業鏈博弈

態度原創

旅游
藝術
數碼
親子
公開課

旅游要聞

棗莊龜山公園風光正好 市民踏青露營解鎖春日美好

藝術要聞

美麗風光看不盡

數碼要聞

Sonnet推出雷電5版Echo 20擴展塢:提供萬兆網口與RCA插孔

親子要聞

破解月子謠言,輕松度過產褥期

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版