337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Open聯(lián)合創(chuàng)始人:AI大模型2025年度回顧

0
分享至

Andrej Karpathy 是 OpenAI 聯(lián)合創(chuàng)始人、前特斯拉 AI 總監(jiān),也是全球最有影響力的 AI 研究者之一。他剛剛發(fā)布了一篇 2025 年 LLM 年度回顧。

我推薦每一個AI產(chǎn)品經(jīng)理都學習,這里翻譯為中文如下

第一個大變化:訓練方法的范式升級

2025 年之前,訓練一個好用的大模型基本是三步走:預訓練、監(jiān)督微調、人類反饋強化學習。

這個配方從 2020 年用到現(xiàn)在,穩(wěn)定可靠。

2025 年多了關鍵的第四步:RLVR,全稱是 Reinforcement Learning from Verifiable Rewards,翻譯過來就是「可驗證獎勵的強化學習」。

什么意思?簡單說,就是讓模型在「有標準答案」的環(huán)境里反復練習。比如數(shù)學題,答案對就是對,錯就是錯,不需要人來打分。

代碼也一樣,能跑通就是能跑通。

這和之前的訓練有什么本質區(qū)別?之前的監(jiān)督微調和人類反饋,本質上是「照葫蘆畫瓢」,人給什么樣本,模型學什么樣本。但 RLVR 不一樣,它讓模型自己摸索出解題策略。

就像學游泳,之前是看教學視頻模仿動作,現(xiàn)在是直接扔水里,只要你能游到對岸,怎么劃水我不管。

結果呢?模型自己「悟」出了看起來像推理的東西。它學會了把大問題拆成小步驟,學會了走錯路時回頭重來。這些策略如果靠人類標注示范,根本標不出來,因為人自己也說不清「正確的思考過程」長什么樣。

這個變化帶來一個連鎖反應:算力的分配方式變了。以前大部分算力砸在預訓練階段,現(xiàn)在越來越多算力用于 RL 階段。

模型的參數(shù)規(guī)模沒怎么漲,但推理能力飆升。OpenAI 的 o1 是這條路的起點,o3 是真正讓人「感覺到不一樣」的拐點。

還有個新玩法:推理時也能花更多算力。讓模型「想久一點」,生成更長的推理鏈條,效果就更好。這相當于多了一個調節(jié)能力的旋鈕。

第二個大變化:我們終于搞懂了 AI 是什么「形狀」的聰明

Karpathy 用了一個很妙的比喻:我們不是在「養(yǎng)動物」,而是在「召喚幽靈」,人類的智能是進化出來的,優(yōu)化目標是「在叢林里讓部落活下去」。

大模型的智能是訓練出來的,優(yōu)化目標是「模仿人類文本、在數(shù)學題里拿分、在評測榜單上刷分」。

優(yōu)化目標完全不同,出來的東西當然也完全不同。

所以 AI 的智能是「參差不齊」的,英文叫 jagged intelligence。它可以在某些領域表現(xiàn)得像全知全能的學者,同時在另一些領域犯小學生都不會犯的錯。上一秒幫你推導復雜公式,下一秒被一個簡單的越獄提示騙走你的數(shù)據(jù)。

為什么會這樣?因為哪個領域有「可驗證的獎勵」,模型在那個領域就會長出「尖刺」。

數(shù)學有標準答案,代碼能跑測試,所以這些領域進步飛快。但常識、社交、創(chuàng)意這些領域,什么是「對」很難定義,模型就沒法高效學習。

這也讓 Karpathy 對基準測試失去了信任。道理很簡單:測試題本身就是「可驗證環(huán)境」,所有基準都刷滿了,但離真正的通用智能還差得遠,這是完全可能發(fā)生的事。

第三個大變化:LLM 應用層浮出水面

Cursor 今年火得一塌糊涂,但 Karpathy 認為它最大的意義不是產(chǎn)品本身,而是證明了「LLM 應用」這個新物種的存在。

大家開始討論「X 領域的 Cursor」,這說明一種新的軟件范式成立了。這類應用做什么?

  • 第一,做上下文工程。把相關信息整理好,喂給模型。

  • 第二,編排多個模型調用,后臺可能串了一堆 API 調用,平衡效果和成本。

  • 第三,提供專業(yè)場景的界面,讓人類能在關鍵節(jié)點介入。

  • 第四,給用戶一個「自主程度滑桿」。

你可以讓它多干點,也可以讓它少干點。 有個問題被討論了一整年:這個應用層有多「厚」?模型廠商會不會把所有應用都吃掉?

Karpathy 的判斷是:模型廠商培養(yǎng)的是「有通用能力的大學畢業(yè)生」,但 LLM 應用負責把這些畢業(yè)生組織起來、培訓上崗,變成能在具體行業(yè)干活的專業(yè)團隊。數(shù)據(jù)、傳感器、執(zhí)行器、反饋循環(huán),這些都是應用層的活。

第四個大變化:AI 搬進了你的電腦 Claude Code 是今年最讓 Karpathy 印象深刻的產(chǎn)品之一。

它展示了「AI 智能體」應該長什么樣:能調用工具、能做推理、能循環(huán)執(zhí)行、能解決復雜問題。

但更關鍵的是,它跑在你的電腦上。用你的環(huán)境、你的數(shù)據(jù)、你的上下文。 Karpathy 認為 OpenAI 在這里判斷失誤了。他們把 Codex 和智能體的重心放在云端容器里,從 ChatGPT 去調度。這像是在瞄準「AGI 終局」,但我們還沒到那一步。

現(xiàn)實是,AI 的能力還是參差不齊的,還需要人類在旁邊看著、配合著干活。把智能體放在本地,和開發(fā)者并肩工作,才是當下更合理的選擇。 Claude Code 用一個極簡的命令行界面做到了這一點。

AI 不再只是你訪問的一個網(wǎng)站,而是「住在」你電腦里的一個小精靈。這是一種全新的人機交互范式。

第五個大變化:Vibe Coding 起飛了 2025 年,AI 的能力跨過了一個門檻:你可以純用英語描述需求,讓它幫你寫程序,完全不用管代碼長什么樣。Karpathy 隨手發(fā)了條推特,給這種編程方式起了個名字叫 vibe coding,結果這個詞火遍全網(wǎng)。

這意味著什么?編程不再是專業(yè)程序員的專利,普通人也能做。這和過去所有技術的擴散模式都不一樣。以前新技術總是先被大公司、政府、專業(yè)人士掌握,然后才慢慢下沉。但大模型反過來,普通人從中受益的比例遠超專業(yè)人士。

不只是「讓不會編程的人能編程」。對會編程的人來說,很多以前「不值得寫」的小程序現(xiàn)在都值得寫了。

Karpathy 自己就用 vibe coding 做了一堆項目:用 Rust 寫了個定制的分詞器、做了好幾個工具類 App、甚至寫了一次性的程序只為找一個 bug。 代碼突然變得廉價、即用即棄、像草稿紙一樣隨便寫。

這會徹底改變軟件的形態(tài)和程序員的工作內(nèi)容。

第六個大變化:大模型的「圖形界面時代」要來了 Google 的 Gemini Nano Banana 是今年最被低估的產(chǎn)品之一。

它能根據(jù)對話內(nèi)容實時生成圖片、信息圖、動畫,把回復「畫」出來而不是「寫」出來。 Karpathy 把這件事放到更大的歷史脈絡里看:大模型是下一個重大計算范式,就像 70 年代、80 年代的計算機一樣。所以我們會看到類似的演進路徑。 現(xiàn)在和大模型「聊天」,有點像 80 年代在終端敲命令。文字是機器喜歡的格式,但不是人喜歡的格式。

人其實不愛讀文字,讀文字又慢又累。人喜歡看圖、看視頻、看空間布局。這就是傳統(tǒng)計算機為什么要發(fā)明圖形界面。 大模型也需要自己的「GUI」。

它應該用我們喜歡的方式跟我們說話:圖片、幻燈片、白板、動畫、小應用?,F(xiàn)在的 Emoji 和 Markdown 只是初級形態(tài),幫文字「化個妝」。真正的 LLM GUI 會是什么樣?Nano Banana 是一個早期暗示。 最有意思的是,這不只是圖像生成的事。它需要把文本生成、圖像生成、世界知識全部絞在一起,在模型權重里融為一體。

Karpathy 的總結是這樣的:2025 年的大模型,比他預期的聰明,也比他預期的蠢。兩者同時成立。 但有一點很確定:即使以現(xiàn)在的能力,我們連 10% 的潛力都沒挖掘出來。

還有太多想法可以試,整個領域感覺是敞開的。

他在 Dwarkesh 的播客里說過一句看似矛盾的話: > 他相信進步會繼續(xù)飛速推進, > 同時也相信還有大量的工作要做。

兩件事并不矛盾。2026 年系好安全帶繼續(xù)加速吧。

“分享產(chǎn)品經(jīng)理改變世界的點滴”

產(chǎn)品顧問| 產(chǎn)品咨詢|培訓合作

請?zhí)砑游⑿? PMxiaowanzi

最近我的原創(chuàng)

每日案例拆解庫,AI等產(chǎn)品打卡群

我創(chuàng)建的產(chǎn)品設計打卡社群,加入后365天,每天體驗一款APP。提升產(chǎn)品設計能力,同時有1300份體驗報告幫助你找到競品

在這里你可以隨時查詢到你想找的各類競品行業(yè)APP,無須自己親自下載就可以馬上得到APP的一手產(chǎn)品優(yōu)化、交互設計、功能描述信息。

從優(yōu)化&建議、商業(yè)模式、運營、功能描述、交互設計、產(chǎn)品定位至少6個維度,體驗一款應用。

平均1天1塊錢,掃碼購買即可加入

連續(xù)體驗48款應用,通過后原路退回


報名后添加星球助理

PMTalk123

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
XChat 來了!馬斯克版微信正式發(fā)布,國區(qū)可下載

XChat 來了!馬斯克版微信正式發(fā)布,國區(qū)可下載

新浪財經(jīng)
2026-04-12 23:41:21
何家擁頂級醫(yī)療資源,何超蕸仍不敵病魔,她到底得了什么病?

何家擁頂級醫(yī)療資源,何超蕸仍不敵病魔,她到底得了什么???

天天熱點見聞
2026-04-13 10:13:51
活久見!網(wǎng)傳廣東一租客將價值30元沙金項鏈留屋,房東爽快退押金

活久見!網(wǎng)傳廣東一租客將價值30元沙金項鏈留屋,房東爽快退押金

阿離家居
2026-04-13 12:18:26
全程眼突鼓腮,看了觀眾對孫儷的評價,才知張藝謀這句話的含金量

全程眼突鼓腮,看了觀眾對孫儷的評價,才知張藝謀這句話的含金量

陳述影視
2026-04-04 17:53:34
中俄動作迅猛,特朗普炮頭調轉,對日審判已經(jīng)開始,高市被催下臺

中俄動作迅猛,特朗普炮頭調轉,對日審判已經(jīng)開始,高市被催下臺

軒逸阿II
2026-04-12 05:19:52
文章上海面館受追捧,一碗面32元引熱議,食客稱價格不貴很親民

文章上海面館受追捧,一碗面32元引熱議,食客稱價格不貴很親民

扒蝦侃娛
2026-04-13 12:51:13
擊敗傳統(tǒng)霸主俄羅斯隊,中國隊團體摘金,多名小將更驚喜奪冠

擊敗傳統(tǒng)霸主俄羅斯隊,中國隊團體摘金,多名小將更驚喜奪冠

羅掌柜體育
2026-04-12 13:16:06
廣東終結廣廈主場18連勝!杜鋒卻遭質疑,媒體人怒了:到底想干嘛

廣東終結廣廈主場18連勝!杜鋒卻遭質疑,媒體人怒了:到底想干嘛

萌蘭聊個球
2026-04-13 09:10:16
季后賽詹杜對決上線!杜蘭特9勝5負占優(yōu),湖人包夾KD破局?

季后賽詹杜對決上線!杜蘭特9勝5負占優(yōu),湖人包夾KD破局?

李喜林籃球絕殺
2026-04-13 14:30:49
知名國企集團,六個月沒發(fā)工資了

知名國企集團,六個月沒發(fā)工資了

新浪財經(jīng)
2026-04-13 04:16:19
博主:國安將就廖力生疑似手球進球與韋世豪報復染黃進行申訴

博主:國安將就廖力生疑似手球進球與韋世豪報復染黃進行申訴

懂球帝
2026-04-13 09:38:11
開國上將鬧離婚:結發(fā)40年竟遭發(fā)妻死命舉報,六名子女為何如釋重負

開國上將鬧離婚:結發(fā)40年竟遭發(fā)妻死命舉報,六名子女為何如釋重負

睡前講故事
2026-04-07 14:43:34
煙草市場徹底變天!銷量下滑非產(chǎn)能過剩,供需矛盾席卷全國煙酒店

煙草市場徹底變天!銷量下滑非產(chǎn)能過剩,供需矛盾席卷全國煙酒店

老特有話說
2026-04-12 15:57:53
NBA擺爛卷成修羅場:8隊狂輸55場,歷史頭一回

NBA擺爛卷成修羅場:8隊狂輸55場,歷史頭一回

體育硬核說
2026-04-13 13:56:28
10年內(nèi)入獄2次,爆火后“包一晚”40萬,如今的她過得怎么樣?

10年內(nèi)入獄2次,爆火后“包一晚”40萬,如今的她過得怎么樣?

寶哥精彩賽事
2026-04-07 15:43:13
夠中國用2萬年!我國攻克世界級難題,搶先美國建造"無限能源"

夠中國用2萬年!我國攻克世界級難題,搶先美國建造"無限能源"

蜉蝣說
2026-04-13 10:13:30
火箭季后賽首輪唯戰(zhàn)湖人能突圍!掘金難撼,湖人成唯一晉級希望!

火箭季后賽首輪唯戰(zhàn)湖人能突圍!掘金難撼,湖人成唯一晉級希望!

田先生籃球
2026-04-12 14:07:24
外媒:一旦戰(zhàn)火爆發(fā),中國將會到達無人知曉的地步

外媒:一旦戰(zhàn)火爆發(fā),中國將會到達無人知曉的地步

老謝談史
2026-04-12 21:56:50
果然陽謀在任何面前都是無敵的!網(wǎng)友:把水攪混了,也是一種智慧

果然陽謀在任何面前都是無敵的!網(wǎng)友:把水攪混了,也是一種智慧

夜深愛雜談
2026-04-07 17:50:08
勝者為王!張雪辭職那年,嚴凱坦言:他很有可能會贏,但我不敢賭

勝者為王!張雪辭職那年,嚴凱坦言:他很有可能會贏,但我不敢賭

干史人
2026-04-10 22:30:03
2026-04-13 14:44:49
Kevin改變世界的點滴 incentive-icons
Kevin改變世界的點滴
每周一次,產(chǎn)品案例與經(jīng)驗分享
287文章數(shù) 21關注度
往期回顧 全部

科技要聞

傳榮耀與字節(jié)跳動接洽“豆包手機”合作

頭條要聞

牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

頭條要聞

牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

賈玲減重后現(xiàn)身馮鞏生日宴 身材未反彈

財經(jīng)要聞

封鎖,還是收費站?

汽車要聞

不止命名更純粹 領克10/10+要做純電操控新王

態(tài)度原創(chuàng)

游戲
房產(chǎn)
健康
教育
時尚

無限橫掃、封魔靈符,夢幻西游2026年四月門派大改要來了

房產(chǎn)要聞

土地供應突然暴跌!2026??跇鞘?,格局大變!

干細胞抗衰4大誤區(qū),90%的人都中招

教育要聞

速看!海淀這22所中小幼學校招聘——

這些才是普通人借鑒的穿搭!上短下長、上窄下寬,顯瘦又舒適

無障礙瀏覽 進入關懷版