337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

全球最大游戲博主「偷師」DeepSeek,爆改國產(chǎn)大模型干翻 ChatGPT

0
分享至

全球最大游戲博主 PewDiePie,又整活了。

他靠著「偷師」DeepSeek、清華大學(xué)發(fā)布的技術(shù)文檔,用一堆魔改顯卡成功微調(diào)出一個自己的 AI 模型,而這個模型在編程基準(zhǔn)測試中的表現(xiàn),竟然超越了 GPT-4 和 Gemini 2.5 Pro。


但就在幾個月前,他對 AI 的了解還跟普通人沒什么兩樣。 PewDiePie 本名為菲利克斯·謝爾貝格(Felix Kjellberg),坐擁逾 1.1 億 YouTube 訂閱,近年來逐漸淡出游戲直播圈,反而把大量時間放在了 AI 領(lǐng)域。


轉(zhuǎn)折點(diǎn)出現(xiàn)在去年 11 月。他發(fā)布《STOP. Using AI Right now》,展示如何從零搭建一套帶搜索、記憶和語音輸出的個人 AI 助手。

這次的新視頻,他更進(jìn)一步——從數(shù)據(jù)收集到模型微調(diào),完整記錄了一個 AI 小白是如何微調(diào)出一個能媲美頂流 AI 的模型。


差點(diǎn)燒掉兩次房子,頂流網(wǎng)紅微調(diào)大模型打敗 GPT-4

PewDiePie 坦言,在開始這個項(xiàng)目之前,他對機(jī)器學(xué)習(xí)、模型訓(xùn)練和代碼編程幾乎一無所知。但他的邏輯很簡單:

不懂就學(xué),一步一步來。

他選用阿里旗下開源的 Qwen 2.5(32B 參數(shù)版)作為底座模型,目標(biāo)是在一個名為 Aider Polyglot 的編程基準(zhǔn)測試上超越 ChatGPT。


選擇這個 benchmark 也有來由:他在之前視頻里曾用 Aider 這個工具搭建自己的網(wǎng)頁 UI,對它并不陌生。

這個測試涵蓋六種編程語言,而彼時 ChatGPT 的得分約為 18.2%,Qwen 2.5 在默認(rèn)格式下僅有 8%。但他發(fā)現(xiàn),換用「whole form」格式后可提升至 16%。

所謂「whole form」,是指模型修改代碼時會把整段代碼從頭重寫一遍,而不是只改動需要修改的部分——這意味著,只要解決格式問題,超越 ChatGPT 并非遙不可及。


而且格式只是外部設(shè)置,模型本身的能力才是真正的瓶頸。要從根本上提升,唯一的路是微調(diào)訓(xùn)練——而訓(xùn)練,需要數(shù)據(jù)。他由此開始了漫長的數(shù)據(jù)工程。

他嘗試了幾乎所有能想到的數(shù)據(jù)來源:挖掘 60TB 的開放代碼數(shù)據(jù)集 The Stack,爬取 GitHub 公開倉庫,以及讓大模型批量合成訓(xùn)練樣本。


最初他收集了約 10 萬條訓(xùn)練數(shù)據(jù),整個過程混亂不堪,多個 LLM 同時跑數(shù)據(jù)處理、測試、增強(qiáng)。

但數(shù)據(jù)質(zhì)量始終是問題。

合成數(shù)據(jù)看起來格式完美,打開一看卻全是錯誤。他為此搭建了一套「驗(yàn)證框架」來過濾垃圾數(shù)據(jù),卻因?yàn)榭蚣鼙旧淼倪壿嬋毕荩炊尭嗬鴶?shù)據(jù)蒙混過關(guān)。

第一次正式訓(xùn)練跑完,模型成績沒有提升,反而更差了。他沒有放棄,調(diào)整后重訓(xùn),結(jié)果還是更差。這個循環(huán)持續(xù)了數(shù)月。


修復(fù)了測試框架之后,benchmark 終于能正常跑起來,最高跑到 16%,但 要超過 ChatGPT 的 18.2%,還有距離。


這時,一篇來自清華大學(xué)聯(lián)合阿里巴巴、莫納什大學(xué)的研究成果《Towards Widening The Distillation Bottleneck for Reasoning Models》的技術(shù)論文,帶給了他新的靈感。

簡單來說,就是既然直接抄大模型的長思維鏈會把小模型帶偏,那就別直接抄。改成自己造訓(xùn)練數(shù)據(jù),而且造得更像人做題時的過程。


論文地址:https://arxiv.org/html/2503.01461v1

硬件方面的折磨則更具戲劇性。

為了加入「推理鏈」提升模型表現(xiàn),他需要更大量的算力持續(xù)運(yùn)轉(zhuǎn)。某次重啟后,GPU 突然開始冒煙,煙霧彌漫整個房間,他關(guān)機(jī)檢查,發(fā)現(xiàn)其中一塊 GPU 已經(jīng)損毀。

翻了購買記錄才發(fā)現(xiàn),這塊出問題的來自不同工廠。其實(shí)也不意外——他這套系統(tǒng)用的也是從中國買的魔改版 RTX 4090顯卡。


后來他又發(fā)現(xiàn),自己一直在用額定 1500W 的電源線,實(shí)際運(yùn)行功率卻超過 2000W。換線之后,電腦仍頻繁崩潰,他索性把浴室的電路「借」過來接入機(jī)器,并把 GPU 功耗從 450W 壓到 175W,只為不讓家里的電網(wǎng)隨時跳閘。


他在視頻里打趣說,為了一切順利,他甚至給整套系統(tǒng)舉行了開光儀式。

算力和數(shù)據(jù)的雙重折磨之下,他開始調(diào)用 DeepSeek API 來合成約 1.5 萬條高質(zhì)量推理樣本。這些樣本數(shù)量雖少,卻是他精心篩選的「精華數(shù)據(jù)」,每一條都附有詳細(xì)的逐步推理過程。用這批數(shù)據(jù)完成監(jiān)督微調(diào)后,基準(zhǔn)測試成績達(dá)到 19.6%,在數(shù)值上超越了 ChatGPT。


但他隨即發(fā)現(xiàn)自己忘記做數(shù)據(jù)污染檢查,即驗(yàn)證訓(xùn)練數(shù)據(jù)是否與測試集重疊。

檢查后確認(rèn)存在少量污染,他決定清洗數(shù)據(jù)、重頭再來。這一次,他還意外發(fā)現(xiàn)自己此前一直在用 Qwen 的通用版本,而非專為代碼優(yōu)化的版本。換用正確模型、配合完整清潔數(shù)據(jù)集重訓(xùn)后,成績跳升至 25%。


隨后他修復(fù)了基準(zhǔn)測試本身的 Bug,即 C++和 JavaScript 題目未被正確執(zhí)行的問題,修復(fù)后重跑,成績升至 36%。


經(jīng)過最后一輪后訓(xùn)練,純凈去污染版本的最終成績定格在 39.1%,超越了 GPT-4-mini 及 Gemini 2.0 Pro 等多個早期主流模型。


值得一提的是,整個微調(diào)過程中,PewDiePie 多次強(qiáng)調(diào) DeepSeek 技術(shù)文檔對他的幫助。在他看來,DeepSeek 不僅公開了模型權(quán)重,還發(fā)布了詳盡的訓(xùn)練流程文檔,將數(shù)據(jù)處理、推理增強(qiáng)等核心方法細(xì)節(jié)和盤托出。

而從 DeepSeek 的訓(xùn)練文檔,到 Qwen 2.5 的開源底座,再到清華團(tuán)隊(duì)關(guān)于推理鏈蒸餾的論文——一個對 AI 幾乎一無所知的內(nèi)容創(chuàng)作者,能夠在數(shù)月內(nèi)完成從零到擊敗頂流模型的跨越,并不只是個人努力的故事,更繞不開中國 AI 研究對整個開源社區(qū)持續(xù)的實(shí)質(zhì)性貢獻(xiàn)。

AI 焦慮時代,普通人該如何自處

視頻發(fā)布后,社交媒體上的反應(yīng)截然不同。

一種是純粹的震撼。X 網(wǎng)友 @birdabo 在社交媒體上寫道:「PewDiePie 剛剛訓(xùn)練了自己的 LLM,他的模型在編碼基準(zhǔn)測試中超過了 DeepSeek V2.5、LLaMA-4 和 GPT-4o。什么鬼。」


另一位用戶 @CryptoElara 則表示:「太瘋狂了,Pewds。」也有人調(diào)侃:「從我的世界到機(jī)器學(xué)習(xí)!」,暗指 PewDiePie 曾以《我的世界》等游戲內(nèi)容起家,如今卻在折騰大語言模型的訓(xùn)練流程。


技術(shù)博主 @nrehiew_更是寫道,他從未想象過 DeepSeek R1 論文會出現(xiàn)在 PewDiePie 的視頻里,而更令他意外的是,PewDiePie 在整個過程中展現(xiàn)出的嚴(yán)謹(jǐn)程度,甚至比某些正式論文還要高。


值得一提的是,這種看似「不務(wù)正業(yè)」的深度投入,恰恰需要一種大多數(shù)人難以企及的前提——當(dāng)下 AI 行業(yè)的知識迭代速度,已經(jīng)快到了幾乎需要全職跟進(jìn)才能不掉隊(duì)的程度。

互聯(lián)網(wǎng)上流傳著一句半開玩笑的推論:只有無業(yè)狀態(tài)的人,才能真正追上 AI 領(lǐng)域的所有動態(tài)。

PewDiePie 年收入峰值超過 1500 萬美元,早在訂閱量爆發(fā)期就已實(shí)現(xiàn)財(cái)務(wù)自由,他可以花數(shù)月時間折騰一套 GPU、燒毀設(shè)備再重來,完全沒有來自工作和收入的外部壓力。

OpenClaw 之父 Peter Steinberger 也有著類似的處境。他長期保持對新技術(shù)的深度探索,同樣是建立在早期創(chuàng)業(yè)變現(xiàn)所帶來的時間自由之上的。


一方面,AI 工具的門檻確實(shí)大幅降低,讓普通人得以以更低的門檻觸碰以前只有頂尖工程師才能涉足的領(lǐng)域;另一方面,真正能沉下心來深度學(xué)習(xí) AI、并將其轉(zhuǎn)化為生產(chǎn)力的人,往往還是少數(shù)人。

那么,對于沒有辦法辭職全職研究 AI 的普通人,這個時代究竟該怎么應(yīng)對?《華爾街日報(bào)》近期采訪了多位 AI 領(lǐng)域領(lǐng)導(dǎo)者,詢問他們對子女教育和職業(yè)規(guī)劃的建議,或許能提供一些參考。

Anthropic 聯(lián)合創(chuàng)始人 Daniela Amodei: 她認(rèn)為,AI 無法取代的,恰恰是人與人之間的連接能力,比如共情、溝通和善意。隨著 AI 在職場中越來越普遍,這些人類特質(zhì)反而會愈加珍貴。她甚至認(rèn)為,自己會引導(dǎo)孩子多社交,更深入地理解自己與他人相處的獨(dú)特方式。

賓夕法尼亞大學(xué)沃頓商學(xué)院教授 Ethan Mollick:需要整合多種技能的綜合型職業(yè),在 AI 時代反而更具韌性。以醫(yī)生為例,診斷只是工作的一部分,AI 或許能在某些環(huán)節(jié)上輔助甚至超越人類,但整體職業(yè)所需的判斷力、責(zé)任感和人際能力,并不會因此消失。

微軟首席科學(xué)家 Jaime Teevan:傳統(tǒng)文科教育在這個時代的價值,被嚴(yán)重低估。她還觀察到,與 AI 打交道已經(jīng)不再是確定性的指令輸入,而是基于自然語言的意圖表達(dá)和批判性提問,這與人文學(xué)科的訓(xùn)練高度契合。

這幾位處于 AI 行業(yè)核心位置的人,給出的建議卻不約而同地指向了一個反直覺的方向:在一個技術(shù)迭代極快的時代,真正的護(hù)城河不是最新的技術(shù)棧,而是那些慢變量,比如溝通、判斷、好奇心和接受失敗的能力。


包括 PewDiePie 也在視頻末尾分享了他最深的體會,他說自己在整個項(xiàng)目中學(xué)會了一件事:要預(yù)期失敗,甚至要擁抱失敗。他的模型在最終跑出 39.1% 之前,經(jīng)歷了無數(shù)次越訓(xùn)越差的循環(huán),每一次他都幾乎要放棄。

但正是這些失敗,讓他逐漸理解了 AI 訓(xùn)練的底層邏輯。他說,這種心態(tài)才是「能把你帶到遠(yuǎn)方的東西」。而這個道理,顯然不只適用于訓(xùn)練微調(diào) AI。

附上 YouTube 視頻地址:
https://www.youtube.com/watch?v=aV4j5pXLP-I

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
關(guān)于楊蘭蘭,我們可能永遠(yuǎn)不知道她是誰?很多帖子已被抹去

關(guān)于楊蘭蘭,我們可能永遠(yuǎn)不知道她是誰?很多帖子已被抹去

麥大人
2025-09-09 15:15:02
央視怒批,目不識丁、洋相百出,難怪兩會上馮遠(yuǎn)征建議演員多學(xué)習(xí)

央視怒批,目不識丁、洋相百出,難怪兩會上馮遠(yuǎn)征建議演員多學(xué)習(xí)

傲傲講歷史
2026-03-05 16:08:43
湖人打殘陣活塞也落下風(fēng)?兩輪換出戰(zhàn)成疑,主隊(duì)六將預(yù)計(jì)缺陣

湖人打殘陣活塞也落下風(fēng)?兩輪換出戰(zhàn)成疑,主隊(duì)六將預(yù)計(jì)缺陣

謝說籃球
2026-03-23 17:21:57
馬英九辭退蕭旭岑后續(xù),鄭麗文還原事情真相,金溥聰這回尷尬了!

馬英九辭退蕭旭岑后續(xù),鄭麗文還原事情真相,金溥聰這回尷尬了!

再戰(zhàn)五百回合
2026-03-23 22:59:50
女總裁天天讓我陪她去相親,有一次我實(shí)在受不了:別去了,我娶你

女總裁天天讓我陪她去相親,有一次我實(shí)在受不了:別去了,我娶你

千秋文化
2026-03-16 20:53:17
河南發(fā)布2026年清明節(jié)放假通知

河南發(fā)布2026年清明節(jié)放假通知

大象新聞
2026-03-23 19:53:05
嚴(yán)重財(cái)務(wù)造假!300344,退市!

嚴(yán)重財(cái)務(wù)造假!300344,退市!

中國基金報(bào)
2026-03-23 22:19:58
清明高速免費(fèi)3天已確定!但一壞消息傳來,車主看完心里發(fā)慌

清明高速免費(fèi)3天已確定!但一壞消息傳來,車主看完心里發(fā)慌

復(fù)轉(zhuǎn)這些年
2026-03-23 23:36:46
突發(fā)公告!百億富豪被立案調(diào)查,旗下公司市值曾破2000億元

突發(fā)公告!百億富豪被立案調(diào)查,旗下公司市值曾破2000億元

深圳晚報(bào)
2026-03-23 12:17:55
周琦8罰0中,難怪郭士強(qiáng)不敢用他,難怪范志毅挖苦他

周琦8罰0中,難怪郭士強(qiáng)不敢用他,難怪范志毅挖苦他

章民解說體育
2026-03-24 01:27:10
新加坡媒體:以色列很快將被夷為平地!

新加坡媒體:以色列很快將被夷為平地!

南權(quán)先生
2026-03-23 15:13:20
急了!寧愿讓臺灣島成為一個空島,也要實(shí)現(xiàn)祖國完全統(tǒng)一

急了!寧愿讓臺灣島成為一個空島,也要實(shí)現(xiàn)祖國完全統(tǒng)一

聞香閣
2026-01-27 13:53:07
朝鮮戰(zhàn)爭中,美軍原本已接近勝利,卻碰上了這位中國決死的師長

朝鮮戰(zhàn)爭中,美軍原本已接近勝利,卻碰上了這位中國決死的師長

興趣知識
2026-03-18 18:41:04
張凌赫爆火并非偶然,徐以若保駕護(hù)航,背后藏著內(nèi)娛圈層生存鐵律

張凌赫爆火并非偶然,徐以若保駕護(hù)航,背后藏著內(nèi)娛圈層生存鐵律

子夜觀綜記
2026-03-23 20:46:25
浙江一女主播稱“家里資產(chǎn)四個億”!訂婚3年收50多萬彩禮,男友落淚:懷疑岳父岳母是假的……

浙江一女主播稱“家里資產(chǎn)四個億”!訂婚3年收50多萬彩禮,男友落淚:懷疑岳父岳母是假的……

臺州交通廣播
2026-03-24 00:27:02
捷克布拉格或爆發(fā)大規(guī)模抗議!超40萬人走上街頭

捷克布拉格或爆發(fā)大規(guī)模抗議!超40萬人走上街頭

項(xiàng)鵬飛
2026-03-22 20:12:16
大媽幫鄰居接娃3年,這天大媽生病借4000被拒,隔天大媽家門被堵

大媽幫鄰居接娃3年,這天大媽生病借4000被拒,隔天大媽家門被堵

溫情郵局
2025-11-22 10:27:14
僅差800萬美元,《鏢人》就是全球第一,我感慨:袁和平重回巔峰

僅差800萬美元,《鏢人》就是全球第一,我感慨:袁和平重回巔峰

白公子探劇
2026-03-21 19:10:35
貝森特:50天戰(zhàn)爭解決50年,伊朗威脅斷海底電纜,金銀A股大跌

貝森特:50天戰(zhàn)爭解決50年,伊朗威脅斷海底電纜,金銀A股大跌

丁辰靈
2026-03-23 19:52:48
張?zhí)m罕見談及大S,泣不成聲,她的哭律師再發(fā)文,內(nèi)涵徐家

張?zhí)m罕見談及大S,泣不成聲,她的哭律師再發(fā)文,內(nèi)涵徐家

生命之泉的奧秘
2026-03-23 17:15:55
2026-03-24 03:52:49
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
6214文章數(shù) 26797關(guān)注度
往期回顧 全部

科技要聞

裁掉2萬多名員工后,扎克伯格對自己下手了

頭條要聞

特朗普:伊朗還有最后一次機(jī)會

頭條要聞

特朗普:伊朗還有最后一次機(jī)會

體育要聞

不敢放手一搏,你拿什么去爭冠?

娛樂要聞

鐘麗緹就女兒考拉爭議道歉:女兒還小

財(cái)經(jīng)要聞

市場見底了嗎?誰在拋售?機(jī)構(gòu)火線解讀

汽車要聞

東風(fēng)雪鐵龍新凡爾賽C5X上市 官方一口價11.37萬起

態(tài)度原創(chuàng)

教育
親子
本地
健康
軍事航空

教育要聞

高三學(xué)生對教材中 “受精作用” 表述提意見,人教社回信

親子要聞

牛奶引起咳嗽,真正原因是什么?好多小孩,喝奶粉容易咳嗽,這是為啥

本地新聞

這里是寶雞 嫽滴很!

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

軍事要聞

伊朗回應(yīng)美方威脅:將在戰(zhàn)場上堅(jiān)決對抗

無障礙瀏覽 進(jìn)入關(guān)懷版