337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

ChatGPT本來要5天后關掉

0
分享至

"發ChatGPT只是為了看看能不能收集一些真實的用戶數據。我們預期可能一開始有1萬2萬用戶,然后慢慢跌回去,5天之后沒人了就關掉。"

這是翁家翌在一期播客里說的。
他是誰?從GPT-3.5、GPT-4、GPT-4o到GPT-5,每一個OpenAI大模型發布,貢獻者名單里都有他的名字。他在OpenAI內部搭建了整個后訓練階段的強化學習基礎設施——簡單說,就是讓GPT從"會說話"變成"聰明好用"的那套系統。

2022年11月30日,ChatGPT上線。

結果不是慢慢跌回去,是指數增長,服務器被打爆好幾次。

"我當時在歐洲開會,發現周圍所有人都在討論ChatGPT。"

但他自己一開始并不覺得這東西有多厲害。

"我第一次用可能會覺得,哦,這是個會說話的模型,也就這樣吧。用了幾次發現能幫我解決一點代碼問題,但也不能幫我解決那么多。"

因為他提前接觸了,有個循序漸進的過程,所以不覺得它多突然。但對外面的人來說,這是一個巨大的沖擊。

"這是我沒想到的。"

現在回頭看,ChatGPT的成功有很大的偶然性。如果當時真的沒人用,可能就關掉了。

這期播客兩個多小時,我從頭看到尾。翁家翌講了很多OpenAI內部的事情,有些挺顛覆認知的。

GPT-4的強化學習是比GPT-3.5先調通的。

"3.5當時用的是舊的基礎設施,新的是2022年8月剛好。我先在新的上面調通了第一版PPO,用的是GPT-4。"

所以技術時間線和產品發布時間線是兩回事。外面的人以為3.5先做出來,4是升級版。實際上后訓練這塊,4先跑通的。

OpenAI的模型為什么比別人強?有什么黑魔法嗎?

"沒有黑魔法。每家的基礎設施都有不同程度的bug,誰修bug越多,誰的模型訓得就越好。"

他甚至說:"算法連改都不用改,把bug全修了就很好。"

這話聽起來有點反直覺。大家總覺得OpenAI一定有什么秘密武器,什么獨家算法。結果核心競爭力是"修bug修得多"。

怎么知道訓出來的模型是好的?有什么客觀指標嗎?

"沒有。最后就是你真的拉下來看一看,跟它交互幾次,多找幾個人來投票。"

就這么樸素。

2024年,DeepSeek崛起,OpenAI內部緊張了一波。

但緊張的原因不是很多人以為的"榜單被超了"。

"我們很長時間以來都沒有為了刷榜做什么事情。我們真正在意的是迭代速度。DeepSeek聲稱他們的迭代速度非???,這個引起了很多人的警覺。"

在這個行業,迭代速度就是生死線。單位時間內能跑多少次實驗、能驗證多少個idea,決定了你能走多遠。

"內部的迭代速度其實相比于一些小團隊是有點慢的。組織大了就是這樣。"

OpenAI從翁家翌入職時的280人,漲到了現在的3000多人。組織大了,context sharing就難了,代碼庫開始臃腫,迭代速度自然會掉下來。

他還提到一個細節:DeepSeek出來之后,John Schulman(OpenAI聯合創始人,PPO算法發明者)問過他,要不要把強化學習的基礎設施開源。

"我當時覺得不太好吧,為了公司的考量。但他確實問了我這個事。"

那這個人是怎么進OpenAI的?

說出來可能會讓一些人感到安慰:他不是傳統意義上的天才。

NOI(全國信息學奧林匹克競賽)拿的是銅牌,福建省隊倒數第一,其他人全是銀牌以上。高考面臨兩個選擇:簽上海交大本一線錄取,穩了;或者簽清華降60分,但萬一發揮失常呢?

他選了清華。

"當時對這種不確定性非常害怕,但想了想,我應該也沒那么差吧。"

后來申請美國讀博,圖靈獎得主Yoshua Bengio的推薦信,結果PhD全拒,只拿到CMU的碩士。

"當時還是有點失望的。整個清華內部的氛圍就是PhD比master好,這個鄙視鏈你身在其中很難擺脫。"

但他很快想通了。

"如果你想進工業界,那讀PhD就是浪費生命。"

他有一套自己的評價體系。

導師跟他說過:計算機系的評價標準有三個——論文、比賽、GitHub star三位數以上。

"這給了我一個完全不一樣的想法。我可以在開源社區搞一些事情,讓自己跟別人不一樣。而不是花很多時間去刷GPA。"

GPA他怎么處理的?

"最低限度投入。算一下期末考之前已經多少分了,夠用就行,多一分都不想花時間。"

他在清華干了一件讓學長學姐不太高興的事:把自己收集到的所有作業、資料、上古材料,全部在GitHub上開源了。

"你現在隨便抓個計算機系的學弟問,認不認識翁家翌,應該認識。因為大家都看我的作業活的。"

為什么要這么做?

"我覺得應該打破信息差。信息差在清華是個很有用的東西,但我覺得每個人都應該平等地擁有這個信息。"

大二他進了朱軍老師的實驗室做強化學習。第一個項目是用神經網絡通關一個90年代的射擊游戲Doom,拿了比賽冠軍。

但他不享受做研究的過程。

"環境太單一了,你要瘋狂overfit。用各種技巧防止訓練崩了,即使沒崩你也不知道怎么調參才能調對。這個比CV難十倍一百倍,全是玄學。"

他發現自己對調參這件事有生理上的排斥。但他擅長另一件事:寫代碼、重構代碼、讓代碼更好用。

"我就想,與其自己去卷這些調參的事,不如造一套工具,讓想卷的人更方便地卷。"

2020年疫情期間,他在家花兩周時間寫了一個開源的強化學習框架叫天授(Tianshou)。

為什么只要兩周?

"如果你把抽象搞對的話,一個算法可能就20行代碼不到。"

他看過當時最流行的RLlib,幾十萬行代碼,太復雜了。所以他推倒重來,自己從頭寫。

"代碼最重要的是一致性。如果從頭到尾都是一個人寫的,那肯定是一致的。"

同期他還做了一個簽證查詢網站叫退學online。疫情期間美國領事館開開關關,留學生需要實時知道哪里能約到簽證。他自己有這個需求,就順手寫了個爬蟲開源出去。后來點擊量超過1000萬。

這兩個項目都不是為了發論文、不是為了申請。

"我想做一些能夠產生影響力的事情,哪怕虧錢也行。"

2022年找工作的時候,他手上有幾個offer:幻方(后來的DeepSeek)、OpenAI、英偉達。

他選了OpenAI。當時ChatGPT還沒發布,OpenAI在很多人眼里只是一個做強化學習研究的實驗室。

面試他的是John Schulman。

"他說我的GitHub非常漂亮。"

最后一輪面試,Schulman出了一道很開放的題,給三個小時。翁家翌兩個小時就做完了。

"這道題他只給兩個人測過,一個是我,另一個是后來做Codex的那個人。我們都通過了。"

他后來總結了一句話:

"教一個researcher如何做好engineering,要遠比教一個engineer如何做好research來的難。"

現在的AI行業,idea不值錢。值錢的是單位時間內你能驗證多少個idea、能正確地迭代多少次。這取決于工程能力。

"你找個有研究直覺的人討論一下,idea就出來了。但你能不能把基礎設施搭對、能不能快速迭代,這個是稀缺的。"

播客里還聊到一個問題:OpenAI做的東西,外面的人能復刻嗎?

"你可以這么認為。其實就是把最簡單的東西做好就好了,沒有什么黑魔法。"

他甚至說:OpenAI現在沒有誰是不可替代的。

"一個健康的組織是所有人都可以替代的。你只要能夠持續培養新人,有造血能力,讓組織正常運轉就可以了。"

走了很多人?沒關系,可以再培養。

"哪怕雖然走了很多人,但是還是可以花一些時間精力,然后再培養一波新人,持續的造血,相當于干細胞一樣。"

訪談最后,主持人問他怎么定義AGI。

"OpenAI內部有個笑話,你抓15個人,可能有20種定義AGI的方法。"

他自己的定義是:如果能完成80-90%他認為有意義的任務,那就是AGI了。

"目前還沒有。我還是不放心讓它直接改我的代碼。"

但他很確定AGI會來。

"AGI是板上釘釘的事了。"

他還講了一個內部故事:o1模型剛出來的時候,內部很多人都覺得"我的工作要被取代了"。

"我們甚至想說,那就寫一堆屎山吧,反正以后AI會幫我們清理。"

結果呢?

"一兩年過去了,屎山還在。每個人都會過度反應,覺得技術來了我們要怎么怎么樣,但實際上它是一個很慢很慢的循序漸進的過程。"

主持人最后讓他留一段話。

他說:

"我曾經想通了我想要什么,但現在又想不通了。這個問題值得一生去思考。"

一個95后,站在AI風暴的中心,相信AGI即將到來,但說自己"又想不通了"。

這可能是最真實的狀態。

視頻來源:WhynotTV Podcast

B站:https://www.bilibili.com/video/BV1darmBcE4A/

YouTube:https://www.youtube.com/watch?v=I0DrcsDf3Os

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
闊別國家隊10個月 全紅嬋并未退役:是我主動離開的 因無法堅持了

闊別國家隊10個月 全紅嬋并未退役:是我主動離開的 因無法堅持了

風過鄉
2026-03-30 12:52:06
歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

西樓知趣雜談
2026-03-24 14:38:30
廣東早報!焦泊喬卷入交易流言,朱芳雨暫停簽大外,杜鋒深夜發聲

廣東早報!焦泊喬卷入交易流言,朱芳雨暫停簽大外,杜鋒深夜發聲

多特體育說
2026-03-30 09:34:47
美軍閃電航母進入戰區,但對伊朗作戰暫時不可能有變化!

美軍閃電航母進入戰區,但對伊朗作戰暫時不可能有變化!

新民周刊
2026-03-30 09:11:21
電池不耐用,2026 年 iPhone14系列能趕上換電池399活動嗎?

電池不耐用,2026 年 iPhone14系列能趕上換電池399活動嗎?

朱笑川
2026-03-28 21:35:18
WTT挑戰賽!首冠誕生,男單爆大冷,世界冠軍0-3慘敗,日本爭2冠

WTT挑戰賽!首冠誕生,男單爆大冷,世界冠軍0-3慘敗,日本爭2冠

帛河體育
2026-03-29 21:38:17
萬科12位高管被調查

萬科12位高管被調查

地產微資訊
2026-03-28 11:17:12
31-0!史上最長0封一大波高潮!狂屠52分出了炮影!

31-0!史上最長0封一大波高潮!狂屠52分出了炮影!

貴圈真亂
2026-03-30 10:49:47
海航最美空姐撿的是水,打的是所有航司官媒的臉

海航最美空姐撿的是水,打的是所有航司官媒的臉

民航大腦殼
2026-03-30 08:05:54
你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
強勢切入,巴基斯坦單艦闖入中東交戰區,中國造戰艦硬剛全場

強勢切入,巴基斯坦單艦闖入中東交戰區,中國造戰艦硬剛全場

知識TNT
2026-03-30 12:19:39
外交部:堅決反對美臺官方往來 已向美方提出嚴正交涉

外交部:堅決反對美臺官方往來 已向美方提出嚴正交涉

新京報
2026-03-30 15:41:10
“和平統一”4字不再出現!臺灣島內馬上預感到,統一進入倒計時

“和平統一”4字不再出現!臺灣島內馬上預感到,統一進入倒計時

軒逸阿II
2026-03-29 11:24:05
美國如果發動地面戰,本次戰事軍費或突破10萬億美元,“可能導致美國陷入經濟衰退等風險”

美國如果發動地面戰,本次戰事軍費或突破10萬億美元,“可能導致美國陷入經濟衰退等風險”

都市快報橙柿互動
2026-03-30 13:49:54
曝托納利提出加盟曼聯條件!不會為轉會施壓紐卡,最少也要7000萬

曝托納利提出加盟曼聯條件!不會為轉會施壓紐卡,最少也要7000萬

羅米的曼聯博客
2026-03-30 11:45:33
老周強奸殯儀館女尸,竟然救了女尸一命,他的結局如何?

老周強奸殯儀館女尸,竟然救了女尸一命,他的結局如何?

李蘇章
2026-03-29 08:15:29
界面調查|一位“90后”網約車司機之死:被騙網貸、被催債和致命的絕望

界面調查|一位“90后”網約車司機之死:被騙網貸、被催債和致命的絕望

界面新聞
2026-03-29 10:33:24
美國安插在中國多年的間諜頭子,居然是人人都想送錦旗的大善人。

美國安插在中國多年的間諜頭子,居然是人人都想送錦旗的大善人。

阿七說史
2026-03-26 15:52:30
中超重啟!上海海港對云南玉昆,浙江迎戰重慶銅梁龍,央視播2場

中超重啟!上海海港對云南玉昆,浙江迎戰重慶銅梁龍,央視播2場

實事球是
2026-03-30 07:54:52
“直接崩了,一天掉了一百多元!”有人瘋狂拋售,國際巨頭接連發布新技術……格局將被改變?

“直接崩了,一天掉了一百多元!”有人瘋狂拋售,國際巨頭接連發布新技術……格局將被改變?

都市快報橙柿互動
2026-03-29 12:26:05
2026-03-30 17:32:49
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發者
169文章數 83關注度
往期回顧 全部

科技要聞

DeepSeek性能異常問題已解決,服務恢復

頭條要聞

單套最低5400萬 北京豪宅暴雷幾十戶業主辦不了房產證

頭條要聞

單套最低5400萬 北京豪宅暴雷幾十戶業主辦不了房產證

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

油價沖擊,有些亞洲貨幣先扛不住了!

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

旅游
親子
本地
游戲
公開課

旅游要聞

赴泰旅游價格或上漲,泰國擬向外國游客收300泰銖

親子要聞

別再給孩子吃這3種“假早餐”,越吃越沒精神

本地新聞

用Color Walk的方式解鎖城市春日

白天撿垃圾、晚上守家的多人肉鴿!《佩布爾騎士》發售信息公布!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版