![]()
前特斯拉AI總監Andrej Karpathy最近干了一件事——他把1小時的LLM入門課扔上YouTube,結果程序員圈子的反應像是被按了刷新鍵。這堂課沒有公式轟炸,沒有論文堆疊,只有一個產品經理式的追問:這東西到底怎么工作的?
Karpathy的解法很刁鉆。他把大語言模型比作一個"被壓縮的互聯網"——不是比喻修辭,而是字面意義上的壓縮。GPT-4的訓練過程,本質上是把人類公開文字塞進一個文件,然后讓這個文件學會解壓出合理的內容。「編程正在從工程變成手藝活」,他在視頻里甩出這句話,背景是Cursor和Copilot正在吃掉初級碼農的飯碗。
![]()
這種類比的危險之處在于,它太好懂了。好懂到讓人忽略背后的殘酷:當模型能把Stack Overflow的解決方案"解壓"出來,調試bug的能力反而成了稀缺品。Karpathy沒有明說的是,手藝活的代價是——你得先成為那個被壓縮進模型的人。
視頻發布48小時后,Hacker News的熱評已經換了幾輪。有人算了一筆賬:1小時的內容,相當于省下了讀20篇論文的時間。但更多人卡在同一個地方——看完覺得自己懂了,打開IDE又懵了。這種"懂了的幻覺",恰恰是Karpathy設計的鉤子。
課程結尾留了一個彩蛋。他放了一段GPT-4生成代碼的錄屏,然后暫停,問觀眾:你看出bug了嗎?評論區至今沒人敢確定答案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.