網易首頁 > 網易號 > 正文申請入駐

GLM-5.1上線，媲美最強編程大模型！

2026-04-03 08:59:41　來源: 碼農翻身

河南舉報

分享至

智譜直接在用戶社群里宣布：Coding Plan全體用戶即刻用上最新旗艦GLM-5.1。

有意思的是，這次更新很“DeepSeek”：不放benchmark，不放跑分，直接把模型推給用戶，用體驗來說服用戶，智譜這次在技術上非常有自信啊！

GLM-5.1最大的特點就是Long Horizon的巨大升級，什么是Long Horizon？

Long Horizon= 在長時間、多步驟、不確定環境下，持續推進并最終完成目標的能力。

更通俗地說就是任務的時間被拉長，它不是寫一個函數或者回答一個問題，馬上就能結束，而是持續幾小時 / 幾天 / 幾周，分階段不斷推進。

更關鍵的是，任務不是固定流程，可能中途會發生變化，例如出現需求變了，用戶反饋不好，需要對原來的設計進行大規模修改，這就要求模型能記住過去干了什么事情，不能從零開始。

咱們程序員一看就明白， Long Horizon Task（長程任務）其實就是咱們日常開發經常面對的情況，如果GLM-5.1把這個搞定了，程序員們堅守的陣地，可以說是又被AI攻陷了一塊兒。

挑戰GLM-5.1

我決定找個項目測試一下，這個項目如果是爛大街的簡單項目，簡單邏輯，別家的模型也能做，根本就測不出來GLM-5.1的能力。

思來想去，我想讓它實現一個簡版的SQLite數據庫，因為它涉及到手寫Tokenizer，Parser，AST表達式，事務實現、B+Tree......是非常復雜的。

由于功能很多，任務分成了9輪：

第1輪：存儲底座(KV +持久化）

第2輪：引入表結構(Table)

第3輪：查詢能力（Select）

第4輪：DDL

第5輪：實現DML：Insert, Update ,Delete

第6輪：實現事務

第7輪：對外提供簡單的API接口

第8輪：把底層存儲替換成BTree

第9輪：實現按列select，order by

值得注意的是，在第8輪我給GLM-5.1設置了一個陷阱，讓它把第一輪的存儲底座給改掉，相當于大廈已經蓋好了，然后把地基干掉重來。

這個挑戰是相當大的，如果GLM-5.1不記得之前的工作，肯定實現不了，如果第一輪GLM-5.1寫代碼的時候，耦合度太高，換地基的時候樓恐怕就要塌了。

系好安全帶，出發！

首先，我在Claude 中配置使用GLM-5.1 :

然后告訴GLM-5.1一些必須遵守的規矩，特別值得一提的是，一定要有測試，并且確保所有測試都通過。

你正在使用Go語言逐步構建一個簡化版 SQLite 數據庫系統，名稱叫做MiniSQL。

我會告訴你每一輪都做什么事情，要求如下：

1. 每一輪只能在上一輪基礎上擴展，不得破壞已有功能

2. 每一輪必須提供：

- 完整可運行代碼

- 測試代碼

3. 所有舊測試必須繼續通過（回歸測試）

4. 代碼必須保持單文件或明確模塊結構

5. 不允許使用第三方數據庫庫（可以用標準庫）

第1輪：存儲底座

先從最底部的存儲層開始：

你現在要設計一個極簡數據庫的第一版存儲層。

要求：

- 實現一個最簡單的 Key-Value 存儲系統

- 支持 set(key, value), get(key), delete(key)

- 數據必須持久化到本地文件（不能只在內存）

- 重啟程序后數據必須能恢復

約束：

- 不允許使用現成數據庫

- 可以自由選擇文件格式（JSON / text / binary）

輸出要求：

- 給出整體設計，解釋存儲結構，寫入Design.md

- 給出代碼實現（注意要有測試代碼）

GLM5.1很快寫出了實現代碼，測試代碼。

文檔也寫得非常完善：

第2輪：引入表結構（Table）

現在要支持關系型表結構：

功能：

- 可以創建一張表（比如 users，包含 id、name，age 兩個字段）

- 可以往表里插入一條數據（比如一行用戶信息）

- 可以讀取一張表里的所有數據

要求：

- 在現有存儲系統上實現（不能重新設計存儲層）

- 設計 schema 管理方式

- KV 存儲必須繼續作為底層持久化方式

輸出：

- 修改后的系統架構design.md

- 如何映射 table → KV

- 實現代碼（包括測試代碼）

這一輪寫出的代碼如下：

第3~5輪：支持SQL

這幾輪主要用來實現SQL，包括DDL和DML，SQL例子如下：

- CREATE TABLE users ( id INTEGER PRIMARY KEY, name TEXT, age INTEGER);

- DROP TABLE users;

- SELECT * FROM users

- SELECT * FROM users WHERE age = 20

- SELECT * FROM users WHERE age > 18 AND name = "Alice"

- INSERT INTO users VALUES (1, 'Alice', 20);

- UPDATE users SET name = 'Alicia' WHERE id = 1;

- DELETE FROM users;

- DELETE FROM users WHERE id = 2;

雖然這些實現很重要，由于細節很多，我這里不再詳細描述，大家可以看看GLM-5.1寫的技術文檔，相當不錯：

另外，這三輪的工作量很大，一共耗時15m38s + 20m59s + 11m38s = 48分15秒，我拿著手機都看了一集甄嬛傳了。

第6輪：支持事務

這絕對是重頭戲了，一個關系數據庫如果不支持事務就是一個玩具了，所以我讓它用用WAL來實現數據庫的可靠性和事務。

使用WAL（Write-Ahead Log）實現事務支持，讓數據庫具備兩件能力：不會因為崩潰丟數據（可靠性），一組操作要么全成功，要么全失敗（事務）

1.WAL（寫日志）

所有“寫操作”都必須先寫日志，再真正修改數據。

寫操作包括：插入更新刪除

2.崩潰恢復

程序重啟時：

- 讀取日志

- 把“已提交”的操作重新執行

- 忽略“未完成”的操作

3.事務

支持三個操作：

- BEGIN（開始一組操作）

- COMMIT（提交這一組操作）

- ROLLBACK（撤銷這一組操作）

規則：

- BEGIN 后的操作暫時不生效

- COMMIT 后才真正生效

- ROLLBACK 直接取消

輸出：

- 事務處理方案，寫入到transction.md中

- 代碼實現（包括測試代碼）

這次改動相當大，又耗費了近40分鐘。

第7輪對外提供簡單接口

這一輪相當于做一個包裝，方便對外使用，這里模擬了SQLite的API

對外提供一個簡單數據庫接口，讓用戶像用 SQLite 一樣使用：

示例：

(1)打開數據庫：db, err := Open("test.db")

如果test.db文件不存在，則創建出來。

(2)執行SQL:

db.Execute("INSERT INTO users VALUES (1, 'Alice', 20)")

db.Execute("UPDATE users SET age = 21 WHERE id = 1")

db.Execute("DELETE FROM users WHERE id = 1")

(3)查詢數據：

rows := db.Query("SELECT * FROM users")

for rs.Next() {

row := rs.Row()

fmt.Println(row)

(4) 事務支持：

db.Begin()

db.Execute("INSERT INTO users VALUES (2, 'Bob', 25)")

db.Commit()

db.Begin()

db.Execute("INSERT INTO users VALUES (3, 'Tom', 30)")

db.Rollback()

看到這些API，你可能會感受到做系統開發的特點：沒有漂亮的界面，看到的全是API接口。

雖然代碼看起來很復雜，但是執行起來卻是最簡單的，畢竟只是一層封裝而已，10分鐘不到就搞定。

第8輪替換底層存儲引擎

終于到了我最喜歡的挖坑環節，把它的地基替換了，看看GLM-5.1會不會崩掉。

將底層的KV存儲替換成為 B+Tree 索引結構，要求：

支持有序存儲 key

支持范圍查詢（Range Scan）

允許節點分裂與合并

保持基本 KV 接口不變（向上兼容）

這次GLM-5.1耗時很久，用了長達47分鐘，表現很穩，不但沒有崩潰，反而又是一次通過。

我并沒有在提示詞中讓它修改設計文檔，它也聰明地修改了：

第9輪：再加一點兒需求

把第三輪沒有實現的部分功能讓GLM-5.1實現了，考察它是不是還記得之前的任務。

（1）現在只支持select * from users這樣的語法，需要改成可以按列來選擇，例如:select id ,name ,age from users

（2）需要支持order by 語句例如：select id ,name ,age from users order by age desc

經歷了第8輪的考驗，第9輪對GLM-5.1來說沒有任何挑戰，我就不展開了。

感想

其實這還是一個簡單的數據庫，還有好多特性可以加上去，但是對測試而言，這條路已經走了足夠遠了。

從下午1點到5點半，我經常是一邊看手機，一邊等他做完。

這四個多小時，Token的使用量也非常巨大，達到了一千七百多萬：17,062,578，幸虧有智譜的Coding Plan套餐，要不然我就“破產”了。

在整個長程任務執行的過程中，GLM-5.1給我印象最深刻的就是一個字：穩。

每次我提出需求，GLM-5.1寫出的代碼經常是一次就通過測試，很少失敗，讓我很驚訝。

還有就是無論我如何拷打它，挑戰它，給他挖坑，它始終能瞄準最終目標來修改代碼，表現非常穩健。

要知道像數據庫這樣的系統級軟件，比一般的項目邏輯要復雜得多，GLM-5.1能夠輕松應對數據庫，寫其他軟件（Web應用、桌面應用、工具等）自然是不在話下。

GLM-5.1 在項目級Long Horizon任務的表現，簡直就是一個有經驗的中高級程序員，非常讓人放心，以后應該是我的主力編程大模型了。

不過，看到GLM-5.1這么強，我也有點兒擔憂：程序員們能干的事情真是越來越少了！

但這也沒辦法，這是大勢所趨，我們還是多往軟件生命周期的兩端（產品定義和產品營銷）多走一走吧，選什么東西做，判斷什么是對的，如何推向市場，這將會變成新的護城河。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Cursor 3來了！一句話讓所有Agent一起干活

智東西 2026-04-04 21:41:48
2 跟貼 2
谷歌開源Gemma 4，干掉了13倍體量的Qwen3.5

機器之心Pro 2026-04-03 18:12:51
195 跟貼 195

別光罵Oracle冷血：這封裁員信，給所有老板和HR敲響了警鐘

虎嗅APP 2026-04-04 00:44:15
15 跟貼 15

浪潮信息直播發布業界企業級OpenClaw方案“企千蝦”！

量子位 2026-04-03 22:17:07
0 跟貼 0
大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0

卡帕西都整破防了：AI Coding沒門檻，可部署環節真嗯啊的難

量子位 2026-03-27 12:12:46
0 跟貼 0

程序員反治公司就這么簡單

美美剪影 2026-04-03 15:58:39
1 跟貼 1
價值歸零！Django創始人警告：30歲程序員受AI沖擊最大

量子位 2026-04-04 13:23:56
7 跟貼 7

平均壽命最長的五種職業！

游戲星GameStar 2026-04-03 06:08:38
0 跟貼 0
國產大模型：這次劇本不一樣

經濟觀察報 2026-04-04 13:16:04
9 跟貼 9
拒絕伊朗地面戰？陸軍參謀長被解職，特朗普需要軍方的“自己人”

上觀新聞 2026-04-04 05:10:15
3263 跟貼 3263
工程師測試過程中，機器人突然發動攻擊，起初以為是編程錯誤！

星火幽默館 2026-04-04 14:17:21
1 跟貼 1
火車上拍到的一幕，兩個女人拿著秘密文件，去蹲著研究去了

房東生活看看 2026-04-04 13:55:39
0 跟貼 0
破紀錄！超越日本只是開始

中國新聞周刊 2026-04-04 16:15:41
3504 跟貼 3504
遼寧男籃又要啟動換帥程序了？烏戈用人引質疑！末節戰術安排崩盤

國足未贏夠 2026-04-04 08:10:22
0 跟貼 0
瘋狂的Skill

機器之心Pro 2026-04-04 16:27:35
3 跟貼 3
女子在列車上沉浸式唱歌，乘警在旁無奈欣賞

南陽日報 2026-04-04 19:42:16
256 跟貼 256
35歲數學家王虹再傳喜訊：獲紐約大學最高榮譽，成為該校“銀教授”

極目新聞 2026-04-04 16:28:10
4895 跟貼 4895
這黑社會不砍人改敲代碼，霆哥帶路玩真大

二虎撩劇 2026-04-04 09:47:12
1 跟貼 1
奧特曼親自揭曉：為什么關停Sora、五角大樓封禁Claude幕后

新智元 2026-04-04 20:02:54
0 跟貼 0
釘釘發布DeepResearch多智能體框架，已在真實企業部署

機器之心Pro 2025-11-12 13:06:22
2 跟貼 2
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
男子名字太特別，警察：若不改名，全國人口信息系統就得徹底更改

青梅侃史啊 2026-04-04 15:03:07
4 跟貼 4
男子研究生畢業，稱自己白天送外賣，晚上寫代碼

歡趣突襲 2026-04-03 15:18:08
2 跟貼 2
徐州“公廁版瑞幸”火出圈，景區工作人員回應：曾是游客服務點而非公廁

現代快報 2026-04-04 15:00:11
1008 跟貼 1008
美國程序員就業暴跌27%,中國AI崗卻缺500萬人：計算機到底報不報

Delete丨CC 2026-04-04 18:37:12
7 跟貼 7
師傅和徒弟的編程對比，你能看出區別嗎

萌趣日記 2026-04-02 18:41:20
1 跟貼 1
AI視頻制作完整工作流｜軟件+思路+輸出流程詳解

AI次世代 2026-04-03 14:57:24
0 跟貼 0
Meta-Harness讓Haiku性能狂飆，甚至追平Opus！

新智元 2026-04-04 20:02:38
0 跟貼 0
成都程序員手搓舉報系統上線，一鍵識別車牌位置違法信息

重慶熱點 2026-04-02 13:24:48
0 跟貼 0
奧特曼預言與現實相差幾何？12個頂級模型“創業”一年，僅3個存活

鈦媒體APP 2026-04-03 17:11:08
1 跟貼 1
惹誰都別惹程序員，這句話絕對不是說說而已！

劇坐家花花 2026-04-02 02:12:22
0 跟貼 0
有線耳機被淘汰快10年突然翻紅，銷量暴漲20%，“有的上架三天被搶空”

環球網資訊 2026-04-02 08:50:30
1726 跟貼 1726
不懂代碼的家長，也能用AI帶娃彎道超車！

沖浪少女楊美麗 2026-04-01 20:27:12
0 跟貼 0
突增！很多武漢人前去檢查！不少都是年輕人

極目新聞 2026-04-04 21:19:13
43 跟貼 43
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
知名連鎖餐飲門口宣傳板寫“3元自助早餐”，兩人買單45元被告知“僅粥飲自助”

新聞晨報隨申Hi 2026-04-02 18:36:05
887 跟貼 887
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
我畢業 6 年了

程序員魚皮 2026-04-04 11:37:44
0 跟貼 0
企業玩不轉龍蝦，是人的思維出錯了

量子位 2026-04-03 16:38:28
1 跟貼 1

尼日利亞發生大規模綁架事件超150人被綁架

財聯社

2026-04-05 03:43:07

全力營救F-15飛行員，川普不一樣，誰制造了美軍神話？

移光幻影

2026-04-04 13:26:02

隨著拜仁3-2，勒沃庫森6-3，美因茨2-1，德甲最新積分榜出爐

側身凌空斬

2026-04-05 00:24:18

伊朗：霍爾木茲海峽收費分5級年收超千億美元！

新浪財經

2026-04-04 13:31:15

四川大學砍掉39個本科專業

第一財經資訊

2026-04-03 20:33:57

1982年血色使館：中國外交官唐健生為了生存殺光了所有同事

阿校談史

2026-03-20 11:03:27

國家一級女演員陳麗云被逮捕！

許三歲

2026-03-28 09:24:30

大結局要來了！伊朗憋了一個月的大招，終于放出來！不是核彈，卻比核彈還狠！

喀秋莎大世界

2026-04-03 22:17:35

火不過半年！網紅城市輪番登場又涼涼，到底缺了啥硬實力？

青眼財經

2026-04-03 23:08:35

臺灣老兵帶妻子回大陸見原配，苦等50年相談1小時，原配：無話說

云霄紀史觀

2026-04-03 16:15:36

伊朗布什爾核電站再遭襲，伊朗發動第94波打擊；以軍稱伊朗發射集束彈頭導彈，擊中以中部多地致住宅受損

每日經濟新聞

2026-04-04 20:41:57

抽簽后摩根曾說阿森納抽到好簽，被南安普頓官方“挖墳”

懂球帝

2026-04-05 06:53:42

1985年王景清探監江青，江青淡淡地說了句：李銀橋夫婦辦了件好事

鑒史錄

2026-04-02 01:50:03

上海交通大學，宣布任免

雙一流高校

2026-04-05 00:10:52

霍英東二太馮堅妮95歲壽辰，四世同堂享福壽

風信子的花

2026-04-04 22:29:56

美軍伊戰以來最落魄的24小時：“攻擊鷹”和“疣豬”墜毀，“黑鷹”受傷

紅星新聞

2026-04-04 13:19:21

比“缺芯”還嚴重？90%市場被美日壟斷，中國連山寨版都造不出！

南權先生

2026-04-04 05:15:03

皇馬輸球元兇找到了！3 大核心集體擺爛，巨星親手送球隊翻車

奶蓋熊本熊

2026-04-05 03:21:05

小寶與王某雷，誰探訪花的數量更多？

挪威森林

2026-01-31 12:15:26

拉鋸戰觸發特殊賽制！王曼昱4-2力克日本削球名將晉級世界杯四強

小徐講八卦

2026-04-05 06:04:32

碼農翻身

有趣且硬核的技術文章

245文章數 641關注度

往期回顧全部

科技要聞

內存一年漲四倍！國產手機廠商集體漲價

頭條要聞

特朗普發布視頻宣稱“打死多名伊朗軍事領導人”

頭條要聞

特朗普發布視頻宣稱“打死多名伊朗軍事領導人”

體育要聞

剎不住的泰格·伍茲，口袋里的兩粒藥丸

娛樂要聞

Q女士反擊，否認逼宋寧峰張婉婷離婚

財經要聞

中微董事長，給半導體潑點冷水

汽車要聞

17萬級海豹07EV 不僅續航長還有9分鐘滿電的快樂

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

藝術

本地

公開課

軍事航空

家居要聞

藝術要聞

周恩來唯一草書題碑，8個字快一半都不認識！

本地新聞

跟著歌聲游安徽，聽古村回響

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

GLM-5.1上線， 媲美最強編程大模型！

內存一年漲四倍！國產手機廠商集體漲價

特朗普發布視頻宣稱“打死多名伊朗軍事領導人”

特朗普發布視頻宣稱“打死多名伊朗軍事領導人”

剎不住的泰格·伍茲，口袋里的兩粒藥丸

Q女士反擊，否認逼宋寧峰張婉婷離婚

中微董事長，給半導體潑點冷水

17萬級海豹07EV 不僅續航長還有9分鐘滿電的快樂

態度原創

溫馨多元 愛的具象化

周恩來唯一草書題碑，8個字快一半都不認識！

跟著歌聲游安徽，聽古村回響

美軍又一架戰機墜毀 此前F-15E被擊落

GLM-5.1上線，媲美最強編程大模型！

溫馨多元愛的具象化

美軍又一架戰機墜毀此前F-15E被擊落