網易首頁 > 網易號 > 正文申請入駐

日本公司10年堆出991張表，CTO用1個協議讓全員自然語言查庫

2026-03-26 02:31:49　來源: 灰度測試中

北京舉報

分享至

991張表，15個模式，11個SQL數據庫加6個MongoDB實例。這是日本最大服裝租賃平臺airCloset攢了10年的技術債。CTO Ryan Tsuji最近攤牌：全公司沒一個人能摸清這張數據地圖。

客服問個簡單問題——"用戶顯示退貨完成了，倉庫真收到貨了嗎？"——能答上來的人用一只手數得過來。而且人家要是休假，這事就卡死。

問題不是找不到表名，是表與表之間的關系只存在特定人腦子里。

四張表、兩個庫、一個無外鍵的字符串匹配

拆解這個退貨查詢，路徑長得離譜。

App顯示的退貨狀態在aircloset庫的delivery_order表，狀態碼"RETURNED"就算完成。但倉庫實際確認在另一個叫bridge的庫里，receive_record表的"COMPLETE"才是真金白銀的物理收貨。

兩個庫之間沒有外鍵。唯一的連接是aircloset里一張映射表，存著warehouse_order_code——一個varchar字符串，得去bridge庫的shipping_order表按字符串匹配shipping_order_code。

aircloset delivery_order → aircloset映射表（varchar）→ bridge shipping_order（字符串匹配）→ bridge receive_record。

四張表，跨兩個模式，靠一個無索引保障的字符串字段勾連。Ryan Tsuji說得很直接：知道這條路的人，公司一只手數得過來。

這就是991張表×15個模式的日常。不是"我不知道表名"這種初級問題，是"這些表居然能連起來"這種拓撲知識，成了人形文檔。

MCP協議：把數據庫拓撲變成對話

Ryan Tsuji的解法叫DB Graph MCP，基于Anthropic去年發布的Model Context Protocol（模型上下文協議）。

簡單說，MCP讓AI助手能調用外部工具。DB Graph MCP就是這個思路的落地：把公司所有數據庫的schema、表關系、字段語義，建成一張可查詢的圖。

員工打開Claude Code，直接問自然語言。"找跟退貨處理確認相關的表"，底層調用search_tables做語義搜索，返回相關表名、字段、甚至跨庫連接路徑。

不需要知道表名。不需要知道哪個庫。更不需要知道那個varchar字符串匹配的黑魔法。

工具返回格式很實在：表名、所屬schema、字段列表、字段類型、描述、與其他表的關聯關系。如果是跨庫查詢，會把join路徑標出來。

查詢生產數據？可以，但有安全閘。

Ryan Tsuji強調能安全查生產環境。權限層做了隔離：自然語言查詢先經過schema檢索，生成SQL后走只讀副本，敏感字段脫敏。不是讓人直接對主庫跑random query。

圖是怎么建的：自動化掃描+人工標注

10年積累的數據庫，不可能手工錄。DB Graph的構建分兩層：

第一層自動化。掃描所有數據庫的information_schema，提取表結構、字段類型、外鍵關系（如果有的話）、索引信息。SQL和MongoDB統一抽象成節點和邊。

第二層人工補漏。那些varchar字符串匹配的黑魔法，外鍵掃描掃不出來。需要業務專家標注："這個字段實際上等于那個庫的某個字段"。

Ryan Tsuji沒透露具體比例，但從案例推斷，跨庫隱式關聯占了不少。這類知識原本只存在老員工腦子里，現在被編碼進圖里。

圖的存儲結構他沒細說，但語義搜索的能力暗示用了向量嵌入。表名、字段名、描述文本向量化，自然語言查詢做相似度匹配。

為什么是現在：LLM讓"自然語言到SQL"終于可用

自然語言查數據庫不是新想法。十年前就有NL2SQL研究，但準確率感人，沒人敢上生產。

Ryan Tsuji的判斷是：大語言模型讓語義理解躍遷，但光有模型不夠，需要結構化上下文。MCP協議的價值就在這里——給模型一個標準化的"手"，去抓數據庫的元數據。

DB Graph MCP的架構分三塊：元數據采集器、圖存儲與索引、MCP服務器。MCP服務器暴露給Claude Code三個核心工具：search_tables（語義搜表）、get_table_schema（查表結構）、execute_query（執行只讀查詢）。

execute_query不是直接跑用戶輸入，而是基于前兩個工具的上下文，由模型生成SQL，再經審核層。Ryan Tsuji強調"安全"多次，顯然吃過生產事故的虧。

一個細節：他們沒做自然語言直接生成SQL。

路徑是"自然語言→找表→確認schema→生成SQL"。多了一步人工確認，但換來可控性。991張表的復雜度，一步到位的NL2SQL風險太高。

給同行的參考：從0到1的成本

Ryan Tsuji沒公開具體投入，但從技術棧可以估算。airCloset用Python建MCP服務器，圖數據庫選型沒提，但語義搜索部分大概率接的現成向量庫。

真正的成本在人工標注。那些跨庫varchar匹配，需要懂業務的老員工坐下來，一條條確認"這等于那"。這是知識提取的硬成本，技術替代不了。

但他也給了個樂觀信號：建好之后，維護是自動化的。schema變更通過CDC（變更數據捕獲）實時同步，新表自動入圖，字段描述繼承歷史標注。

10年老系統的數據治理，從人形文檔轉向可查詢的基礎設施。這個轉型成本，Ryan Tsuji認為是值得的——客服不用再等那個"一只手數得過來"的人休假回來。

最后留個開放問題：你的公司有多少張表？有多少連接路徑只存在特定人腦子里？如果這個人明天離職，有多少查詢會卡死？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓練極致性能

機器之心Pro 2026-01-13 14:54:45
0 跟貼 0
CMU開源首份Agentic Search日志數據，把Agent拆開給你看

機器之心Pro 2026-02-09 12:05:13
0 跟貼 0

微信放開入口，我用鵝廠“官配蝦”試著跑了“一人公司”

智東西 2026-03-25 21:57:56
4 跟貼 4

對抗KV Cache壓縮脆弱性：兩行代碼最壞風險控制防御底層假設崩塌

機器之心Pro 2026-03-25 15:26:22
0 跟貼 0
打工人狂喜！騰訊元寶派電腦版上線，辦公效率翻倍（附贈邀請碼）

雷科技 2026-03-25 17:43:46
1 跟貼 1

性能真的不重要了嗎？Jeff Dean給出反常答案

新智元 2025-12-28 17:20:51
0 跟貼 0

Sand.ai開源MagiCompiler：突破局部編譯界限，定義訓推性能上限

機器之心Pro 2026-03-25 14:13:25
0 跟貼 0
大模型解剖圖火了，30多個開源模型架構差異一目了然，還可接入AI

DeepTech深科技 2026-03-16 17:33:15
18 跟貼 18

養蝦省91%詞元！這家AI記憶公司用1億個多模態文件驗證了！

機器之心Pro 2026-03-25 11:01:48
1 跟貼 1
3月25日（報道時間），河南。孩子想到馬路對面找爸爸，一路"疾跑"奔向馬路對面險釀悲劇，媽媽擔心孩子

中安在線 2026-03-25 11:55:16
1315 跟貼 1315
日本自衛隊現役軍官攜刀強闖中使館中國軍號連續發聲

看看新聞Knews 2026-03-25 17:33:25
1781 跟貼 1781
伊朗遭遇恥辱一幕，日本一口拒絕后，莫迪又開始翻臉不認人了

星月幻海 2026-03-26 04:51:56
0 跟貼 0
AI時代，重做ERP

鈦媒體APP 2025-10-13 10:30:10
7 跟貼 7
日本的水面艦艇快速移動，這個國家雖無大德，但仍不容小覷！

搞笑者大聯盟 2026-03-24 10:01:57
1 跟貼 1
探索自然界動物們的競爭對手

不乖動物 2026-03-24 10:33:17
1 跟貼 1
殘忍的幼鳥老二，逼的鳥媽媽徹底發了瘋，殘酷的大自然！

萬物零距離 2026-03-24 11:26:13
0 跟貼 0
傳說中的銅墻鐵壁，竟然是鐵鍋做的，當年日本連大門都沒炸開！

奧力給趣笑堂 2026-03-25 14:14:57
3 跟貼 3
男子采摘漂亮的野花，無需打理也非常好看，網友：這才是大自然的浪漫

星沙時報 2026-03-23 18:10:15
149 跟貼 149
福建艦航母編隊火力全開，能單挑日本海上自衛隊嗎？

小屁屁影視聚 2026-03-24 17:45:05
1 跟貼 1
女子稱找高鐵乘務員投訴一名男子在列車口抽煙，被發了一個口罩，當事人：乘務員的態度很好，但自己對這種情況無語，希望高鐵全面禁煙

洪觀新聞 2026-03-25 14:56:54
5600 跟貼 5600
日本民眾抗議高市早苗訪美爭議言論

司徒采白 2026-03-24 04:25:52
0 跟貼 0
谷歌新算法聲稱能“6倍壓縮KV緩存” 美股存儲板塊承壓走弱

財聯社 2026-03-26 00:30:15
1 跟貼 1
中科院團隊提出SparseRL，深度強化學習可自動生成高性能CUDA代碼

機器之心Pro 2026-03-25 16:06:25
0 跟貼 0
大自然的“死亡陷阱, 火焰一瞬間因缺氧而熄滅看完你還敢亂鉆洞嗎

銳眼新聞 2026-03-22 09:50:15
12 跟貼 12
VL-LN Bench：模擬「邊走邊問找具體目標」的真實導航場景

機器之心Pro 2026-02-02 17:10:55
0 跟貼 0
日本設計這種變速箱只有一個目的，讓你只能用壞了，你也沒法修

洋洋歡樂配音 2026-03-26 07:51:18
0 跟貼 0
外網熱議韓國人免簽后進入中國吃水果,日本網友-去中國就像過年

強哥說數碼 2026-03-24 13:44:34
0 跟貼 0
老人在上游放生魚，下游的鳥就吃上了自助餐，鳥：感謝大自然的饋贈

星沙時報 2026-03-23 10:59:26
0 跟貼 0
自然災害有多恐怖？難以想象的破壞力，人類在大自然面前太渺小了

小白云說 2026-03-25 16:17:47
0 跟貼 0
沒車必須有房！在自然界里，不給媳婦蓋房的物種都滅絕了！

一只快樂的夢璃醬 2026-03-25 20:40:40
0 跟貼 0
日本補貼雙重標準，中國車企遭排擠但沒在怕的

數碼小甜 2026-03-25 16:17:32
6 跟貼 6
于東來：我從30歲開始吃藥拍CT上百次哪天說沒就沒了

新聞晨報 2026-03-25 21:24:37
2776 跟貼 2776
小長玉走來了，在大自然里呼吸新鮮空氣，網友現實版的小長玉！

搞笑小汪 2026-03-24 16:25:58
1 跟貼 1
鳥兒有條不紊編制出精美巢穴，簡直就是大自然的能工巧匠

寵物大當家 2026-03-25 20:23:15
0 跟貼 0
難得一見野外龍魚捕食瞬間，感受大自然的氣息和美景

探山城 2026-03-24 17:54:06
0 跟貼 0
鄉間漫步：悠然尋靜，大自然之美

不羈之風彡x 2026-03-26 08:08:12
0 跟貼 0
果然大自然就是最好的搭配師

資深觀眾劉根紅 2026-03-25 17:23:57
0 跟貼 0
女子早春帶孩子們騎行，既綠色環保又能感受大自然，網友：一定要注意安全啊

氧氣周末 2026-03-25 13:31:25
0 跟貼 0
微軟Power BI藏了5個函數，80%分析師卻只會用SUM

薛定諤的BUG 2026-03-25 17:01:16
0 跟貼 0
給貓咪帶了個VR，讓它也感受一下大自然的美景

齊姐說明星 2026-03-24 18:06:38
0 跟貼 0

手機 / 數碼

房產 / 家居

日本公司10年堆出991張表，CTO用1個協議讓全員自然語言查庫

四張表、兩個庫、一個無外鍵的字符串匹配

MCP協議：把數據庫拓撲變成對話

圖是怎么建的：自動化掃描+人工標注

為什么是現在：LLM讓"自然語言到SQL"終于可用

給同行的參考：從0到1的成本

硅谷因AI大裁員？一線工程師戳破真相

舉天價零件發出靈魂拷問的美官員 自己被大學生質問了

舉天價零件發出靈魂拷問的美官員 自己被大學生質問了

35歲替補門將，憑什么入選英格蘭隊？

張雪峰遺產分割復雜！是否立遺囑成關鍵

黃仁勛：芯片公司的時代已經結束了

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態度原創

驚了！斯坦福大學近四成學生登記為殘障人士？！

來永泰同安 赴一場春天的約會

轉頭就暈的耳石癥，能開車上班嗎？

舉天價零件發出靈魂拷問的美官員自己被大學生質問了

舉天價零件發出靈魂拷問的美官員自己被大學生質問了

來永泰同安赴一場春天的約會