![]()
日本時尚租賃公司airCloset的CTO Ryan Tsuji最近曬了一組數字:15個數據庫schema、991張表、11個SQL數據庫、6個MongoDB實例。這不是在炫耀技術債厚度,而是在展示他們怎么讓AI把這些老古董盤活了。
他們的新工具叫DB Graph MCP。核心能力一句話:員工用自然語言問問題,AI自動去這991張表里找答案。不需要知道表名,不需要懂SQL,甚至不需要知道數據存在哪個庫。
聽起來像給數據庫裝了搜索引擎。但Tsuji想解決的痛點更具體——那些只存在于老員工腦子里的「表與表之間的隱秘聯系」。
一個真實的跨庫追查:4張表、2個schema、0個外鍵
客服拋來一個典型問題:「用戶App顯示退貨已完成,但倉庫真的收到貨了嗎?」
這個問題要拆成兩段。App端的退貨狀態在aircloset庫的delivery_order表,狀態碼「RETURNED」代表流程走完。但倉庫端的實物確認在另一個叫bridge的庫里,receive_record表的「COMPLETE」狀態才是金標準。
麻煩的是,這兩個庫沒有外鍵關聯。中間靠一張映射表硬橋接:aircloset里存的是warehouse_order_code(字符串),bridge里對應shipping_order_code(也是字符串),字符串匹配,手工維護。
Tsuji的原話:「公司里有幾個人知道這條查詢路徑?一只手數得過來。他們要是休假,調查就卡死。」
這就是10年技術債的日常。不是「找不到表」,是「不知道表和表之間還能這么連」。
MCP協議:讓AI學會「翻箱倒柜」的通用語言
DB Graph MCP的底座是Model Context Protocol(模型上下文協議),Anthropic去年推出的開放標準。簡單說,它給AI和外部系統之間定了套「對話語法」——AI能調用什么工具、傳什么參數、拿回什么格式,雙方提前約定好。
![]()
airCloset在這個框架上搭了兩層:DB Graph負責把991張表的結構、關系、注釋吃進去,建成一張可搜索的「元數據地圖」;MCP Server則負責把Claude Code的自然語言問題,翻譯成對這張地圖的查詢指令。
員工在Claude Code里打字:「找跟退貨處理確認相關的表」。后臺觸發search_tables工具,語義搜索跑一遍,返回候選表列表,帶相關性評分和字段說明。
選中表之后,可以繼續問:「這些表怎么關聯?」DB Graph會畫出關系路徑——哪張表的哪個字段,通過什么條件,連到哪張表。甚至能指出「這里用字符串匹配,沒有外鍵約束」這種坑。
Tsuji展示了實際返回格式:表名、字段類型、業務注釋、關聯方式,結構化輸出。不是黑盒,每一步都可審計。
安全設計:生產數據只能「看」,不能「碰」
讓AI碰生產數據庫,第一反應是風險。airCloset的解法是分權限層級。
DB Graph MCP默認只開放「元數據查詢」——表結構、字段注釋、表間關系。這些不涉及業務數據本身,員工本來就有權限看。
真要查生產數據?需要額外申請,走審批流。而且查詢是只讀的,帶審計日志。Tsuji強調:「我們可以讓它安全地查詢生產數據」,前提是權限和流程到位。
另一個細節是schema隔離。15個schema的元數據統一索引,但查詢時按用戶權限過濾。客服看不到財務schema的表結構,工程師也進不了HR的數據域。
這種設計把「AI能做什么」和「人被允許做什么」解耦了。AI的能力邊界由MCP工具定義,人的操作邊界由現有權限系統接管。
圖數據庫打底:991張表的「關系圖譜」怎么建
![]()
支撐自然語言查詢的,是一張預計算的圖。節點是表、字段、schema;邊是外鍵關系、命名相似性、人工標注的業務關聯。
外鍵關系直接從數據庫元數據提取,最可靠。但airCloset的痛點恰恰是「沒有外鍵的地方」,所以補充了兩條線索:
一是命名模式。warehouse_order_code和shipping_order_code這種,字段名語義相關,可能被歸到同一業務域。二是人工注釋。老員工在DB Graph后臺標記的「這張表和那張表其實是一對一」,變成圖上的加權邊。
Tsuji沒透露具體用的什么圖數據庫,但提到「向量搜索+圖遍歷」的混合查詢。自然語言先向量化,找語義相近的表名/字段注釋;再沿著圖邊擴散,找出關聯表。最后綜合排序返回。
這套機制解釋了為什么「return processing confirmation」能命中receive_record表——不是關鍵詞匹配,是語義相近的字段注釋+圖上路徑的綜合得分。
從「人腦維基」到「可查詢的基礎設施」
Tsuji的總結很直白:「以前這些連接只存在于特定人的腦子里,現在變成了可搜索、可驗證的系統。」
這不是替換DBA,是降低「知道該問誰」的門檻。新員工不用先花三個月摸清哪個老員工管哪塊schema,直接問AI就行。老員工也能從「人肉查詢接口」里解放出來。
airCloset把這套系統開源了。GitHub倉庫里能看到MCP Server的實現、圖構建的流水線、權限模型的配置模板。Tsuji說歡迎提issue,但提醒「991張表的規模可能不是每家都有」。
一個有趣的后續:發布后一周內,有讀者反饋說用類似思路接上了自家公司的2000張表,但查詢延遲從2秒飆到15秒。Tsuji在評論區回復:「我們在考慮分層緩存,熱schema常駐內存,冷數據按需加載。」
10年老數據庫的自然語言接口,性能優化才剛開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.