網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

從模型競賽到數(shù)據(jù)為王：WPS 365如何幫企業(yè)挖掘數(shù)據(jù)金礦？

2026-02-04 11:07:41　來源: 連線Insight

上海舉報

分享至

文/熊逾格

編輯/子夜

“即便是性能卓越的‘神模’，12個月后用戶留存率也可能降至較低水平。”

2026年1月27日，WPS 365 AI協(xié)同辦公峰會在上海舉辦。會上，中金公司研究部執(zhí)行總經(jīng)理、計算機行業(yè)首席分析師于鐘海如此說道。

這番話放在三年前，可能沒人會信。

彼時ChatGPT橫空出世，硅谷與中關村同時陷入狂熱，大模型軍備競賽如火如荼。每一家科技巨頭都在押注，一時間“誰的模型更聰明，誰就能贏得未來”成為短暫共識。

過去三年，幾乎所有企業(yè)都在追問同一個問題：我該選哪個大模型？

但在2026年初，這個問題的答案變得越來越不重要。模型正在變成基礎設施，真正的競爭焦點已悄然轉移。

當大模型的上下文有限，模型能力趨同，那么toB AI的競爭實質(zhì)，其實是效率競爭，是“誰能為AI提供更豐富、更準確，可被理解的上下文”。

這種情況下，企業(yè)數(shù)據(jù)的重要性會大幅拔高。

連線Insight在峰會現(xiàn)場觀察到，延鋒國際、東方航空、上海信投等華東龍頭企業(yè)分享的落地案例指向同一個結論：AI項目從Demo到上線，最大障礙不是算力或模型，而是如何讓散落各處、格式混亂的企業(yè)文檔真正被AI理解。

企業(yè)級AI應用的競爭重心，正從“模型能力”轉向“數(shù)據(jù)治理”。

而在這場數(shù)據(jù)競爭中，一個容易被忽視的技術環(huán)節(jié)正在成為關鍵：非結構化數(shù)據(jù)的解析，尤其是復雜文檔的解析與知識化能力，直接決定了企業(yè)數(shù)據(jù)資產(chǎn)的質(zhì)量上限。

WPS 365 統(tǒng)合進行知識治理，圖源WPS官方微信公眾號

換句話說，誰能把企業(yè)幾十年積累的Word、PDF、Excel真正變成AI可理解的結構化知識，誰就掌握了企業(yè)AI落地的鑰匙。

而這一塊兒，早就是WPS 365的長項所在。

回望38年積淀，復雜文檔的解析能力的積累，是藏在金山辦公發(fā)展歷程中的一場長坡厚雪，也是其在AI時代最大的驚喜與底氣。

1、落地困境：不是模型不夠聰明，而是數(shù)據(jù)“喂不進去”

大模型火了三年，企業(yè)的期待經(jīng)歷了一條清晰的曲線：狂熱，落差，理性回歸。

2023年，ChatGPT引爆了全球AI熱潮，創(chuàng)業(yè)公司如過江之鯽，但凡沾上“大模型”三個字，估值便應聲而漲。

資本市場之外，企業(yè)端同樣熱鬧，CIO們紛紛被老板追問AI時代轉型方案。AI辦公賽道應聲而起，辦公助手、智能問答機器人、自動化報告生成系統(tǒng)......各種概念驗證項目紛紛落地。

但事實上，很多項目經(jīng)過驗收后，便逐漸沉寂，也不再被客戶繼續(xù)使用。

正如于鐘海所說，頂尖AI實驗室的模型更新周期已縮短至數(shù)月，即便是性能卓越的“神模”，12個月后用戶留存率也可能降至較低水平。

大模型的迭代周期縮短到數(shù)月后，客戶留存也未隨之改善。換句話說，模型越來越強，用戶卻越來越難留住。企業(yè)試圖通過自研或深度綁定某一模型來建立競爭優(yōu)勢，不僅成本高昂，而且“保鮮期”極短。

為什么模型不斷迭代，B端用戶卻如此“難留”？

金山辦公副總裁吳慶云分享了一個故事：

"我們?nèi)ツ曜隽艘粋€共創(chuàng)客戶，他的原始數(shù)據(jù)整理已經(jīng)非常好了，世界500強的企業(yè)，他自認為他的文檔質(zhì)量很高，第一次把這個數(shù)據(jù)丟進來問答的準確率只有70%多，直到經(jīng)過去年一年的治理沉淀成今天非結構化數(shù)據(jù)的產(chǎn)品，最后準確率提高95%左右”。

金山辦公副總裁吳慶云

從數(shù)據(jù)對準確率的巨大提升，不難看出——不是模型不夠聰明，而是企業(yè)自己的知識“喂不進去”。

金山辦公助理總裁朱熠鍔分析，不管開源還是閉源，一線大模型都在持續(xù)發(fā)展，模型不會被壟斷，在to B場景下，從業(yè)務方的角度講，預算可用的情況下選擇最好的大模型就可以了。

模型不稀缺了，那什么稀缺？

答案是對數(shù)據(jù)的理解。

朱熠鍔指出，前沿大模型的綜合智能已超越普通員工，能力是夠的。但問題在于，AI跟真實世界的數(shù)據(jù)結合不好，這正是企業(yè)AI應用效果不佳的核心原因。

他認為，行業(yè)正經(jīng)歷從“以模型為中心”到“以數(shù)據(jù)為中心”的轉變。

大模型雖然擁有海量世界知識，但對企業(yè)的業(yè)務流程、組織架構、歷史決策缺乏理解。而這些關鍵上下文，恰恰藏在企業(yè)的文檔、郵件、會議記錄之中。

吳慶云解釋，非結構化數(shù)據(jù)分散在個人電腦、OA流程、各種業(yè)務系統(tǒng)中，收集困難，并且格式不一、質(zhì)量參差，彼此之間還可能存在沖突和錯誤，即便收集整理了，如何讓私域知識與大模型的世界知識結合起來解決行業(yè)問題，依然是巨大挑戰(zhàn)。

WPS 365 整合分散的非結構化數(shù)據(jù)，圖源WPS官方微信公眾號

這遠非金山辦公一家公司的判斷。在峰會的媒體群訪環(huán)節(jié)，幾乎每位高管都提到了同一個詞：數(shù)據(jù)治理。

不難發(fā)現(xiàn)，高質(zhì)量數(shù)據(jù)已經(jīng)成為制約AI在現(xiàn)有技術水平下發(fā)揮作用的“關鍵制約點”，關乎數(shù)據(jù)的市場競爭迫在眉睫。

一個形象的比喻是：企業(yè)坐擁金礦，卻缺少開采工具。財報、合同、設計圖紙、會議紀要、工藝手冊，這些文檔無法直接被AI理解和使用，構成了AI落地的“最后一公里”障礙。

2、隱藏壁壘：復雜文檔解析能力拉開差距

在數(shù)據(jù)治理的競爭中，一個容易被忽視的技術環(huán)節(jié)正在成為分水嶺——對復雜文檔的解析與知識化能力。

本質(zhì)上，文檔解析的目的是AI構建企業(yè)上下文，解析越精準，AI獲得的上下文越豐富、準確，輸出就越貼近實際業(yè)務。

一份普通的財務報表PDF，可能包含嵌套表格、跨頁合并單元格、手寫批注、公司水印；一份工程技術手冊，可能有數(shù)百頁，里面有流程圖、電路圖、公式、代碼片段；一份年代久遠的掃描件，可能字跡模糊，格式混亂到無法辨認。

華中科技大學人工智能與自動化學院教授劉禹良在峰會上披露了一個讓人驚訝的數(shù)字：當前行業(yè)最高解析準確率僅約60%。

華中科技大學人工智能與自動化學院教授劉禹良

這意味著，每十個表格，可能有四個解析出錯，近四成的信息可能被丟失或誤讀。毋庸置疑，40%的信息損耗足以讓AI的輸出變得不可信。

傳統(tǒng)的檢索增強生成（RAG）架構在企業(yè)場景中同樣遇到瓶頸：RAG的底層邏輯是把文檔切成小塊，然后用語義相似度來檢索。但“語義相似”不等于“邏輯相關”。

而企業(yè)文檔中存在大量術語黑話、邏輯缺失、內(nèi)容沖突的情況，僅靠語義匹配無法保證AI輸出的準確性。

延鋒國際IT總監(jiān)丘川在峰會上分享了他們的痛點，延鋒內(nèi)部長期積累了海量技術與業(yè)務文檔，在項目推進前，文檔標準不統(tǒng)一、系統(tǒng)割裂等問題給協(xié)作帶來了顯著成本。

上海信投副總裁劉紅分享了企業(yè)的切身體會，表示歷史文檔存在大量重復、沖突、版本混亂的問題，重復檢測、沖突識別等治理能力已成為AI落地的前置條件。

當數(shù)據(jù)治理工具成為剛需，大多數(shù)廠商還在比拼模型參數(shù)的時候，一部分人已經(jīng)把目光轉向了更底層的基礎設施，比如金山辦公。

3、38年積淀：WPS 365 在AI時代提前起跑

一家深耕文檔領域38年的公司，適時亮出了自己的底牌。

在峰會上，金山辦公發(fā)布與華中科技大學共同研發(fā)的MonkeyOCR v1.5。這是一個30億參數(shù)的文檔解析模型，專門用來“啃”復雜文檔。測評結果顯示，該模型在業(yè)界權威的OmniDocBench V1.5榜單上拿下了綜合第一，超過了當時谷歌、微軟等旗下主流大模型。

一個3B參數(shù)的小模型，在文檔解析的垂直戰(zhàn)場上擊敗了萬億參數(shù)級別的巨頭，對金山辦公來說，這絕非偶然的成功。

回溯歷史，金山辦公從1988年做WPS 1.0開始，就在和文檔打交道。38年來，從DOS時代的中文排版，到Windows時代的格式兼容，再到移動時代的多端協(xié)同，金山辦公積累了中國最深厚的文檔處理經(jīng)驗。

WPS 365 AI功能全方面覆蓋，圖源WPS官網(wǎng)

這種積累體現(xiàn)在產(chǎn)品的每一個細節(jié)里。

比如表格識別。普通的OCR遇到跨頁表格，往往會把它拆成兩張不相干的表。MonkeyOCR能夠識別出表格的連續(xù)性，自動拼接。以醫(yī)藥行業(yè)為例，其表格類內(nèi)容抽取準確率高達99%，勾選框識別準確率達到95%。

比如術語理解。金山辦公多年服務政企客戶，積累了大量行業(yè)專有詞匯。當AI遇到“三重一大”“一崗雙責”這類公文術語時，不會再一臉茫然。

比如數(shù)據(jù)治理。WPS 365的智能文檔庫內(nèi)置了重復檢測、沖突識別和缺失預測功能，準確率分別達到95%、80%和85%。

這種長坡厚雪的積累，不僅在AI時代化作差異化優(yōu)勢，也推動金山辦公技術的進一步深化。

為解決傳統(tǒng)RAG問題，金山辦公提出了知識增強生成（KAG）架構。

與傳統(tǒng)RAG僅讓大模型通過語義相似度搜索“看到”文檔不同，KAG架構是“先理解，后推理”，先把文檔里的知識抽取出來，構建成知識圖譜，然后讓AI基于邏輯關系來回答問題。

通過知識圖譜、業(yè)務本體建模、行業(yè)術語庫，KAG系統(tǒng)性地治理和融合多源知識，使AI能夠真正掌握企業(yè)知識的內(nèi)在邏輯與關聯(lián)。

來自客戶的反饋印證了這種進步。

申萬宏源的測試數(shù)據(jù)顯示，使用WPS 365的AI知識庫后，研究員查找資料的效率提升了80%，客戶響應速度提高了三倍。

中船動力的技術團隊反映，用WPS 365的知識圖譜來管理設備檔案后，新人也可以快速獲取知識，研發(fā)筆記、試驗數(shù)據(jù)得到了高效流轉。

從“Office替代者”到“企業(yè)數(shù)據(jù)治理能力提供商”，金山辦公的角色轉換，即是一家企業(yè)在AI時代的轉身，也折射出整個AI辦公賽道的邏輯變遷。

4、結語

企業(yè)級AI辦公已進入“深水區(qū)”。

模型逐漸同質(zhì)化，數(shù)據(jù)質(zhì)量成為新的制高點。“數(shù)據(jù)是企業(yè)唯一可持續(xù)的AI護城河”，于鐘海的判斷正在得到越來越多企業(yè)的認同。

中金公司研究部執(zhí)行總經(jīng)理、計算機行業(yè)首席分析師于鐘海

延鋒國際、東方航空、上海信投等華東龍頭企業(yè)的選擇，驗證了一個趨勢：企業(yè)選型AI辦公平臺的標準，正從“功能多少”轉向“數(shù)據(jù)能力強弱”。

金山辦公的財報提供了一個注腳：WPS 365業(yè)務已實現(xiàn)連續(xù)三個季度高增長，2025年Q1、Q2、Q3營收分別為1.51億元、1.58億元、2.01億元，第三季度同比增長71.61%，遠超行業(yè)平均水平。2025年上半年的新增客戶名單上，中國聯(lián)通、長江三峽集團、中國寶武、中國銀聯(lián)等名字赫然在列。

憑借全棧私有化部署能力，同時保持與公有云同步迭代，WPS 365滿足了金融、國央企對數(shù)據(jù)安全與合規(guī)的高要求，而這是很多云原生AI廠商難以實現(xiàn)的。

WPS 365 全面保障數(shù)據(jù)安全，圖源WPS官網(wǎng)

據(jù)公開資料，目前WPS 365開放生態(tài)覆蓋超8000家合作伙伴、超60000款應用，共同服務超4000家企業(yè)客戶、超100萬政企用戶，中國民營企業(yè)500強中，超七成上市公司使用WPS 365。

這些客戶選擇金山辦公，不僅因為它是國產(chǎn)辦公軟件的老牌玩家，更因為它在AI時代找到了新的價值點：幫企業(yè)把沉睡的文檔變成活的知識，把散落的數(shù)據(jù)變成AI的燃料。

38年前，求伯君在深圳的酒店房間里敲下WPS 1.0的第一行代碼時，大概不會想到，這家公司會在AI時代再次進化。

但歷史往往如此。技術的浪潮一波接一波，真正能穿越周期的，是那些在底層默默耕耘、等待時機的人。

WPS 365的故事，正在進入新的篇章。

（本文頭圖來源于WPS官網(wǎng)。）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.