337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

GLM-OCR開源:小而強、精準搞定復雜文檔

0
分享至


始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區,始終堅持“中立、開放、共建、共創、合作”五項基本原則,歡迎加入共同成長。

GLM-OCR正式開源和發布,以“小尺寸、高精度”實現文檔解析能力新標桿。作為一款輕量的專業級OCR模型,其核心亮點如下:

  • 性能SOTA:以94.6分登頂OmniDocBench V1.5,并在公式識別、表格識別、信息抽取的多項主流基準中均取得SOTA表現;
  • 場景優化:專攻真實業務痛點,在手寫體、復雜表格、代碼文檔及印章等高難場景中表現穩健;
  • 推理高效:僅0.9B參數規模,支持vLLM、SGLang和Ollama部署,顯著降低推理延遲與算力開銷,適合高并發與邊緣部署;
  • 開源易用:同步開源完整SDK與推理工具鏈,環境依賴簡單,支持一行命令快速調用,輕松接入現有業務系統。


模型地址:

https://wisemodel.cn/models/ZhipuAI/GLM-OCR

1

性能SOTA、精準干活兒

得益于自研CogViT視覺編碼器深度場景優化,GLM-OCR實現了“小尺寸,高精度”。

GLM-OCR參數量僅0.9B,但在權威文檔解析榜單OmniDocBench V1.5中以94.6分取得SOTA性能。在文本、公式、表格識別及信息抽取四大細分領域的表現優于多款OCR專項模型,性能接近Gemini-3-Pro。


除了公開榜單,我們還針對真實業務中的六大核心場景進行了內部測評。結果顯示,GLM-OCR在代碼文檔、真實場景表格、手寫體、多語言、印章識別、票據提取等維度均取得顯著優勢。


2

案例實測

在實際應用中,GLM-OCR能夠精準解析掃描件、PDF、表格及票據,有效解決手寫、印章、豎排及多語言混排難題,在復雜版式下依然保持極高的準確率和魯棒性。

通用文本識別:GLM-OCR支持照片、截圖、掃描件、文檔輸入,能夠識別手寫體、印章、代碼等特殊文字,可廣泛應用于教育、科研、辦公等場景。

案例:手寫公式識別


案例:印章識別


案例:代碼識別


復雜表格解析:針對合并單元格、多層表頭等復雜結構,模型能精準理解并直接輸出HTML代碼。無需二次制表,識別結果即可用于網頁展示或數據處理,大幅提升表格錄入與轉換效率。

案例:跨單元格表格


案例:分段表


信息結構化提取:GLM-OCR可從各類卡證、票據、表格中智能提取關鍵字段,并輸出標準的JSON格式,無縫對接銀行、保險及物流等行業系統。

輸入圖片:


prompt:

```

輸出:

```

批量處理與RAG支持:GLM-OCR支持大批量文檔的識別與解析,其高精度的識別能力和規整的輸出格式,可為檢索增強生成(RAG)提供堅實基礎。

速度方面,我們對比了在相同硬件環境與測試條件下(單副本,單并發),分別以圖像文件和PDF文件為輸入,不同OCR方法完成解析并導出Markdown文件的速度差異。結果顯示,GLM-OCR處理PDF文檔的吞吐量達1.86頁/秒,圖片達0.67張/秒,速度顯著優于同類模型。


3

技術細節

在訓練策略方面,GLM-OCR率先將多Tokens預測損失(MTP)引入OCR模型訓練過程,以增強損失信號密度并提升模型學習效率。并且,通過持續且穩定的全任務強化學習訓練,能夠顯著提升模型在復雜文檔場景下的整體識別精度與泛化能力。

上述性能提升還得益于GLM-OCR在多模態模型結構上的系統性設計。模型整體采用“編碼器-解碼器”架構,繼承自GLM-V系列,由視覺編碼器(ViT)、跨模態連接層和語言解碼器三大核心模塊組成。其中,視覺側集成了自研的CogViT視覺編碼器(400M參數),并在數十億級圖文對數據上引入CLIP策略進行大規模預訓練,使模型具備了強大的文字與版面語義理解能力。

為實現視覺與語言信息的高效融合,GLM-OCR設計了一套輕量而高效的連接層結構,融合SwiGLU機制并引入4倍下采樣策略,能夠精準篩選并保留關鍵視覺 Token,將高密度語義信息高效傳遞至后端的GLM-0.5B解碼器,從而支撐高精度的OCR識別輸出。

在整體系統層面,GLM-OCR采用“版面分析→并行識別”的兩階段技術范式。其中,版面分析模塊基于PP-DocLayout-V3實現,能夠在版式多樣、結構復雜的文檔場景下實現穩定、高質量且高效率的OCR解析效果。

GLM-OCR的部署暫時vllm和transformers的發布版本還不支持,源碼方式安裝才能部署,過兩天正式發布版本支持之后,歡迎大家回來wisemodel社區的鏡像模塊里一鍵部署使用。


----- END -----

wisemodel相關:

系列模型:


關于wisemodel更多


1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
老人離世房產未過戶,2026年法律新規:繼承權真的會作廢嗎?

老人離世房產未過戶,2026年法律新規:繼承權真的會作廢嗎?

復轉這些年
2026-03-22 17:48:38
沒底線!田曦薇抹胸造型直播被封禁,大露胸擠副乳惹全網爭議

沒底線!田曦薇抹胸造型直播被封禁,大露胸擠副乳惹全網爭議

橙星文娛
2026-03-30 12:20:45
男子賺夠錢后買房車瀟灑養老,僅6年突然破產:剛知老婆負債3千萬

男子賺夠錢后買房車瀟灑養老,僅6年突然破產:剛知老婆負債3千萬

嫹筆牂牂
2026-03-19 07:12:18
A股:今天中午傳來4個重要消息!A股或迎來更大級別大行情?

A股:今天中午傳來4個重要消息!A股或迎來更大級別大行情?

股市皆大事
2026-03-30 12:05:51
大摩:由中東戰爭引發的標普500指數回調已接近尾聲

大摩:由中東戰爭引發的標普500指數回調已接近尾聲

財聯社
2026-03-30 15:50:17
中南大學鄭傳均去世,死因是過度勞累,曾救落水女童被央視報道

中南大學鄭傳均去世,死因是過度勞累,曾救落水女童被央視報道

180視角
2026-03-30 10:13:48
一段夫妻離婚對話刷屏!丈夫坦誠變心、凈身出戶,妻子竟平靜應允

一段夫妻離婚對話刷屏!丈夫坦誠變心、凈身出戶,妻子竟平靜應允

火山詩話
2026-03-28 15:09:53
曼聯一億英鎊重磅引援取得進展,新任正式主帥人選已確定

曼聯一億英鎊重磅引援取得進展,新任正式主帥人選已確定

林子說事
2026-03-30 07:47:53
零跑D19豪華旗艦SUV上市定檔:4月16日見

零跑D19豪華旗艦SUV上市定檔:4月16日見

IT之家
2026-03-30 10:25:18
許世友被一掌撂翻在地?竟敗給18歲警衛員,事后連呼:我不是對手

許世友被一掌撂翻在地?竟敗給18歲警衛員,事后連呼:我不是對手

水木史記
2026-03-29 01:21:39
打!傾家蕩產也要打!以色列最新民調:75%民眾要求和伊死磕到底

打!傾家蕩產也要打!以色列最新民調:75%民眾要求和伊死磕到底

肖茲探秘說
2026-03-30 15:51:14
“被迫”上任,卡羅爾:我之前從未想過當主帥,我還是想踢球

“被迫”上任,卡羅爾:我之前從未想過當主帥,我還是想踢球

懂球帝
2026-03-30 10:33:05
江西女碩士失蹤,被發現時已在教授實驗室待6年,魔鬼真的存在

江西女碩士失蹤,被發現時已在教授實驗室待6年,魔鬼真的存在

燦爛夏天
2025-02-10 20:20:13
浙江一公路自行車賽發生大面積摔車事件,組委會醫療聯系人:擦傷撞傷人數確實多,但僅極個別送醫

浙江一公路自行車賽發生大面積摔車事件,組委會醫療聯系人:擦傷撞傷人數確實多,但僅極個別送醫

極目新聞
2026-03-30 17:14:00
寧德時代重返巔峰!2026一季度市占率破50%,比亞迪創五年新低?

寧德時代重返巔峰!2026一季度市占率破50%,比亞迪創五年新低?

新浪財經
2026-03-30 16:07:15
新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
美國科學家瘋了:打算用等離子體燒穿地球,他們究竟想干什么?

美國科學家瘋了:打算用等離子體燒穿地球,他們究竟想干什么?

觀察宇宙
2026-03-29 20:51:07
清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

磊子講史
2026-03-20 16:07:07
李榮浩怒斥單依純不到24小時,薛之謙罕見發聲,贏得全網好感

李榮浩怒斥單依純不到24小時,薛之謙罕見發聲,贏得全網好感

往史過眼云煙
2026-03-30 14:36:04
2026光纖光纜,新增訂單最多的10家公司(附名單)

2026光纖光纜,新增訂單最多的10家公司(附名單)

Thurman在昆明
2026-03-30 17:14:21
2026-03-30 18:31:00
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
466文章數 14關注度
往期回顧 全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

尹正發文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

頭條要聞

尹正發文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

家居
藝術
數碼
本地
公開課

家居要聞

東方法式美學 現代簡約

藝術要聞

600 年前的「產亡孤魂」,藏著中國女性最痛的記憶

數碼要聞

雙塔合一,酷凜推出FROZN A620 SLK風冷散熱器

本地新聞

用Color Walk的方式解鎖城市春日

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版