337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<tr id="yy8y4"><small id="yy8y4"></small></tr>

<sup id="yy8y4"></sup>

<tr id="yy8y4"></tr><nav id="yy8y4"></nav>

<nav id="yy8y4"></nav>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權(quán)郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek開源的新東西到底強在哪？我?guī)湍阏覍＜覇柫藛?/h1>
2025-10-23 18:40:30　來源: 知危浙江舉報

0

分享至

用微信掃碼二維碼

分享至好友和朋友圈

本周，DeepSeek 新開源的 DeepSeek-OCR 在開源社區(qū)的熱度持續(xù)發(fā)酵。
人們興奮的點是：它不僅是一款新的光學(xué)字符識別模型，還更像是一次對 “ 大模型記憶機制 ” 的重新設(shè)計。
在 DeepSeek-OCR 的架構(gòu)中，圖像不再只是文字的載體，而是成為一種語義壓縮的中間語言。文字被渲染成圖像后，經(jīng)由 DeepEncoder 轉(zhuǎn)換為緊湊的視覺表征；這些視覺 token 既可以通過 DeepSeek 3B-MoE 模型還原為原始文本（這也是標(biāo)準(zhǔn)的 OCR 機制），也可以與其他輸入 token 與 prompt 結(jié)合，執(zhí)行問答、摘要、檢索等復(fù)雜任務(wù)。
通俗來說，就是我們可以把大量文字打包壓縮成一張圖片來節(jié)省空間，等需要使用的時候再解壓出來，甚至在一部分使用場景中，你甚至不需要解壓，直接用壓縮包就可以達成目的。

DeepSeek-OCR 模型架構(gòu)。圖源：
https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf
即便在 10× 壓縮比的條件下，模型的文本還原精度仍可達 97%。隨著大模型逐漸向越來越復(fù)雜的場景嵌入，上下文長度資源遠不夠用甚至越來越不夠用，而基座模型在此參數(shù)上升級頗為緩慢的當(dāng)下，DeepSeek-OCR 的發(fā)布瞬間帶來很大的想象空間。
研究團隊甚至還進一步提出 “ 遺忘機制 ” 的構(gòu)想，模型可依據(jù)信息的 “ 時序遠近 ”，在視覺壓縮階段主動衰減細節(jié)，從而實現(xiàn)一種類人記憶式的上下文管理。
那么，視覺 token 為何能在信息量不損失太多的情況下，比文本 token 少一個數(shù)量級？模型記憶能否完全用視覺邏輯來替代？DeepSeek-OCR 是否為解決大模型上下文長度受限的問題提供了一條現(xiàn)實可行的途徑？DeepSeek-OCR 反映了多模態(tài)大模型的什么發(fā)展趨勢？
帶著這些問題，知危與 Sand.ai 聯(lián)合創(chuàng)始人、首席科學(xué)家、《 Swin Transformer 》作者張拯進行了簡單的對話。
知危：
同一段輸入，為什么視覺 token 可以比文本 token 的數(shù)量少得多，有沒有直觀或本質(zhì)的解釋？
張拯：
有兩種觀點。第一種，視覺是一個 2D 表達，因此可以比 1D 的表達更高效。
第二種，高效的原因不是視覺 v.s. 文本，而是兩邊采用的 token 表達方式不同：做視覺表達的時候，我們是在一個高維的連續(xù)空間中做信息壓縮（把 image patch 映射為一個高維特征），之前 LLM 里常用的 tokenizer（把文本數(shù)據(jù)向量化的工具，通俗理解是一種把自然語言翻譯為機器能理解的語言的工具）則實際上可以被認為是在一個一維空間中做壓縮（把文本映射為 id ）。高維連續(xù)空間本來就有更好的表達能力，因此可以用更少的 token 數(shù)量來表達更多信息。其實文本也可以做成連續(xù)表達，來大幅度減少文本 token，但是目前應(yīng)該沒有被很廣泛地用到 LLM 里。
這兩種觀點，我 buy-in 第二種。
知危：
DeepSeek-OCR 相比過往的 OCR 模型，除了效率提升方面，還有哪些獨創(chuàng)性？
張拯：
我最近沒有特別研究過 OCR 模型的進展，但基于我看過的一些信息，我覺得 DeepSeek-OCR 的技術(shù)本身好像并沒有非常特別的部分。但是在觀點上，“ 把視覺作為文本長上下文的壓縮介質(zhì) ”，這個 idea 還是很棒的。這個 idea 有路線上的啟發(fā)意義，相較于現(xiàn)在的多模態(tài)模型，DeepSeek-OCR 會使用兩種不同的 tokenizer 機制，這種路線也許會啟發(fā)更好的多模態(tài)模型設(shè)計方案。
知危：
這項技術(shù)對于基礎(chǔ)模型上下文長度難以擴展的當(dāng)下，可以帶來多大的成本效益？對上下文工程的優(yōu)化有哪些好處？
張拯：
理論上最多能拿到 N^2 倍的收益，N 是 Vision Token 相較于 Text Token 的壓縮率。對于上下文工程的優(yōu)化，最大的好處應(yīng)該就是不用那么仔細地管理上下文長度了。
知危：
DeepSeek 設(shè)想的遺忘機制是否過于簡化？忽略了語義的重要性排序？
張拯：
這種設(shè)想肯定還是很初步的，但是也能腦洞出很多改進的空間，比如語義重要的部分可以渲染成更大的字體？
知危：
Andrej Karpathy 認為視覺 token 有潛力可以完全替代文本 token，因為信息壓縮、多模態(tài)、可雙向注意力處理、無需 tokenizer 等優(yōu)勢，您怎么看？
張拯：
大部分都同意，但是 “ 可雙向注意力處理 ” 這里有待探討，“ 可雙向注意力處理 ” 很大程度上和 training objective（訓(xùn)練目標(biāo) ）有關(guān)。
另外，如果后面都是處理視覺 token 了，是不是有機會讓模型能在一個 2D 的空間里做思考？從而帶來更高效的推理（類似 GPT-4o 的 thinking with image ）？這個我覺得還是挺有意思的。
知危：近期 Meta 也提出了一個無需 tokenizer 的模型架構(gòu) Byte Latent Transformer ，可以跳過 tokenization ，直接學(xué)習(xí)原始字節(jié)流。結(jié)合以上討論和領(lǐng)域現(xiàn)狀，您認為這體現(xiàn)了多模態(tài)大模型的哪些發(fā)展趨勢？
張拯：
宏觀一點來看，不同模態(tài)模型的范式還是有機會持續(xù)進化的。
更細節(jié)一點的話，我初步想到的有兩個：
現(xiàn)在的多模態(tài)大模型的主流做法基本上可以認為在捏合各種不同的模態(tài)的模塊，整個訓(xùn)練 pipeline 其實還是有點復(fù)雜（不優(yōu)雅）的。大家肯定希望有更簡單、更統(tǒng)一的方式來處理。類似 DeepSeek-OCR 這樣的工作對我們開發(fā)更好的多模態(tài)模型范式還是挺有啟發(fā)的。
離散表達和連續(xù)表達之間的關(guān)系，以及是否有更好的組合方式，可能也挺重要的。
（對話全文完）
總體來看，DeepSeek-OCR 更多是基于效率上的大幅提升啟發(fā)了一個新的路線。
當(dāng)模型的 “ 思考空間 ” 從一維文本拓展至二維視覺，思考和推理也可能變得更加高效和簡潔。而在技術(shù)層面，則指向當(dāng)前多模態(tài)大模型領(lǐng)域正等待一把 “ 奧卡姆剃刀 ” 簡化模型范式的時刻。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁 下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

DeepSeek故障只影響了C端業(yè)內(nèi)猜測系V4進行隱身測試導(dǎo)致

經(jīng)濟觀察報 2026-03-31 17:17:37
36 跟貼 36

連續(xù)“罷工”后編碼風(fēng)格突變釋放多個Agent相關(guān)崗位，DeepSeek大招來了？

每日經(jīng)濟新聞 2026-04-01 01:49:07
19 跟貼 19

首次！OpenClaw又更新，直接合并QQ官方插件

機器之心Pro 2026-04-01 14:44:14
32 跟貼 32

VFMTok: Visual Foundation Models驅(qū)動的Tokenizer時代來臨

機器之心Pro 2025-10-28 18:00:47
0 跟貼 0

一條Claude Code 源代碼的社會性死亡

虎嗅APP 2026-04-02 07:07:53
3 跟貼 3

2000萬人圍觀，React大佬開源神作“干翻”前端！速度飆500倍，狂攬2.8萬顆星

智東西 2026-04-01 14:49:51
2 跟貼 2

封不住！Claude Code爆改Python版加冕最快10萬星，且clone且珍惜

量子位 2026-04-02 10:04:20
0 跟貼 0

別學(xué)Claude Code了！OMC五大「臥槽」功能解析：自動化開發(fā)軍團來了

鈦媒體APP 2026-04-01 11:09:53
0 跟貼 0

中國為何能在能源動亂中處變不驚路透社公布一組數(shù)據(jù)

澎湃新聞 2026-04-01 22:24:09
28295 跟貼 28295

街頭偶遇2米06女巨人，這視覺沖擊太頂了

莉西娜的后籃球時代 2026-03-29 17:30:00
33 跟貼 33

AI的看圖能力，可能是編出來的

虎嗅APP 2026-04-01 21:12:07
0 跟貼 0

中科曙光發(fā)了個“標(biāo)配版”超節(jié)點，AI推理算力的未來形態(tài)？

鈦媒體APP 2026-03-31 16:24:15
1 跟貼 1

40歲轉(zhuǎn)行程序員：André用18個月拆穿3個行業(yè)謊言

薛定諤的BUG 2026-04-01 09:47:26
0 跟貼 0

深度長文：我們?yōu)槭裁聪胂蟛怀鏊木S空間？（超10000字）

宇宙時空 2026-03-31 17:03:42
35 跟貼 35

理想汽車馬赫100芯片論文入選ISCA 2026工業(yè)分區(qū) 全球首家汽車企業(yè)獲認可，引領(lǐng)AI計算新高度

齊魯壹點 2026-03-31 14:20:09
0 跟貼 0

機器人線下真機對線打PK！這屆黑客松可太會玩了

量子位 2026-03-31 14:41:05
0 跟貼 0

英國凍結(jié)一中國公民及關(guān)聯(lián)公司8100萬英鎊房產(chǎn)，要求3個月內(nèi)證明購房資金合法

紅星新聞 2026-04-01 13:15:18
20100 跟貼 20100

模型飛機試飛，鏡頭一轉(zhuǎn)發(fā)現(xiàn)事不簡單，美女膽子太大了

說說搞笑說 2026-03-30 17:29:13
1 跟貼 1

暗殺科學(xué)家到轟炸大學(xué)：讀懂中東無底線博弈的底層邏輯

深層奧秘 2026-03-31 07:04:57
0 跟貼 0

智賦算力領(lǐng)航AI——上海人工智能實驗室發(fā)布《超節(jié)點技術(shù)體系白皮書》

智東西 2026-03-31 11:26:18
0 跟貼 0

公安部發(fā)聲力挺重慶張雪

第一財經(jīng)資訊 2026-04-01 23:37:17
93 跟貼 93

日本部署導(dǎo)彈"瞄準(zhǔn)中國" 美方提醒：中方反制還沒結(jié)束

澎湃新聞 2026-04-01 11:39:50
3400 跟貼 3400

阿聯(lián)酋被指準(zhǔn)備協(xié)助美國武力打通霍爾木茲海峽

證券時報網(wǎng) 2026-04-01 11:24:58
22242 跟貼 22242

女生分享手機原相機視頻參數(shù)，素顏保留質(zhì)感超簡單，新手也能輕松上手

理想之聲 2026-04-01 14:55:01
0 跟貼 0

聚焦時序前沿探索——2026復(fù)雜時間序列前沿論壇成功舉辦

北京大學(xué)光華管理學(xué)院 2026-04-01 19:20:51
0 跟貼 0

供應(yīng)鏈管理數(shù)智化的殘酷真相：99%的失敗，與那1%的“唯一解”

鈦媒體APP 2026-03-05 19:29:15
0 跟貼 0

Anthropic王炸Claude基準(zhǔn)測試泄露，卡皮巴拉細節(jié)曝光！還在代碼里下毒

新智元 2026-04-02 00:03:21
2 跟貼 2

俄羅斯要求烏克蘭盡快決定從頓巴斯地區(qū)撤軍

新華社 2026-04-01 20:20:24
8164 跟貼 8164

呼蘭脫口秀189票晉級，文本功底驚人揭秘！

巨信瑞 2026-04-01 04:13:34
0 跟貼 0

史詩般對決！西班牙網(wǎng)友：泰拳與少林功夫的戰(zhàn)斗是純粹的視覺盛宴

為了更好 2026-03-29 07:04:46
0 跟貼 0

1911 模型槍欣賞

飛翔大白鯨 2026-03-29 09:56:29
0 跟貼 0

指尖上的全自動風(fēng)暴毛瑟M712速射型火力邏輯與機械傳奇

番茄肚腩 2026-04-01 15:28:19
1 跟貼 1

就這參數(shù)，果然是破車

小暖暖追劇社 2026-03-29 11:55:56
1 跟貼 1

江蘇立法明確：這些事情12345熱線都管

江蘇新聞 2026-04-02 05:51:00
20 跟貼 20

這小丫頭長大不得了，和哥哥吵架不計較，邏輯清晰，表達能力強

小信新鮮事 2026-04-01 01:56:04
0 跟貼 0

萌娃給老師打電話要求退園，語言表達能力強邏輯清晰，萌翻網(wǎng)友

俄羅斯安娜 2026-04-01 01:42:37
0 跟貼 0

張旭濤：證據(jù)辯護的模型思維（二）

京都律師事務(wù)所 2026-03-30 18:03:02
0 跟貼 0

實測問界M7Pro+ 華為乾崑艙內(nèi)激光視覺的表現(xiàn)怎么樣？

第e臺車 2026-03-31 20:58:20
1 跟貼 1

廣州早茶新規(guī)：點心要24小時內(nèi)現(xiàn)制茶位費必須明碼標(biāo)價

新快報新聞 2026-04-02 08:46:04
12 跟貼 12

王毅赴人類命運共同體研究中心調(diào)研

新華社 2026-04-01 23:01:43
32 跟貼 32

別再傻扔過期藥了！這6種常備藥養(yǎng)花堪比神藥，植物吃了狂長爆盆
復(fù)轉(zhuǎn)這些年
2026-03-23 20:20:36

世界杯男單16強簽表：王楚欽再戰(zhàn)小勒布倫！溫瑞博對決林昀儒
全言作品
2026-04-02 00:32:57

下黑手了！黨內(nèi)倒戈要求鄭麗文下臺
雪中風(fēng)車
2026-02-20 15:02:04

香港演員施明去世，終年74歲，曾出演《倚天屠龍記》紫衫龍王，精通武術(shù)曾做史泰龍保鏢
大象新聞
2026-03-31 14:49:05

國際油價持續(xù)下挫布油跌幅擴大至3%
財聯(lián)社
2026-04-01 14:34:12

張雪：我以前挺喜歡雷軍，挖孔機蓋事件我會給消費者兩個選擇
金融界
2026-03-30 17:38:20

5月1日起，車牌直接當(dāng)高速通行證！不用ETC、全年24天免費
三農(nóng)老歷
2026-04-02 08:55:01

人類50多年后重返月球軌道：美“阿爾忒彌斯二號”發(fā)射成功，宇航員出發(fā)前給女兒留遺囑
紅星新聞
2026-04-02 08:23:10

加州州長紐森痛批特朗普馬斯克，稱其犯下對華十年最大錯
羽逸地之光
2026-04-02 10:26:43

35歲知名星二代，被曝生活拮據(jù)落魄，和父親斷來往，和母親也決裂
西樓知趣雜談
2026-04-02 07:52:04

太適合廣東隊！CBA內(nèi)線大殺器打成大腿，朱芳雨有望出手截胡？
緋雨兒
2026-04-02 08:25:18

美國發(fā)出全球通緝令，逮捕中國芯片科學(xué)家陳正坤，現(xiàn)在怎么樣了？
秋月寒江
2026-04-01 11:54:43

屬龍人注意！4月2號到4號，你會痛失一人，但要拿回這三樣?xùn)|西
時尚的弄潮
2026-04-01 15:28:37

英媒：中國最令人佩服的，就是美歐聯(lián)手絞殺中國光伏，還能夠翻身
丁丁鯉史紀(jì)
2026-04-01 14:55:06

撞見妻子和男閨蜜深夜擁吻，我默默抽完煙，回家為她打開了行李箱
曉艾故事匯
2026-02-05 17:19:39

全紅嬋不再隱瞞！坦言身材發(fā)胖原因，原來高敏4年內(nèi)提醒過2次
青橘罐頭
2026-04-01 17:09:37

與主帥對罵，洛夫頓遭重罰？更衣室內(nèi)幕曝光，盧偉表態(tài)，豪門沉默
萌蘭聊個球
2026-04-02 09:34:45

張本智和全家逃離日本，兩個集裝箱搬空10年家，日乒徹底慌了
乒乓助手
2026-04-02 00:07:09

奧運冠軍“拉拉鏈露胸”，讓耐克繃不住了！
品牌營銷報
2026-02-23 11:31:10

禁賽25場后，喬治轟39分創(chuàng)新高！恩比德輪休鬧劇徹底暴露76人野心
鍋子籃球
2026-04-02 10:16:04

2026-04-02 11:03:00

投資不立危墻之下

551文章數(shù) 1835關(guān)注度

往期回顧全部

科技要聞

SpaceX秘密申報IPO，估值沖刺12萬億

頭條要聞

牛彈琴：伊朗越打越生猛了發(fā)動規(guī)模最大的一次攻勢

頭條要聞

牛彈琴：伊朗越打越生猛了發(fā)動規(guī)模最大的一次攻勢

體育要聞

這六個字，代表了邵佳一的新國足

娛樂要聞

張婉婷已決定離婚找律師討論婚變事宜

財經(jīng)要聞

電商售械三水光針機構(gòu)倒貨or假貨猖獗?

汽車要聞

三電可靠用料下本百萬公里的蔚來ES6 拆開看

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

教育

時尚

健康

公開課

親子要聞

孩子咳嗽的痰，可能對應(yīng)不同的問題

教育要聞

不甘心！從民辦本科到考研上岸頂尖985名校，他拼盡全力逆襲！

女人有沒有品位看看穿搭就知道，這些造型值得借鑒，溫柔高級

干細胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習(xí)慣
李彥宏：百度離破產(chǎn)30天

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進入關(guān)懷版

<small id="80y48"></small><nav id="80y48"><sup id="80y48"></sup></nav>

<tr id="80y48"><small id="80y48"></small></tr>

<small id="80y48"></small>

<nav id="80y48"><sup id="80y48"></sup></nav>