大家好,我是冷逸。
在Gemini 3發(fā)布后,我很早就說(shuō)過(guò),我們急需要一個(gè)。
現(xiàn)在,似乎有答案了。剛剛,Kimi發(fā)布并開(kāi)源了全新的基座模型K2.5,文字/圖片/視頻理解能力Max。
![]()
K2.5模型在huggingface上開(kāi)源
感覺(jué)Kimi這次,是帶著大殺器傾巢而來(lái)。
我趕緊體驗(yàn)了一番,先說(shuō)結(jié)論:這可能是目前最強(qiáng)的開(kāi)源視覺(jué)Agentic模型。特別是前端方面,直追Gemini 3 Pro。
![]()
快速了解K2.5
簡(jiǎn)單介紹一下這個(gè)模型。
K2.5最大的特點(diǎn)是全能:
原生的多模態(tài)架構(gòu):天生具備視覺(jué)能力,理解圖片、視頻就像讀文字一樣自然。
超全的能力&性?xún)r(jià)比:K2.5同步提供快速版、思考版、Agent版和Agent集群。
基于K2.5,Kimi帶來(lái)了全新的體驗(yàn):
![]()
1)超級(jí)視覺(jué)
不僅能看,更能推理,具備Visual Reasoning和Agentic Tool Call。
256k上下文,能吃得下2小時(shí)長(zhǎng)視頻 /100MB文件,支持視覺(jué)版“大海撈針”。
2)Visual Coding
支持Image/Video to Code,所見(jiàn)即所得。
上傳一張圖片或視頻(<100MB),Kimi能秒懂你的意圖,像素級(jí)復(fù)刻一個(gè)網(wǎng)頁(yè)。
比如,復(fù)刻一個(gè)交互超級(jí)牛逼的網(wǎng)站。
![]()
3)Agent Swarm
Agent集群,能同時(shí)調(diào)度多個(gè)Agent協(xié)作,可一口氣獨(dú)立完成1500+步驟。
比如,幫我們一次性調(diào)研100家上市公司,一次下載100篇學(xué)術(shù)論文,生成100張素材圖。
4)Office Agent
Office三件套全新升級(jí),可以幫助用戶(hù)直接交付準(zhǔn)專(zhuān)業(yè)水平的辦公文檔。
![]()
5)Kimi Code
以上所有功能,現(xiàn)在已可以在kimi.com直接體驗(yàn)。
同步,Kimi還推出了全新的編程工具:Kimi Code。
Kimi Code不僅能在終端里直接運(yùn)行,也能無(wú)縫集成到VSCode、Cursor、JetBrains和Zed等主流編輯器中。
![]()
體驗(yàn)地址:www.kimi.com/code
![]()
一手實(shí)測(cè)
K2.5上線(xiàn)后,我也趕緊體驗(yàn)了一番。
1)前端復(fù)刻
之前,Gemini 3 Pro的前端復(fù)刻,被很多人玩壞了。
我用K2.5,也來(lái)試一下。
給《流浪地球》的行星發(fā)動(dòng)機(jī)做一個(gè)動(dòng)畫(huà)演示網(wǎng)頁(yè)。
![]()
參考這張圖片設(shè)計(jì)一個(gè)教學(xué)演示網(wǎng)頁(yè)。
復(fù)刻這個(gè)網(wǎng)頁(yè),讓眼珠子跟著鼠標(biāo)移動(dòng)。
![]()
復(fù)刻O(píng)penAI News。
![]()
復(fù)刻Moonshot官網(wǎng)。
![]()
更有意思的是,K2.5支持視頻復(fù)刻。可以把你喜歡的APP錄屏,然后發(fā)給K2.5,讓它設(shè)計(jì)一個(gè)類(lèi)似的產(chǎn)品。
![]()
體驗(yàn)下來(lái),前端這塊,我覺(jué)得K2.5和Gemini 3 Pro已經(jīng)沒(méi)什么區(qū)別了。頂級(jí)審美,頂級(jí)動(dòng)效,以及頂級(jí)的視覺(jué)理解能力。
2)網(wǎng)站開(kāi)發(fā)
體驗(yàn)完前端,我們來(lái)讓它做一個(gè)真正的網(wǎng)站。
上周,北京不是下雪了,我找了一張故宮雪景的圖片,打開(kāi)K2.5 Agent模式,讓它幫我設(shè)計(jì)一個(gè)網(wǎng)站。
![]()
![]()
它會(huì)自己理解這張圖的美學(xué)意境,包括設(shè)計(jì)元素、視覺(jué)效果等。
![]()
然后,調(diào)用Agent給我們進(jìn)行開(kāi)發(fā),并部署上線(xiàn)。
![]()
給大家看下最終的成品(一次輸出,沒(méi)有抽卡)。
特別是1-3屏,這排版、布局和交互真的太棒了,這就是我們的東方美學(xué)。
![]()
讓它復(fù)刻網(wǎng)站wodniack.dev,完成效果非常nice,超級(jí)酷炫。
![]()
也可以做漢堡的分層拆解動(dòng)畫(huà)。
![]()
3)批量work
如果說(shuō)前面的體驗(yàn),大家覺(jué)得“嗯,好像還不錯(cuò)”。
那Agent Swarm(Agent集群),相信我,你一定會(huì)被這個(gè)功能給驚訝到的。
![]()
體驗(yàn)地址:https://www.kimi.com/agent-swarm
最近,不是全民都在學(xué)Skills嘛,那我想讓「Agent集群」幫我整理50個(gè)高Star的Skills,于是就問(wèn)它:
幫我從GitHub上搜集50個(gè)熱門(mén)的Claude Code Skills,按照Star數(shù)從高到低排列。
初次體驗(yàn),會(huì)提示消耗3次Agent額度。想象這個(gè)工程量,只消耗3次額度似乎還是很劃算的,讓它繼續(xù)干吧。
![]()
然后,它就招來(lái)了3個(gè)助手幫我干活。每個(gè)助手的工作內(nèi)容,各不相同。
![]()
活干到一半,只收集到39個(gè)skills,還沒(méi)完成。kimi又繼續(xù)拉了小北、海明威兩位替補(bǔ)助手,繼續(xù)給我干活。
![]()
最終,集齊了50個(gè)skills,一次性給到了我。
![]()
不得不說(shuō),這個(gè)“批量work”的效果太贊了,就是速度有點(diǎn)慢(大部分時(shí)間因?yàn)楹脑贕itHub訪問(wèn)失敗的地方)。
不過(guò)沒(méi)關(guān)系,它是在K2.5 Agent自己的后臺(tái)運(yùn)行。在Agent工作期間,我完全可以去做其他事情,等有結(jié)果了再來(lái)驗(yàn)收。
所以,我又用它跑了一些其他的case。
比如,我讓它用我頭像做一系列連續(xù)性的打斗動(dòng)畫(huà)。
![]()
![]()
批量下載論文。
![]()
![]()
召集專(zhuān)家建言獻(xiàn)策,如何讓1歲孩子上北大。
![]()
以及,批量生圖。
![]()
不得不說(shuō),Kimi這次是真的把并發(fā)拉滿(mǎn)了。
從K1.5卷長(zhǎng)度,到K2卷深度思考,再到今天K2.5卷并發(fā)。每次新模型的發(fā)布,Kimi都總能給我們新的答案,而且一次比一次猛。
并發(fā)拉滿(mǎn),考驗(yàn)的不只是模型本身,而是工程、調(diào)度、成本、穩(wěn)定性的一整套系統(tǒng)能力。
這次Kimi能夠把這個(gè)產(chǎn)品做出來(lái),是真的。
4)視覺(jué)理解與推理
最后,我們考驗(yàn)一下模型基本的視覺(jué)理解和推理能力。
隨手拍了張照片(圖中大樓標(biāo)志已被抹除),問(wèn)問(wèn)它這是哪里。
![]()
沒(méi)錯(cuò),這里是北京的京東科技大廈,Kimi正是在這里辦公。
又問(wèn)了一張圖,這是什么雪山,推測(cè)一下我拍攝時(shí)的海拔高度。
![]()
非常準(zhǔn)確,玉龍雪山,海拔9,000-11,000米。
接著,我又問(wèn)了一個(gè)問(wèn)題。
![]()
其實(shí),一開(kāi)始我都不抱希望。
![]()
但是看到結(jié)果,有點(diǎn)被驚訝到了。除了航線(xiàn)外(實(shí)際為“四川成都-云南芒市”),它差一點(diǎn)就全部推理出了。
給大家看下真實(shí)的Exif信息。
![]()
K2.5也能做這樣的行測(cè)題,反正我是看不懂。
![]()
實(shí)測(cè)下來(lái),像推理地理位置、樓層高度、人物身高、作品名稱(chēng)這些,K2.5基本能猜個(gè)八九不離十,當(dāng)然還做不到100%的準(zhǔn)確。
但如果拿來(lái)分析一些股票圖、科研圖、行測(cè)題、Puzzle題、幾何題等,基本都能得到靠譜的答案,準(zhǔn)確率很高。
![]()
所以,整個(gè)體驗(yàn)下來(lái),才會(huì)有了開(kāi)篇那句話(huà)“感覺(jué)Kimi這次是帶著大殺器傾巢而來(lái)。”
K2.5快速、K2.5思考、K2.5 Agent、K2.5 Agent集群,以及新上線(xiàn)的office三件套、Kimi Code,量大管飽,應(yīng)有盡有。
![]()
這種“傾巢而來(lái)”并非雜亂無(wú)章的堆料,而是生態(tài)級(jí)的All IN,且誠(chéng)意滿(mǎn)滿(mǎn)。
快速版負(fù)責(zé)效率(日常夠用),思考版兜底復(fù)雜問(wèn)題,Agent負(fù)責(zé)把模型能力變成生產(chǎn)力,Agent集群則專(zhuān)門(mén)解決規(guī)模化問(wèn)題……
很高興,今天終于能夠有國(guó)產(chǎn)模型在多模態(tài)理解和Coding能力上追平海外頂尖模型。
而且還是開(kāi)源的。
正是,潮平兩岸闊,風(fēng)正一帆懸。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.