當(dāng)OpenAI還在為GPT-5的發(fā)布時(shí)間諱莫如深時(shí),一家成立僅兩年的AI實(shí)驗(yàn)室已經(jīng)用一份技術(shù)報(bào)告,將大模型競賽推向了新的臨界點(diǎn)。這不是關(guān)于"誰更聰明"的故事,而是關(guān)于"誰能在合理成本內(nèi)處理更長、更復(fù)雜任務(wù)"的殘酷效率革命。
「我們沒打算創(chuàng)造新紀(jì)錄,但硬件效率讓我們做到了」
![]()
2025年5月,AI實(shí)驗(yàn)室Moonshot AI發(fā)布技術(shù)報(bào)告,披露其Kimi K2系列模型的核心參數(shù):總參數(shù)量3000億,單次前向傳播激活參數(shù)320億,標(biāo)準(zhǔn)上下文窗口25.6萬token,測試環(huán)境支持長達(dá)1.6億字符的超長文本處理。在多項(xiàng)基準(zhǔn)測試中,Kimi K2-Instruct在代碼生成、數(shù)學(xué)推理和多模態(tài)理解任務(wù)上達(dá)到或超越了當(dāng)前頂尖水平。
更令業(yè)界側(cè)目的是其定價(jià)策略。Kimi K2的API調(diào)用成本為:輸入每百萬token 1美元(緩存命中)/4美元(緩存未命中),輸出每百萬token 10美元。作為對比,OpenAI GPT-4.1的對應(yīng)價(jià)格分別為2美元、10美元和40美元。這意味著,在輸出環(huán)節(jié),Kimi K2的成本僅為行業(yè)標(biāo)桿產(chǎn)品的四分之一。
Moonshot AI工程副總裁許欣然在接受采訪時(shí)表示:「我們并沒有打算在定價(jià)上創(chuàng)造什么新紀(jì)錄,只是當(dāng)硬件效率提升到一定程度后,這樣的價(jià)格變得可行。」這番表態(tài)背后,是AI基礎(chǔ)設(shè)施領(lǐng)域一場靜悄悄的成本重構(gòu)。
從"大力出奇跡"到"精準(zhǔn)激活":稀疏架構(gòu)的逆襲
Kimi K2的技術(shù)突破核心在于稀疏混合專家架構(gòu)(Mixture-of-Experts, MoE)的工程化落地。傳統(tǒng)稠密模型在每次推理時(shí)激活全部參數(shù),而MoE架構(gòu)通過路由機(jī)制,僅調(diào)用與當(dāng)前任務(wù)相關(guān)的"專家"子網(wǎng)絡(luò)。Kimi K2的3000億總參數(shù)中,每次前向傳播僅激活320億——激活率約10.7%,卻實(shí)現(xiàn)了與全參數(shù)模型相當(dāng)甚至更優(yōu)的性能。
這種架構(gòu)選擇直接轉(zhuǎn)化為經(jīng)濟(jì)優(yōu)勢。據(jù)Moonshot AI披露,Kimi K2在標(biāo)準(zhǔn)長上下文推理場景下的硬件成本,較同等能力的稠密模型降低約60%。更關(guān)鍵的是,超長上下文能力的解鎖并非簡單堆砌算力,而是通過改進(jìn)的位置編碼算法和注意力機(jī)制優(yōu)化,將1.6億字符的處理延遲控制在可接受范圍內(nèi)。
一位參與Kimi K2評估的第三方研究人員評價(jià):「長上下文不是炫技。當(dāng)你需要分析整本技術(shù)手冊、調(diào)試數(shù)萬行代碼庫,或者處理跨季度的財(cái)務(wù)報(bào)告時(shí),模型能否'記住'開頭的內(nèi)容,決定了它是否具備實(shí)用價(jià)值。」
多模態(tài)與智能體:AI從"聊天工具"向"工作系統(tǒng)"進(jìn)化
Kimi K2的另一重突破在于原生多模態(tài)能力和智能體(Agent)框架的深度整合。技術(shù)報(bào)告顯示,該模型支持文本、高分辨率圖像和視頻序列的聯(lián)合推理,并內(nèi)置了視覺感知驅(qū)動的任務(wù)執(zhí)行模塊。
在官方演示案例中,Kimi K2展示了"自主研究"能力:接收用戶指令后,模型可自主規(guī)劃信息檢索路徑,調(diào)用搜索引擎和數(shù)據(jù)庫,整合多源信息生成結(jié)構(gòu)化報(bào)告。這一能力基于Moonshot AI自研的OK Computer智能體框架,該框架支持復(fù)雜工作流的自動化編排,包括代碼執(zhí)行、文件處理和外部工具調(diào)用。
「智能體的價(jià)值不在于單次對話的質(zhì)量,而在于能否完成需要多步驟、跨工具協(xié)作的完整任務(wù)。」Moonshot AI產(chǎn)品負(fù)責(zé)人指出。這一判斷與行業(yè)趨勢高度吻合——2024年以來,Google、OpenAI、Anthropic等頭部廠商均將智能體列為核心戰(zhàn)略方向,但多數(shù)產(chǎn)品仍停留在演示階段,實(shí)際落地受限于可靠性不足和成本過高。
Kimi K2的定價(jià)策略可能加速這一領(lǐng)域的商業(yè)化進(jìn)程。以典型的研究任務(wù)為例,若需處理約10萬token的輸入并生成2萬token的輸出,使用Kimi K2的成本約為3美元,而使用GPT-4.1則超過12美元。對于需要高頻調(diào)用智能體的企業(yè)場景,這一差距將迅速累積為決定性的成本優(yōu)勢。
開源策略與生態(tài)博弈:中國AI的"側(cè)翼包抄"
Moonshot AI選擇以開源模型撬動市場。Kimi K2-Instruct及配套工具鏈已向研究社區(qū)開放,允許非商業(yè)用途的免費(fèi)使用和修改。這一策略與Meta的Llama系列、阿里巴巴的Qwen系列形成呼應(yīng),共同構(gòu)成對OpenAI、Google等閉源陣營的包抄態(tài)勢。
開源模型的競爭力正在經(jīng)歷質(zhì)變。據(jù)技術(shù)評測平臺Artificial Analysis的數(shù)據(jù),Kimi K2-Instruct在MMLU-Pro(專業(yè)知識)、GPQA Diamond(科學(xué)推理)和HumanEval(代碼能力)等基準(zhǔn)上的得分,已接近或超過GPT-4 Turbo和Claude 3 Opus等閉源旗艦?zāi)P汀_@意味著,企業(yè)客戶在選擇AI基礎(chǔ)設(shè)施時(shí),"性能差距"這一傳統(tǒng)顧慮正在消解,"成本控制"和"定制自由"的權(quán)重持續(xù)上升。
許欣然透露,Moonshot AI的下一階段的研發(fā)重點(diǎn)包括:將上下文窗口擴(kuò)展至10億字符級別,實(shí)現(xiàn)真正意義上的"全文檔"處理;優(yōu)化智能體框架的可靠性,將復(fù)雜任務(wù)的成功率從當(dāng)前的70%提升至90%以上;以及探索模型與邊緣計(jì)算設(shè)備的協(xié)同,降低延遲敏感型應(yīng)用的部署門檻。
AI競賽的底層邏輯正在發(fā)生轉(zhuǎn)移。當(dāng)模型能力跨越"可用"閾值后,決定市場格局的變量從實(shí)驗(yàn)室里的基準(zhǔn)測試分?jǐn)?shù),轉(zhuǎn)向工程化落地中的成本曲線和生態(tài)黏性。Kimi K2的出現(xiàn)證明,在3000億參數(shù)與1.6億字符的尺度上,效率創(chuàng)新可以比規(guī)模創(chuàng)新更具破壞力——這不是終點(diǎn),而是新一輪基礎(chǔ)設(shè)施重構(gòu)的起點(diǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.