3000億參數(shù)、1.6億上下文、400美元：AI推理的"摩爾定律"正在改寫

2026-03-18 18:49:50　來源: 硅嶼手記

北京舉報(bào)

分享至

當(dāng)OpenAI還在為GPT-5的發(fā)布時(shí)間諱莫如深時(shí)，一家成立僅兩年的AI實(shí)驗(yàn)室已經(jīng)用一份技術(shù)報(bào)告，將大模型競賽推向了新的臨界點(diǎn)。這不是關(guān)于"誰更聰明"的故事，而是關(guān)于"誰能在合理成本內(nèi)處理更長、更復(fù)雜任務(wù)"的殘酷效率革命。

「我們沒打算創(chuàng)造新紀(jì)錄，但硬件效率讓我們做到了」

2025年5月，AI實(shí)驗(yàn)室Moonshot AI發(fā)布技術(shù)報(bào)告，披露其Kimi K2系列模型的核心參數(shù)：總參數(shù)量3000億，單次前向傳播激活參數(shù)320億，標(biāo)準(zhǔn)上下文窗口25.6萬token，測試環(huán)境支持長達(dá)1.6億字符的超長文本處理。在多項(xiàng)基準(zhǔn)測試中，Kimi K2-Instruct在代碼生成、數(shù)學(xué)推理和多模態(tài)理解任務(wù)上達(dá)到或超越了當(dāng)前頂尖水平。

更令業(yè)界側(cè)目的是其定價(jià)策略。Kimi K2的API調(diào)用成本為：輸入每百萬token 1美元（緩存命中）/4美元（緩存未命中），輸出每百萬token 10美元。作為對比，OpenAI GPT-4.1的對應(yīng)價(jià)格分別為2美元、10美元和40美元。這意味著，在輸出環(huán)節(jié)，Kimi K2的成本僅為行業(yè)標(biāo)桿產(chǎn)品的四分之一。

Moonshot AI工程副總裁許欣然在接受采訪時(shí)表示：「我們并沒有打算在定價(jià)上創(chuàng)造什么新紀(jì)錄，只是當(dāng)硬件效率提升到一定程度后，這樣的價(jià)格變得可行。」這番表態(tài)背后，是AI基礎(chǔ)設(shè)施領(lǐng)域一場靜悄悄的成本重構(gòu)。

從"大力出奇跡"到"精準(zhǔn)激活"：稀疏架構(gòu)的逆襲

Kimi K2的技術(shù)突破核心在于稀疏混合專家架構(gòu)（Mixture-of-Experts, MoE）的工程化落地。傳統(tǒng)稠密模型在每次推理時(shí)激活全部參數(shù)，而MoE架構(gòu)通過路由機(jī)制，僅調(diào)用與當(dāng)前任務(wù)相關(guān)的"專家"子網(wǎng)絡(luò)。Kimi K2的3000億總參數(shù)中，每次前向傳播僅激活320億——激活率約10.7%，卻實(shí)現(xiàn)了與全參數(shù)模型相當(dāng)甚至更優(yōu)的性能。

這種架構(gòu)選擇直接轉(zhuǎn)化為經(jīng)濟(jì)優(yōu)勢。據(jù)Moonshot AI披露，Kimi K2在標(biāo)準(zhǔn)長上下文推理場景下的硬件成本，較同等能力的稠密模型降低約60%。更關(guān)鍵的是，超長上下文能力的解鎖并非簡單堆砌算力，而是通過改進(jìn)的位置編碼算法和注意力機(jī)制優(yōu)化，將1.6億字符的處理延遲控制在可接受范圍內(nèi)。

一位參與Kimi K2評估的第三方研究人員評價(jià)：「長上下文不是炫技。當(dāng)你需要分析整本技術(shù)手冊、調(diào)試數(shù)萬行代碼庫，或者處理跨季度的財(cái)務(wù)報(bào)告時(shí)，模型能否'記住'開頭的內(nèi)容，決定了它是否具備實(shí)用價(jià)值。」

多模態(tài)與智能體：AI從"聊天工具"向"工作系統(tǒng)"進(jìn)化

Kimi K2的另一重突破在于原生多模態(tài)能力和智能體（Agent）框架的深度整合。技術(shù)報(bào)告顯示，該模型支持文本、高分辨率圖像和視頻序列的聯(lián)合推理，并內(nèi)置了視覺感知驅(qū)動的任務(wù)執(zhí)行模塊。

在官方演示案例中，Kimi K2展示了"自主研究"能力：接收用戶指令后，模型可自主規(guī)劃信息檢索路徑，調(diào)用搜索引擎和數(shù)據(jù)庫，整合多源信息生成結(jié)構(gòu)化報(bào)告。這一能力基于Moonshot AI自研的OK Computer智能體框架，該框架支持復(fù)雜工作流的自動化編排，包括代碼執(zhí)行、文件處理和外部工具調(diào)用。

「智能體的價(jià)值不在于單次對話的質(zhì)量，而在于能否完成需要多步驟、跨工具協(xié)作的完整任務(wù)。」Moonshot AI產(chǎn)品負(fù)責(zé)人指出。這一判斷與行業(yè)趨勢高度吻合——2024年以來，Google、OpenAI、Anthropic等頭部廠商均將智能體列為核心戰(zhàn)略方向，但多數(shù)產(chǎn)品仍停留在演示階段，實(shí)際落地受限于可靠性不足和成本過高。

Kimi K2的定價(jià)策略可能加速這一領(lǐng)域的商業(yè)化進(jìn)程。以典型的研究任務(wù)為例，若需處理約10萬token的輸入并生成2萬token的輸出，使用Kimi K2的成本約為3美元，而使用GPT-4.1則超過12美元。對于需要高頻調(diào)用智能體的企業(yè)場景，這一差距將迅速累積為決定性的成本優(yōu)勢。

開源策略與生態(tài)博弈：中國AI的"側(cè)翼包抄"

Moonshot AI選擇以開源模型撬動市場。Kimi K2-Instruct及配套工具鏈已向研究社區(qū)開放，允許非商業(yè)用途的免費(fèi)使用和修改。這一策略與Meta的Llama系列、阿里巴巴的Qwen系列形成呼應(yīng)，共同構(gòu)成對OpenAI、Google等閉源陣營的包抄態(tài)勢。

開源模型的競爭力正在經(jīng)歷質(zhì)變。據(jù)技術(shù)評測平臺Artificial Analysis的數(shù)據(jù)，Kimi K2-Instruct在MMLU-Pro（專業(yè)知識）、GPQA Diamond（科學(xué)推理）和HumanEval（代碼能力）等基準(zhǔn)上的得分，已接近或超過GPT-4 Turbo和Claude 3 Opus等閉源旗艦?zāi)Ｐ汀＿@意味著，企業(yè)客戶在選擇AI基礎(chǔ)設(shè)施時(shí)，"性能差距"這一傳統(tǒng)顧慮正在消解，"成本控制"和"定制自由"的權(quán)重持續(xù)上升。

許欣然透露，Moonshot AI的下一階段的研發(fā)重點(diǎn)包括：將上下文窗口擴(kuò)展至10億字符級別，實(shí)現(xiàn)真正意義上的"全文檔"處理；優(yōu)化智能體框架的可靠性，將復(fù)雜任務(wù)的成功率從當(dāng)前的70%提升至90%以上；以及探索模型與邊緣計(jì)算設(shè)備的協(xié)同，降低延遲敏感型應(yīng)用的部署門檻。

AI競賽的底層邏輯正在發(fā)生轉(zhuǎn)移。當(dāng)模型能力跨越"可用"閾值后，決定市場格局的變量從實(shí)驗(yàn)室里的基準(zhǔn)測試分?jǐn)?shù)，轉(zhuǎn)向工程化落地中的成本曲線和生態(tài)黏性。Kimi K2的出現(xiàn)證明，在3000億參數(shù)與1.6億字符的尺度上，效率創(chuàng)新可以比規(guī)模創(chuàng)新更具破壞力——這不是終點(diǎn)，而是新一輪基礎(chǔ)設(shè)施重構(gòu)的起點(diǎn)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.