《科創(chuàng)板日報》4月20日訊(記者 敖瑾)在推理拐點敘事持續(xù)強化的背景下,圍繞推理效率的算力架構(gòu)出現(xiàn)分化,一批嘗試重構(gòu)算力架構(gòu)的初創(chuàng)公司也隨之開始浮出水面。
近日,LPU初創(chuàng)企業(yè)元川微宣布完成數(shù)億元天使輪系列融資,參與投資方包括元禾原點、峰瑞資本、中芯聚源、深創(chuàng)投、東方嘉富、浙江省科創(chuàng)母基金以及上市公司星宸科技、智微智能等多元投資平臺。公司方面表示,本輪融資資金將主要用于第一代LPU+架構(gòu)AI推理芯片的研發(fā)與量產(chǎn)。
LPU架構(gòu)進(jìn)入主流視野,很大程度上源于Groq的快速崛起。作為專注推理算力的代表性公司,Groq在低時延、高吞吐及能效上的表現(xiàn),引發(fā)市場對通用算力路徑之外技術(shù)路線的重新審視。
2025年下半年,英偉達(dá)豪擲200億美元,實質(zhì)性整合了Groq的推理技術(shù)資產(chǎn)。到了今年3月,黃仁勛在GTC大會上展示了這項交易的最新成果:Groq的LPU架構(gòu)已被深度集成到英偉達(dá)的Vera Rubin平臺中,提供面向Agent的實時推理算力。
在產(chǎn)業(yè)龍頭的領(lǐng)銜押注下,圍繞推理場景的算力架構(gòu)重構(gòu),正在從邊緣探索走向產(chǎn)業(yè)前臺。
華為芯片老兵押注LPU架構(gòu)
元川微成立于2025年9月,創(chuàng)始人楊濱此前任職于華為,曾在2008年赴美組建華為處理器團(tuán)隊,2012年回國后主導(dǎo)華為無線基帶算法與芯片部門。
楊濱在一檔播客中曾表示,他早前已看好LPU這一架構(gòu)路徑,但直到2025年初DeepSeek-R1技術(shù)報告發(fā)布,才真正堅定了下場創(chuàng)業(yè)的決心。“論文給我觸動極大,大模型終于不是泡沫了,可用了。 模型能力很強,成本降到了大家可以使用的階段。那天晚上我把論文看完,覺得終于可以下場了。”
LPU通常指面向大模型推理場景設(shè)計的專用架構(gòu),其核心在于通過優(yōu)化數(shù)據(jù)流、存儲與調(diào)度方式,讓數(shù)據(jù)在芯片內(nèi)部“少繞路”,同時減少運行過程中的動態(tài)調(diào)度,從而提升響應(yīng)速度并降低能耗。
落地到產(chǎn)品側(cè),元川微目前的規(guī)劃是,擬面向不同推理場景進(jìn)行分層布局,包括面向數(shù)據(jù)中心和高端邊緣節(jié)點的推理芯片,強調(diào)高性能、復(fù)雜場景;以及面向大端側(cè)和邊緣側(cè)的推理方案,更側(cè)重連接能力以及面向行業(yè)場景的功能適配
這一規(guī)劃來自于團(tuán)隊對推理需求本身變化的判斷。“短期內(nèi)推理需求仍將主要集中在數(shù)據(jù)中心及部分邊緣節(jié)點,但隨著Agent、具身智能等應(yīng)用逐步落地,推理負(fù)載將持續(xù)向終端側(cè)延伸,邊端有望成為下一階段的重要增長點。”楊濱對《科創(chuàng)板日報》記者表示。
據(jù)公司方面介紹,元川微目前仍處于研發(fā)階段,已完成系統(tǒng)仿真、原型驗證及FPGA驗證,下一步將推進(jìn)產(chǎn)品定義、客戶對接以及軟件生態(tài)與工具鏈建設(shè),并計劃于明年上半年完成投片。
值得一提的是,在仍處于研發(fā)階段的情況下,元川微即獲得了多方資本加持。其近期官宣的天使輪系列融資,就集結(jié)了頭部財務(wù)投資機構(gòu)、政府投資平臺以及上市公司等的參與,包括中芯聚源、深創(chuàng)投、東方嘉富、元禾原點、峰瑞資本、浙江省科創(chuàng)母基金、杭州潤苗基金以及星宸科技、智微智能等。
對于產(chǎn)業(yè)方在公司早期階段的押注,楊濱對《科創(chuàng)板日報》記者表示,兩家上市公司股東一定程度上分別代表了不同的市場切入方向,一個深耕算力中心,一個布局大端側(cè)與邊緣側(cè),與元川微的產(chǎn)品分層邏輯契合,因此它們兼具了股東和客戶的身份,“產(chǎn)業(yè)方目前在產(chǎn)品定義、供應(yīng)鏈和早期市場上都給了元川微實際的支持。”楊濱進(jìn)一步表示,產(chǎn)業(yè)方更看重的是系統(tǒng)方案落地后,能否真正改善每瓦特性能與每token成本,“賬能算回來,他們才會投。”
算力變局下的產(chǎn)業(yè)機遇
在楊濱看來,LPU架構(gòu)的興起,更本質(zhì)的原因在于算力需求結(jié)構(gòu)的變化。
他認(rèn)為,當(dāng)前算力消費的主體已經(jīng)發(fā)生變化,“簡單的碳基消費者,變成了碳基和硅基混合的消費模式。”也就是說,算力的調(diào)用方已經(jīng)不只是人,還有Agent。
而這一變化帶來的不只是量的壓力。人與AI對話每秒不過幾十個token,但Agent之間協(xié)同時交互量可能是這個數(shù)字的十倍乃至百倍,因此,現(xiàn)在階段的推理基礎(chǔ)設(shè)施,在每用戶每秒的token提供能力、每token的成本、每token的能耗上,都和滿足實際需求存在巨大差距。”楊濱據(jù)此判斷,推理算力的基礎(chǔ)設(shè)施,正處于一個重構(gòu)的轉(zhuǎn)折點。
值得一提的是,黃仁勛也在近期的公開表態(tài)中,持續(xù)強調(diào)推理拐點來臨后,算力評價體系的重構(gòu),推理算力逐漸從附屬環(huán)節(jié)走向核心環(huán)節(jié)。標(biāo)志性的體現(xiàn)就是,成立了9年的Groq,因為英偉達(dá)一筆高達(dá)200億美元的整合性收購,驟然站在了AI行業(yè)的聚光燈下。
不過,僅從國內(nèi)來看,真正意義上以LPU為核心路線的企業(yè)仍屬少數(shù)。
目前,多數(shù)AI芯片公司仍沿GPU或通用算力路徑推進(jìn),通過兼顧訓(xùn)練與推理提升性能;包括元川微、邁特芯、深明奧思等少數(shù)幾家企業(yè),正在嘗試以推理為中心重新設(shè)計架構(gòu),屬于尚未形成共識的探索方向。
這一格局的形成,與技術(shù)路徑選擇及產(chǎn)業(yè)階段密切相關(guān)。一方面,相較在既有架構(gòu)上進(jìn)行優(yōu)化,從推理場景出發(fā)重新設(shè)計芯片架構(gòu),對系統(tǒng)設(shè)計能力與工程積累提出更高要求;另一方面,推理需求雖在快速增長,但其具體應(yīng)用形態(tài)仍在演進(jìn)之中,產(chǎn)業(yè)側(cè)對新架構(gòu)的接受度仍有待進(jìn)一步驗證。楊濱亦在采訪中對《科創(chuàng)板日報》記者坦言,工藝制程與先進(jìn)IP的制約是繞不開的門檻,而在產(chǎn)業(yè)共識尚未形成的早期,愿意理解這條路線的人本就不多。
不過他也表示,推理場景相較訓(xùn)練,對現(xiàn)有軟件生態(tài)的依賴要低得多,這種相對寬松的生態(tài)約束,對國內(nèi)推理芯片的創(chuàng)業(yè)者而言事實上是一個窗口機遇。
值得一提的是,從更廣泛的行業(yè)視角來看,推理算力的興起,已經(jīng)為更多產(chǎn)業(yè)鏈環(huán)節(jié)帶來了結(jié)構(gòu)性機會。
隨著token消耗提升,對算力密度、帶寬及能效的要求同步上升,除了芯片架構(gòu)層面,這一趨勢的影響也在向上游硬件體系傳導(dǎo),帶動包括服務(wù)器互聯(lián)、PCB及高速材料等環(huán)節(jié)的需求提升。可以看到,相關(guān)上市公司在過去一段時間股價已經(jīng)經(jīng)歷了一輪陡峭上升,資金對這一方向的關(guān)注度持續(xù)提升。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.