網易首頁 > 網易號 > 正文申請入駐

邁向AI4S 2.0，書生Intern-S1-Pro萬億MoE科學大模型開源

2026-02-08 17:47:11　來源: wisemodel開源社區

北京舉報

分享至

始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區，始終堅持“中立、開放、共建、共創、合作”五項基本原則，歡迎加入共同成長。

2月4日，上海人工智能實驗室開源基于“通專融合”技術架構SAGE打造的萬億參數科學多模態大模型 Intern-S1-Pro，為AI4S從“工具革命”的1.0階段邁向以“革命的工具”驅動科學發現的2.0時代，提供創新的系統性開源基座。

作為當前全球開源社區中參數規模最大的科學多模態模型，Intern-S1-Pro的核心科學能力實現了質的躍升，高難度綜合學科評測穩居AI4S領域國際領先水平，復雜數理邏輯推理能力達奧賽金牌水平，面向真實科研流程的智能體能力位居開源模型第一梯隊。

此次發布的Intern-S1-Pro是通過SAGE實現 “可深度專業化通用模型” 的關鍵實踐。該模型基于混合專家架構（MoE），共擁有512個專家，總參數達1T，每次調用僅激活8個專家、22B參數。其通用能力和科學能力協同演進，并在底層架構實現了兩大核心突破：在SAGE的基礎模型層，通過引入傅里葉位置編碼①并重構時序編碼器，賦予模型統一理解從微觀生命信號到宏觀宇宙波動的“物理直覺”；通過高效路由機制，系統攻克了訓練萬億參數MoE模型在穩定性與算力效率上的瓶頸，為超大規模模型的訓練提供了關鍵的工程基礎。

與此同時，Intern-S1-Pro驗證了從原創模型架構到國產算力基座自主技術的完整鏈路，為構建開放共享的AGI4S基礎設施奠定了堅實底座。通過開源開放，Intern-S1-Pro旨在降低全球科研門檻，與學術界和產業界共同推動以通用人工智能驅動科學發現的范式革命。模型已經發布在始智AI wisemodel開源社區，應用空間（wisemodel.cn/apps）也將可以直接在線體驗，歡迎前往了解和嘗試。

模型地址

https://wisemodel.cn/models/Intern/Intern-S1-Pro

01.

創新底層架構：

突破萬億參數科學模型邊界

上海人工智能實驗室主任、首席科學家周伯文提出：可深度專業化通用模型（Specializable Generalist）是實現AGI的可行路徑，其關鍵挑戰在于：專家化模型在訓練過程中需要低成本、能規模化的密集反饋；能夠持續不斷地學習與主動探索，并具備為同一個問題提供多視角、多種解決方案的能力；并能引入對物理世界規律的考量，兼顧多項差異化能力的學習效率與性能。

Intern-S1-Pro通過多項SAGE基礎模型層的技術創新，拓寬了模型應用邊界、提升了超大規模訓練可行性，推進了可深度專業化通用模型的探索。

為構建能更深層次理解物理世界規律的科學大模型，研究團隊引入了傅里葉位置編碼（FoPE）并重構時序編碼器。FoPE為AI賦予雙重視角：既能像看“粒子”一樣捕捉文字之間的相對距離，又能像分析“波”一樣把握科學信號的整體規律與頻率。科學數據與語言的差異還體現在多尺度上，基于能自動適應數據密度的時序編碼器，模型首次能統一處理從寥寥數個到百萬級采樣的各類信號，支持的分析對象從天文、地理直接拓展至生理信號、生物聲學等領域，從而實現感知能力的重大躍遷。

為了高效訓練承載這些能力的萬億參數超大規模模型，研究團隊革新了其內部的“路由機制”。傳統方法存在訓練低效和算力浪費兩大痛點。新技術通過 “路由稠密估計” ，讓模型在高效運行的同時能進行更充分的學習，提升了穩定性；進而通過 “分組路由”策略，像智能交通系統一樣使海量計算芯片實現負載均衡，避免了資源閑置。通過算法與系統的協同創新，同時攻克了超大規模模型訓練在“學習效率”和“資源調度”上的核心瓶頸，為高效、穩健地訓練下一代萬億參數模型提供了關鍵基礎。

通過上述底層架構的創新，Intern-S1-Pro不僅在規模上刷新了科學多模態模型的參數規模上限，也為SAGE架構所提出的“通用能力與專業能力協同演進”提供了可落地的實現路徑。

02.

科學能力再進化，通用能力協同演進

得益于創新的底層架構設計與萬億參數超大規模訓練策略，Intern-S1-Pro的科學能力進一步升級。

在國際數學奧林匹克IMO-Answer-Bench和國際物理奧林匹克IPhO2025兩大權威基準測試中，Intern-S1-Pro均展現出競賽級別的解題能力。

在AI4S關鍵垂類領域，Intern-S1-Pro成功構建了一個跨越化學、材料、生命、地球、物理五大核心學科的全譜系能力矩陣，涵蓋100多個專業子任務，不僅在Mol-Instruction、Biology-Instruction等單學科垂類評測中表現優異，更在SciReasoner等高難度的綜合學科評測基準中，取得了與閉源商業大模型及垂類SOTA模型相當，甚至更優的成績，穩居AI4S領域的第一梯隊。

在基礎理解維度，Intern-S1-Pro基于高精度多模態感知能力，能夠精準解析復雜的分子結構圖及各類實驗圖表，深入到邏輯推理層面，Intern-S1-Pro能夠處理高階科學問答，如反應條件推斷、理化性質預測，精準捕捉數據背后的因果規律等。隨著理解與推理能力的持續增強，Intern-S1-Pro的能力邊界不斷向真實科研場景延伸，其應用范圍從微觀層面的化學逆合成、蛋白質序列生成，拓展至宏觀尺度的遙感圖像分析等復雜任務。通過XLRS-Bench等真實科研場景評測，模型展現出從“解題”邁向“解決問題”的科研生產力價值，為前沿科學探索提供了堅實支撐。

同時，借助通專融合技術路線，Intern-S1-Pro在通用能力與專業科學能力上實現協同進階：在圖文跨模態理解、科學圖表邏輯推理、多場景視覺感知，以及高質量自然語言生成和復雜指令精準遵循等核心維度，Intern-S1-Pro均穩居開源模型陣營第一梯隊，展現出扎實而全面的綜合實力。

通過通專融合的訓練策略，Intern-S1-Pro不僅補齊了傳統前沿模型在專業推理上的短板，還實現了多模態與文本通用能力的均衡發展，真正將通用能力與專業科學能力的協同演進落到實處，為科研場景下復雜問題的理解、推理與應用提供了可靠支撐。

在智能體能力方面，Intern-S1-Pro實現了從“靜態任務規劃”到“動態環境交互”的跨越式進階。在以動態環境與復雜交互為核心的Tau-2評測中達到了國際一流水平，為賦能復雜科學智能體打下了堅實基礎。

03.

筑牢“算力-算法”一體化基座

在規模、性能提升的同時，Intern-S1-Pro構建了原創的“算力-算法”一體化基座。模型從架構設計之初，便與昇騰計算生態確立聯合研發路線，實現了從最底層的算子、編譯優化到上層的訓練、推理框架的深度全棧適配。

研發團隊攻克了大規模訓練中精度對齊、超長序列強化學習穩定性、硬件性能極致釋放等一系列核心技術難題，基于XTuner V1訓練框架的精細優化與LMDeploy推理引擎的高效部署，結合先進的內存管理與并行策略，確保了萬億參數模型訓練的高效與穩定。通過創新的全異步強化學習框架等技術的應用，大幅提升了訓練效率，降低了研發成本與門檻，此外，Intern-S1-Pro還與沐曦聯合研發利用模型加速算子適配，為開放共享、面向未來的AGI4S基礎設施奠定了堅實基礎。

04.

高質量開源賦能創新生態

自2023年書生大模型首次發布以來，上海AI實驗室已逐步構建起豐富的書生大模型家族，包括科學多模態模型Intern-S1、大語言模型書生·浦語InternLM、多模態模型書生·萬象InternVL、強推理模型書生·思客InternThinker等。同時首創并開源了面向大模型研發與應用的全鏈路開源工具體系，覆蓋數據處理、預訓練、微調、部署、評測與應用等關鍵環節，包含訓練框架XTuner、部署推理框架LMDeploy、評測框架OpenCompass、高效文檔解析工具MinerU，以及思索式AI搜索應用MindSearch等在內的核心工具已全面開源，大部分也都同步發布在wisemodel開源社區，形成覆蓋數十萬開發者參與的活躍開源社區。

自發布以來，Intern-S1多次登頂HuggingFace全球多模態榜單，累計下載超41萬次，并獲得近200家科研機構和企業的合作申請。其卓越的跨模態科學理解能力不僅為科研提供了高效工具，也通過開源降低了全球科研團隊邁入AGI for Science的門檻。未來，在研究范式創新及模型能力提升的基礎上，上海AI實驗室將推進Intern-S1及其全鏈條工具體系持續開源，支持免費商用，同時提供線上開放服務，與全球合作伙伴共建更加開放、高效的科學AI生態。

案例展示：

----- END -----

wisemodel相關：

系列模型：

關于wisemodel更多

歡迎持續關注和支持

開源社區建設需要長期堅持和投入，更需要廣大用戶的積極參與、貢獻和維護，歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果，包括模型、數據集和代碼等發布到 wisemodel.cn 社區，共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信，申請加入wisemodel社群，持續關注wisemodel.cn開源社區動態。

歡迎加盟wisemodel開源社區

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果，鼓勵高校實驗室、大企業研究團隊、個人等，在wisemodel平臺上分享各類優質內容，可以是AI領域最新論文解讀、最新開源成果介紹，也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn，也可以掃碼添加wisemodel微信。

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立，旨在打造和建設中立開放的AI開源創新社區，將打造成“HuggingFace”之外最活躍的AI開源社區，匯聚主要AI開源模型、數據集和代碼等，歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者，以及政府部門、學會協會、聯盟、基金會等，還有投資機構、科技媒體等，共同參與建設AI開源創新生態。

向上滑動查看

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.