337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

邁向AI4S 2.0,書生Intern-S1-Pro萬億MoE科學大模型開源

0
分享至


始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區,始終堅持“中立、開放、共建、共創、合作”五項基本原則,歡迎加入共同成長。

2月4日,上海人工智能實驗室開源基于“通專融合”技術架構SAGE打造的萬億參數科學多模態大模型 Intern-S1-Pro,為AI4S從“工具革命”的1.0階段邁向以“革命的工具”驅動科學發現的2.0時代,提供創新的系統性開源基座。

作為當前全球開源社區中參數規模最大的科學多模態模型,Intern-S1-Pro的核心科學能力實現了質的躍升,高難度綜合學科評測穩居AI4S領域國際領先水平,復雜數理邏輯推理能力達奧賽金牌水平,面向真實科研流程的智能體能力位居開源模型第一梯隊。

此次發布的Intern-S1-Pro是通過SAGE實現 “可深度專業化通用模型” 的關鍵實踐。該模型基于混合專家架構(MoE),共擁有512個專家,總參數達1T,每次調用僅激活8個專家、22B參數。其通用能力和科學能力協同演進,并在底層架構實現了兩大核心突破:在SAGE的基礎模型層,通過引入傅里葉位置編碼①并重構時序編碼器,賦予模型統一理解從微觀生命信號到宏觀宇宙波動的“物理直覺”;通過高效路由機制,系統攻克了訓練萬億參數MoE模型在穩定性與算力效率上的瓶頸,為超大規模模型的訓練提供了關鍵的工程基礎。

與此同時,Intern-S1-Pro驗證了從原創模型架構到國產算力基座自主技術的完整鏈路,為構建開放共享的AGI4S基礎設施奠定了堅實底座。通過開源開放,Intern-S1-Pro旨在降低全球科研門檻,與學術界和產業界共同推動以通用人工智能驅動科學發現的范式革命。模型已經發布在始智AI wisemodel開源社區應用空間(wisemodel.cn/apps也將可以直接在線體驗,歡迎前往了解和嘗試。


模型地址

https://wisemodel.cn/models/Intern/Intern-S1-Pro


01.

創新底層架構:

突破萬億參數科學模型邊界

上海人工智能實驗室主任、首席科學家周伯文提出:可深度專業化通用模型(Specializable Generalist)是實現AGI的可行路徑,其關鍵挑戰在于:專家化模型在訓練過程中需要低成本、能規模化的密集反饋;能夠持續不斷地學習與主動探索,并具備為同一個問題提供多視角、多種解決方案的能力;并能引入對物理世界規律的考量,兼顧多項差異化能力的學習效率與性能。

Intern-S1-Pro通過多項SAGE基礎模型層的技術創新,拓寬了模型應用邊界、提升了超大規模訓練可行性,推進了可深度專業化通用模型的探索。

為構建能更深層次理解物理世界規律的科學大模型,研究團隊引入了傅里葉位置編碼(FoPE)重構時序編碼器。FoPE為AI賦予雙重視角:既能像看“粒子”一樣捕捉文字之間的相對距離,又能像分析“波”一樣把握科學信號的整體規律與頻率。科學數據與語言的差異還體現在多尺度上,基于能自動適應數據密度的時序編碼器,模型首次能統一處理從寥寥數個到百萬級采樣的各類信號,支持的分析對象從天文、地理直接拓展至生理信號、生物聲學等領域,從而實現感知能力的重大躍遷。

為了高效訓練承載這些能力的萬億參數超大規模模型,研究團隊革新了其內部的“路由機制”。傳統方法存在訓練低效和算力浪費兩大痛點。新技術通過 “路由稠密估計” ,讓模型在高效運行的同時能進行更充分的學習,提升了穩定性;進而通過 “分組路由”策略,像智能交通系統一樣使海量計算芯片實現負載均衡,避免了資源閑置。通過算法與系統的協同創新,同時攻克了超大規模模型訓練在“學習效率”和“資源調度”上的核心瓶頸,為高效、穩健地訓練下一代萬億參數模型提供了關鍵基礎。

通過上述底層架構的創新,Intern-S1-Pro不僅在規模上刷新了科學多模態模型的參數規模上限,也為SAGE架構所提出的“通用能力與專業能力協同演進”提供了可落地的實現路徑。

02.

科學能力再進化,通用能力協同演進

得益于創新的底層架構設計與萬億參數超大規模訓練策略,Intern-S1-Pro的科學能力進一步升級。

在國際數學奧林匹克IMO-Answer-Bench和國際物理奧林匹克IPhO2025兩大權威基準測試中,Intern-S1-Pro均展現出競賽級別的解題能力。

在AI4S關鍵垂類領域,Intern-S1-Pro成功構建了一個跨越化學、材料、生命、地球、物理五大核心學科的全譜系能力矩陣,涵蓋100多個專業子任務,不僅在Mol-Instruction、Biology-Instruction等單學科垂類評測中表現優異,更在SciReasoner等高難度的綜合學科評測基準中,取得了與閉源商業大模型及垂類SOTA模型相當,甚至更優的成績,穩居AI4S領域的第一梯隊

在基礎理解維度,Intern-S1-Pro基于高精度多模態感知能力,能夠精準解析復雜的分子結構圖及各類實驗圖表,深入到邏輯推理層面 ,Intern-S1-Pro能夠處理高階科學問答,如反應條件推斷、理化性質預測,精準捕捉數據背后的因果規律等。隨著理解與推理能力的持續增強,Intern-S1-Pro的能力邊界不斷向真實科研場景延伸,其應用范圍從微觀層面的化學逆合成、蛋白質序列生成,拓展至宏觀尺度的遙感圖像分析等復雜任務。通過XLRS-Bench等真實科研場景評測,模型展現出從“解題”邁向“解決問題”的科研生產力價值,為前沿科學探索提供了堅實支撐。

同時,借助通專融合技術路線,Intern-S1-Pro在通用能力與專業科學能力上實現協同進階:在圖文跨模態理解、科學圖表邏輯推理、多場景視覺感知,以及高質量自然語言生成和復雜指令精準遵循等核心維度,Intern-S1-Pro均穩居開源模型陣營第一梯隊,展現出扎實而全面的綜合實力。

通過通專融合的訓練策略,Intern-S1-Pro不僅補齊了傳統前沿模型在專業推理上的短板,還實現了多模態與文本通用能力的均衡發展,真正將通用能力與專業科學能力的協同演進落到實處,為科研場景下復雜問題的理解、推理與應用提供了可靠支撐。

在智能體能力方面,Intern-S1-Pro實現了從“靜態任務規劃”到“動態環境交互”的跨越式進階。在以動態環境與復雜交互為核心的Tau-2評測中達到了國際一流水平,為賦能復雜科學智能體打下了堅實基礎。

03.

筑牢“算力-算法”一體化基座

在規模、性能提升的同時,Intern-S1-Pro構建了原創的“算力-算法”一體化基座。模型從架構設計之初,便與昇騰計算生態確立聯合研發路線,實現了從最底層的算子、編譯優化到上層的訓練、推理框架的深度全棧適配。

研發團隊攻克了大規模訓練中精度對齊、超長序列強化學習穩定性、硬件性能極致釋放等一系列核心技術難題,基于XTuner V1訓練框架的精細優化與LMDeploy推理引擎的高效部署,結合先進的內存管理與并行策略,確保了萬億參數模型訓練的高效與穩定。通過創新的全異步強化學習框架等技術的應用,大幅提升了訓練效率,降低了研發成本與門檻,此外,Intern-S1-Pro還與沐曦聯合研發利用模型加速算子適配,為開放共享、面向未來的AGI4S基礎設施奠定了堅實基礎。

04.

高質量開源賦能創新生態

自2023年書生大模型首次發布以來,上海AI實驗室已逐步構建起豐富的書生大模型家族,包括科學多模態模型Intern-S1、大語言模型書生·浦語InternLM、多模態模型書生·萬象InternVL、強推理模型書生·思客InternThinker等。同時首創并開源了面向大模型研發與應用的全鏈路開源工具體系,覆蓋數據處理、預訓練、微調、部署、評測與應用等關鍵環節,包含訓練框架XTuner、部署推理框架LMDeploy、評測框架OpenCompass、高效文檔解析工具MinerU,以及思索式AI搜索應用MindSearch等在內的核心工具已全面開源,大部分也都同步發布在wisemodel開源社區,形成覆蓋數十萬開發者參與的活躍開源社區。

自發布以來,Intern-S1多次登頂HuggingFace全球多模態榜單,累計下載超41萬次,并獲得近200家科研機構和企業的合作申請。其卓越的跨模態科學理解能力不僅為科研提供了高效工具,也通過開源降低了全球科研團隊邁入AGI for Science的門檻。未來,在研究范式創新及模型能力提升的基礎上,上海AI實驗室將推進Intern-S1及其全鏈條工具體系持續開源,支持免費商用,同時提供線上開放服務,與全球合作伙伴共建更加開放、高效的科學AI生態。

案例展示:

----- END -----


wisemodel相關:

系列模型:


關于wisemodel更多


1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
老人離世房產未過戶,2026年法律新規:繼承權真的會作廢嗎?

老人離世房產未過戶,2026年法律新規:繼承權真的會作廢嗎?

復轉這些年
2026-03-22 17:48:38
沒底線!田曦薇抹胸造型直播被封禁,大露胸擠副乳惹全網爭議

沒底線!田曦薇抹胸造型直播被封禁,大露胸擠副乳惹全網爭議

橙星文娛
2026-03-30 12:20:45
男子賺夠錢后買房車瀟灑養老,僅6年突然破產:剛知老婆負債3千萬

男子賺夠錢后買房車瀟灑養老,僅6年突然破產:剛知老婆負債3千萬

嫹筆牂牂
2026-03-19 07:12:18
A股:今天中午傳來4個重要消息!A股或迎來更大級別大行情?

A股:今天中午傳來4個重要消息!A股或迎來更大級別大行情?

股市皆大事
2026-03-30 12:05:51
大摩:由中東戰爭引發的標普500指數回調已接近尾聲

大摩:由中東戰爭引發的標普500指數回調已接近尾聲

財聯社
2026-03-30 15:50:17
中南大學鄭傳均去世,死因是過度勞累,曾救落水女童被央視報道

中南大學鄭傳均去世,死因是過度勞累,曾救落水女童被央視報道

180視角
2026-03-30 10:13:48
一段夫妻離婚對話刷屏!丈夫坦誠變心、凈身出戶,妻子竟平靜應允

一段夫妻離婚對話刷屏!丈夫坦誠變心、凈身出戶,妻子竟平靜應允

火山詩話
2026-03-28 15:09:53
曼聯一億英鎊重磅引援取得進展,新任正式主帥人選已確定

曼聯一億英鎊重磅引援取得進展,新任正式主帥人選已確定

林子說事
2026-03-30 07:47:53
零跑D19豪華旗艦SUV上市定檔:4月16日見

零跑D19豪華旗艦SUV上市定檔:4月16日見

IT之家
2026-03-30 10:25:18
許世友被一掌撂翻在地?竟敗給18歲警衛員,事后連呼:我不是對手

許世友被一掌撂翻在地?竟敗給18歲警衛員,事后連呼:我不是對手

水木史記
2026-03-29 01:21:39
打!傾家蕩產也要打!以色列最新民調:75%民眾要求和伊死磕到底

打!傾家蕩產也要打!以色列最新民調:75%民眾要求和伊死磕到底

肖茲探秘說
2026-03-30 15:51:14
“被迫”上任,卡羅爾:我之前從未想過當主帥,我還是想踢球

“被迫”上任,卡羅爾:我之前從未想過當主帥,我還是想踢球

懂球帝
2026-03-30 10:33:05
江西女碩士失蹤,被發現時已在教授實驗室待6年,魔鬼真的存在

江西女碩士失蹤,被發現時已在教授實驗室待6年,魔鬼真的存在

燦爛夏天
2025-02-10 20:20:13
浙江一公路自行車賽發生大面積摔車事件,組委會醫療聯系人:擦傷撞傷人數確實多,但僅極個別送醫

浙江一公路自行車賽發生大面積摔車事件,組委會醫療聯系人:擦傷撞傷人數確實多,但僅極個別送醫

極目新聞
2026-03-30 17:14:00
寧德時代重返巔峰!2026一季度市占率破50%,比亞迪創五年新低?

寧德時代重返巔峰!2026一季度市占率破50%,比亞迪創五年新低?

新浪財經
2026-03-30 16:07:15
新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
美國科學家瘋了:打算用等離子體燒穿地球,他們究竟想干什么?

美國科學家瘋了:打算用等離子體燒穿地球,他們究竟想干什么?

觀察宇宙
2026-03-29 20:51:07
清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

磊子講史
2026-03-20 16:07:07
李榮浩怒斥單依純不到24小時,薛之謙罕見發聲,贏得全網好感

李榮浩怒斥單依純不到24小時,薛之謙罕見發聲,贏得全網好感

往史過眼云煙
2026-03-30 14:36:04
2026光纖光纜,新增訂單最多的10家公司(附名單)

2026光纖光纜,新增訂單最多的10家公司(附名單)

Thurman在昆明
2026-03-30 17:14:21
2026-03-30 18:31:00
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
466文章數 14關注度
往期回顧 全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

尹正發文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

頭條要聞

尹正發文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

教育
數碼
家居
旅游
軍事航空

教育要聞

五年級狀元題,求面積,會的不多

數碼要聞

雙塔合一,酷凜推出FROZN A620 SLK風冷散熱器

家居要聞

東方法式美學 現代簡約

旅游要聞

德州寶藏露營地!超市、外賣、公廁全配齊,周末就來這露營吧

軍事要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

無障礙瀏覽 進入關懷版