337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

模型編輯新范式,HSE實現大規模“安全洗腦”且能力反升

0
分享至


始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。wisemodel推出邀請注冊獎勵活動,最高可得算力券+token包380元獎勵,歡迎參與和支持!

你是否想過,我們是如何“修正”大模型(LLM)的記憶的?這個過程叫做“模型編輯”(Model Editing)。它就像是給大模型“打補丁”或“更新記憶” ,比如告訴它一個新事實,或者糾正一個它的“幻覺”。

但一個核心問題是:你今天剛教會它“拜登是第46任總統”,明天它可能就忘了“特朗普是第45任”;你剛給它更新了最新的醫療知識,它在回答通用問題時就開始“胡言亂語”。對大模型進行持續的知識更新,是否必然導致“災難性遺忘”(catastrophic forgetting)?是不是模型一編輯,就必然“性能崩潰”(model collapse)?

來自國防科技大學 PDL的研究團隊,在發表于NeurIPS 2025 的最新論文中,從生物大腦中汲取靈感,給出了一個顛覆性的答案:給大模型裝上“海馬體”!

研究團隊受人腦海馬體處理記憶的“三突觸回路”啟發,提出了一種全新的類海馬體序列編輯(HSE)框架。該框架通過三大核心機制,徹底改變了模型編輯的“游戲規則”。當其他模型在連續編輯數百次后性能就“雪崩”至零時,HSE在連續編輯1000次后,通用能力不僅毫發無損,甚至還超越了原始模型!已上線始智AI-wisemodel開源社區,歡迎體驗。


代碼地址

https://wisemodel.cn/codes/SquareGroupsky/Hippocampal-like-Sequential-Editing

01.

揭秘HSE的“海馬體”三部曲

為什么大模型會遺忘?因為它們缺乏人腦的精妙機制。HSE框架則模擬了海馬體的三大法寶:

1.機制一:主動遺忘(Active Forgetting)

靈感來源:人腦會通過長時程抑制(LTD)機制主動忘記過時或沖突的信息。

HSE做法:引入“機器遺忘”(Machine Unlearning)策略。在學習新知識過程中,“主動忘記”那些即將過時的舊知識,為新記憶騰出“神經空間”,從根源上解決新舊沖突。


2.機制二:領域分離(Knowledge Separation)

靈感來源:海馬體的齒狀回(DG)具有“模式分離”(Pattern Separation)功能,能將相似的輸入信息映射到完全不同的神經元上,互不干擾。

HSE做法:使用“Fisher Information Matrix” (FIM)來指導參數更新。FIM能識別出對不同知識領域最重要的參數,在編輯時“精準控制”更新幅度,確保編輯“醫療知識”時,不會干擾到“藝術知識”,防止跨域干擾。


3.機制三:參數回放(Parameter Replay)

靈感來源:人腦在休息時,海馬體會“回放”(Replay)白天的經歷(SWRs),將短期記憶固化為長期記憶。

HSE做法:設計了一種高效的“參數回放”機制。它以一種輕量化的參數形式,不斷“鞏固”所有編輯過的歷史知識,最終推導出嚴謹的閉式解(closed-form solution),在數學上保證了長期記憶的穩定。


02.

為什么HSE在數學上更優?

這篇成果的亮點絕不僅在于“仿生”,更在于其堅實的理論貢獻:

1.更緊的泛化界(Tighter Generalization Bound):

研究者從數學上證明,其“主動遺忘”模塊(MAF Loss)相比傳統的交叉熵損失(CE Loss),能帶來更緊的泛化誤差上界(Corollary 1) 。


2.可證明的收斂性(Provable Convergence):

研究者證明了其“參數回放”模塊(LEM)的更新范數(Frobenius norm)是收斂的


3.AlphaEdit只是一個特例:

AlphaEdit 是模型編輯領域一個強力的基線。但HSE從理論上指出,AlphaEdit的知識正交化方法,在數學上只是HSE所提出的參數回放公式的一個特例。實驗也表明,HSE的效果顯著優于AlphaEdit 。


4.F-Norm洞察:

模型的抗編輯性論文還揭示了一個關鍵洞察:原始模型的F-NormFrobenius Norm)越大,模型越抗編輯。Llama3和Mistral的F-Norm遠小于GPT-J ,這導致它們對編輯更敏感,也更容易“崩潰” 。而HSE的LEM模塊,正是通過約束F-Norm的增長,才成功駕馭了這些敏感模型 。


03.

不僅沒遺忘,通用能力還變強了?

堅實的理論帶來了驚人的實驗效果。研究團隊在Llama3等多個主流模型上,進行了多達1000次的序列編輯實驗 。驚人現象出現了:

1.終結模型崩潰

在評估通用能力的GLUE基準測試上,現有的方法(如MEND、MEMIT、PRUNE)在經歷幾百次編輯后,性能無一例外地急劇下降至接近零,模型徹底“崩潰” 。


HSE框架,在經歷了1000次編輯后,性能曲線幾乎紋絲不動,甚至在使用ZsRE數據集編輯后,平均性能還提升了1.67%這意味著HSE不僅修復了知識,還順便提升了模型的通用理解能力。

2.編輯性能遙遙領先

在CounterFact和ZsRE兩個標準的模型編輯基準上,HSE的編輯效果也全面占優。與最佳基線相比,HSE泛化性上平均提升20.6%特異性上提升21.9%


3.解決真實世界難題

研究者還在三大實際應用中驗證了HSE的威力:

緩解幻覺:在HalluEdit數據集上,HSE在9個不同領域均能有效緩解模型幻覺。


醫療知識注入:成功為專業醫療大模型注入新大的醫療知識,且不破壞原有專業性。


減少社會偏見:在SafeEdit數據集上,HSE能有效“遺忘”有害和歧視性內容,顯著提升模型安全性 。


這項研究不再滿足于模型編輯的“小修小補”,而是從生物機制出發,首次提出了一套完整的、受海馬體啟發的序列編輯框架HSE 。

通過主動遺忘領域分離參數回放三大機制HSE在理論上被證明具有更緊的泛化界和更穩定的收斂性,在實踐中則首次實現在大規模序列編輯后,通用能力不降反升的驚人效果。這為大模型實現“終身學習”和“持續進化”提供了一條極具潛力的技術路徑。

----- END -----


wisemodel相關:

系列模型:

關于wisemodel更多

1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
徐杰喊話全隊!杜鋒聽勸扶正3人,廣東傳4利好,下場有望復仇江蘇

徐杰喊話全隊!杜鋒聽勸扶正3人,廣東傳4利好,下場有望復仇江蘇

后仰大風車
2026-03-30 07:10:14
日本最先研究出了氫能電池,于是日本申請了上千個專利,獨家生產

日本最先研究出了氫能電池,于是日本申請了上千個專利,獨家生產

南權先生
2026-02-24 15:52:07
美國也沒想到,轉為中國籍僅6年,谷愛凌竟已成美國頭號勁敵

美國也沒想到,轉為中國籍僅6年,谷愛凌竟已成美國頭號勁敵

削桐作琴
2026-02-25 18:15:14
特朗普宣布訪華新日期,不到48小時,中方不留情面,連續反制

特朗普宣布訪華新日期,不到48小時,中方不留情面,連續反制

知鑒明史
2026-03-29 13:23:26
2007年,孔令儀在上海宋慶齡陵園掃墓時的留影,第二年她就去世了

2007年,孔令儀在上海宋慶齡陵園掃墓時的留影,第二年她就去世了

芳芳歷史燴
2026-03-30 12:05:05
他在華野無歸屬感?曾與李先念有芥蒂,想當軍事主官一直當參謀長

他在華野無歸屬感?曾與李先念有芥蒂,想當軍事主官一直當參謀長

小莜讀史
2026-03-30 09:44:49
中國摩托的越南復仇:從“工業垃圾”到“平替神車”

中國摩托的越南復仇:從“工業垃圾”到“平替神車”

沙雕小琳琳
2026-03-28 10:15:55
張雪峰生前談父親淚流滿面!父子倆的命運都很悲情

張雪峰生前談父親淚流滿面!父子倆的命運都很悲情

細品名人
2026-03-29 07:53:24
四川省委金融工委專職副書記王巖辭擬任正廳級領導職務

四川省委金融工委專職副書記王巖辭擬任正廳級領導職務

汲古知新
2026-03-30 14:22:31
塔圖姆砍復出首個30+ 綠軍連續第12年闖進季后賽

塔圖姆砍復出首個30+ 綠軍連續第12年闖進季后賽

體壇周報
2026-03-30 18:50:22
1955年大授銜,賀老總對羅帥說:這個副軍長情況特殊,請授中將

1955年大授銜,賀老總對羅帥說:這個副軍長情況特殊,請授中將

棠棣分享
2026-03-30 17:24:39
福建省委決定,陳長榮履新

福建省委決定,陳長榮履新

人民資訊
2026-03-30 17:25:08
跟低學歷妹子談戀愛是啥體驗?網友:低社會化人群被女版黃毛拿下

跟低學歷妹子談戀愛是啥體驗?網友:低社會化人群被女版黃毛拿下

帶你感受人間冷暖
2026-03-28 16:48:21
一艘俄羅斯油輪獲美方“放行”駛向古巴 特朗普:伊朗已允許20艘油輪通過霍爾木茲海峽

一艘俄羅斯油輪獲美方“放行”駛向古巴 特朗普:伊朗已允許20艘油輪通過霍爾木茲海峽

每日經濟新聞
2026-03-30 13:17:45
4月1日起嚴查風暴啟動:終身追責動真格,這些紅線千萬別碰

4月1日起嚴查風暴啟動:終身追責動真格,這些紅線千萬別碰

三農老歷
2026-03-30 11:52:15
難怪特朗普不想打了,五角大樓公開真實傷亡,美軍終付血的代價?

難怪特朗普不想打了,五角大樓公開真實傷亡,美軍終付血的代價?

探源歷史
2026-03-29 16:59:24
丁彥雨航:想融入NBA一定得會英語;NBA球員太卷了真的比不了

丁彥雨航:想融入NBA一定得會英語;NBA球員太卷了真的比不了

懂球帝
2026-03-30 10:11:07
“下周將被部署的美國士兵在脫衣舞俱樂部揮霍,很年輕,像胎兒一樣”

“下周將被部署的美國士兵在脫衣舞俱樂部揮霍,很年輕,像胎兒一樣”

觀察者網
2026-03-30 13:21:06
國足戰喀麥隆或變陣3中衛!訓練曝光防線首發:朱辰杰+4位U23紅星

國足戰喀麥隆或變陣3中衛!訓練曝光防線首發:朱辰杰+4位U23紅星

我愛英超
2026-03-30 10:26:14
復婚二胎傳聞落定七月,趙麗穎近況曝光讓人揪心

復婚二胎傳聞落定七月,趙麗穎近況曝光讓人揪心

阿廢冷眼觀察所
2026-03-29 18:46:36
2026-03-30 19:52:49
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
466文章數 14關注度
往期回顧 全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

河南女子舉報母親去世后被結婚 官方通報

頭條要聞

河南女子舉報母親去世后被結婚 官方通報

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

藝術
教育
游戲
公開課
軍事航空

藝術要聞

600 年前的「產亡孤魂」,藏著中國女性最痛的記憶

教育要聞

“給你女兒買件好內衣吧!”中學女孩鍛煉視頻,網友都看不下去了

生化9格蕾絲3D區神圖!馬甲線南半球 里昂成無能丈夫

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

無障礙瀏覽 進入關懷版