337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

通研院&北大:智能體如何提升社交能力?

0
分享至


導語

為什么許多社交智能體“寫得通順,卻一眼假”?問題往往不在語言能力,而在它們既不像某個穩定的個體,也未真正嵌入社會關系網絡。北京通用人工智能研究院聯合北京大學研究提出自演化社交智能體 EvoBot,通過生成器與檢測器的對抗博弈,讓模型在社會反饋中持續升級,逐步學會更真實的個性化表達與社會化互動。

關鍵詞:社交智能體、擬人化生成、個性化、社會化、對抗學習、自演化

孔繁奇、封雪丨作者


論文題目:Enhancing LLM-Based Social Bot via an Adversarial Learning Framework 論文鏈接:https://aclanthology.org/2025.emnlp-main.1185/ 發表時間:2025年11月4日 論文來源: EMNLP 2025

社交平臺上,一條“像人”的動態不只取決于語法和知識,更取決于兩個更隱蔽的因素:它是否貼合某個具體個體的穩定風格(個性化),以及它是否會被周圍社交鄰居持續塑造(社會化)。不少大模型“寫得對”,卻仍然“一眼假”,問題往往不在句子通不通順,而在它不像某個具體的人在某個具體的圈子里說話。

北京通用人工智能研究院聯合北京大學提出了自演化社交智能體 EvoBot,在“生成器-檢測器”的對抗博弈框架下,把擬人化生成變成一個能自動升級難度的訓練任務,使模型在社交網絡中持續迭代。相關成果已被自然語言處理頂會 EMNLP 2025 接收并作 Oral 展示。

問題:社交智能體為什么常常“一眼假”?

當前社交智能體的一個核心瓶頸是“既個性化又社會化”。個性化關乎個體差異,同樣是表達贊同,有人簡短直接,有人愛用反問,有人習慣加表情或話題標簽。社會化關乎鄰域影響,好友關系、社區氛圍與熱點事件會持續改變一個人的發言內容與立場走向。只學到“通用寫作能力”的大模型,往往會留下兩類穩定的可識別痕跡。其一是風格過于平均,不像某個穩定個體的長期表達分布;其二是生成內容缺少社會語境,看起來像“單機寫作”,而不是在關系網絡里互動。針對這兩個問題,本文提出了一個兩階段訓練框架優化模型,先讓模型更像某個具體的人,再讓模型在“社會反饋”的壓力下持續修正自己的表達策略。

方法:把擬人化訓練變成“矛與盾”的持續博弈

EvoBot的關鍵設計,是把“像人”變成一場持續升級的對抗??蚣芾?,生成器(EvoBot)負責模仿人類發布社交動態,檢測器(Detector)負責區分“真實人類內容”和“AI生成內容”。具體而言,EvoBot的學習分為兩個階段:

第一階段:監督微調(SFT),注入個體“人格”。在此階段,本文利用真實人類用戶數據對基礎大模型(Llama2-7B)進行監督微調。訓練任務是讓模型初步學習該社區的表達方式、語言習慣等。通過這一過程,EvoBot初步具備了模仿不同個體、生成個性化內容的能力,這構成了每個智能體的“初始人格”。

第二階段:對抗性學習,驅動動態“演化”。本文設計了一個由EvoBot(生成器)和基于關系圖卷積神經網絡(R-GCN)[2] 的Detector(檢測器)構成的對抗性學習閉環。與傳統方法不同,本文的生成器和檢測器是相互適應、協同演化的。在每一輪迭代中,EvoBot生成一批新的“擬人”內容,而檢測器的任務就是從這些內容和真實人類內容中,把AI的“仿冒品”揪出來。如果EvoBot生成的內容成功“騙過”了檢測器,就會被標記為“更優”樣本,指導模型朝這個方向優化;反之,則被標記為“較差”樣本,從而構造出偏好數據對,通過直接偏好優化(DPO)[3] 技術驅動EvoBot學習。最關鍵的是,檢測器自身也在不斷升級。每一輪博弈后,檢測器會將EvoBot的“更優”樣本集加入自己的錯題集進行再訓練,提升識別能力。這就為EvoBot創造了一個任務難度持續提升的學習環境,迫使其不斷學習和模仿更高級、更難以分辨的人類行為模式,最終形成一個能力持續增強的良性循環。


圖1: EvoBot框架概覽

實驗:個體層更像人,群體層更像社會

EvoBot不是在“干凈、單一”的文本集合里訓練,而是直接從真實社交網絡中抽取結構與語境。研究使用 TwiBot-22 數據集 [4],包含約100萬用戶、近1億條推文以及好友關系等圖結構信息。為了在可控成本下保留網絡結構差異,研究采用 Louvain 社區發現方法切分出12個高度連接且具有代表性的社區,這些社區在拓撲形態(星形、網狀等)、語言(英語、阿拉伯語、日語、土耳其語等)與話題上都呈現明顯差異。這種異質性為本文訓練和評估EvoBot在復雜、多元環境下的適應性和類人程度供了堅實的基礎。


圖2: 12個社區中用戶連接關系的可視化


表1: 社區數據統計,包括用戶與機器人的數量、邊的數量、推文數量和代表語言

具體地,本文在這12個社區上,從個性化和社會化兩個角度系統地評估了EvoBot。

個性化評估

首先,本文分析了EvoBot與檢測器在4輪對抗訓練中的“共同成長”過程。結果清晰地展示了兩者間的協同進化。隨著迭代的進行,EvoBot規避檢測的能力越來越強,意味著它生成的內容越來越類人(如圖3中各行所示)。與此同時,檢測器的識別性能也在不斷提升(如圖3中各列所示)。


圖3:Detector分類性能。左:F1-score;右:Accuracy。行表示檢測器的版本;列表示EvoBot的版本。色塊上數值越大表示EvoBot被識別出來的概率越高。

本文對比了最終版的EvoBot與六種基線模型(包括原始Bot、傳統GAN、Llama2-7b、GPT-4o-mini,以及兩個消融版本)。在兩種不同架構(RGCN和GAT)的檢測器下,EvoBot均取得了最低的被識別率,展示了其最強的擬人化生成能力。消融實驗也證明,監督微調(SFT)和對抗學習(ADV)兩個階段對于最終的優異性能缺一不可。同時,進一步分析表明EvoBot在生成內容多樣性和表達風格上都達到了很高的類人水平,這說明EvoBot不僅能生成類人的社交文字而且對人類社交方式有更深層次的理解。


表2: RGCN和GAT檢測器下不同生成器的Accuracy和F1-Score。數值越小,說明生成器逃避檢測的能力越強。

社會化評估1:群體觀點模擬

實驗將EvoBot置于多智能體模擬環境中,復現了真實世界中關于“COVID-19”和“俄烏沖突”兩大事件的觀點演變過程。實驗結果表明,相比于傳統的基于規則的智能體模型(如BC和Lorenz模型)以及其他LLM基線,無論是在群體平均觀點還是觀點多樣性上,EvoBot都最接近真實數據,成功捕捉到了現實群體中復雜動態的觀點變化。這些對比指標均是在事件發生的一段時間內的統計結果,充分證明了EvoBot的優勢在于精準捕捉了觀點的動態演變過程,而不僅是擬合某個靜態的結果。


表3: 群體觀點的模擬結果

社會化評估2:信息傳播模擬

本文還模擬了關于“超級碗賽事”這一熱點新聞在社交網絡中的傳播過程。結果顯示,相比于基線模型,EvoBot驅動的信息傳播曲線更貼近真實世界的傳播模式,即“初期快速爆發,隨后逐漸放緩”的典型規律。這些群體層面的涌現現象,強有力地證明了EvoBot框架在模擬復雜社會動態方面的有效性和先進性。


圖4: 隨著時間的推移,討論洛杉磯公羊隊超級碗奪冠的累積用戶數量變化曲線

總結展望:為什么“自演化”很重要?

在“生成器-檢測器”的對抗學習框架下,基于大模型的社交智能體EvoBot持續提升能力,在個性化內容生成和宏觀社會現象模擬方面均表現出色,驗證了該框架的有效性。

EvoBot所展示的這種自動化的、無需持續外部干預的“自演化”學習框架,為各行業構建更智能、更具適應性的AI智能體提供了一種新的思路和啟發。這種通過對抗博弈創造動態學習環境、驅動智能體持續迭代的方法,為解決“如何讓智能體在部署后仍能自主學習和進化”這一核心難題提供了寶貴的探索,對未來開發更穩健、更自主的人工智能系統具有一定的借鑒意義。

參考文獻

[1] Kong, F., Zhang, X., Chen, X., Yang, Y., Zhu, S. C., & Feng, X. (2025, November). Enhancing llm-based social bot via an adversarial learning framework. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (pp. 23246-23271).

[2] Schlichtkrull, Michael, et al. "Modeling relational data with graph convolutional networks." European semantic web conference. Cham: Springer International Publishing, 2018.

[3] Rafailov, Rafael, et al. "Direct preference optimization: Your language model is secretly a reward model." Advances in neural information processing systems 36 (2023): 53728-53741. Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

[4] Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

群體智能讀書會

如果你對這些反直覺但極有用的現象感興趣——從蟻群搭橋、魚群同步、到無人機集群表演、集群機器人協作、群智優化與多智能體系統、網絡輿論建模研究等——歡迎加入「群體智能」讀書會:我們用動物—人類—機器三條線,希望把群體智能的涌現這件事講清楚、講透徹;用物理學、數理邏輯、多主體建模、計算傳播等多學科視角,去追問同一個核心:集群何以比個體更聰明?群體智能又在何時涌現?

集智俱樂部聯合北京師范大學系統科學學院韓戰鋼教授、暨南大學計算傳播研究中心趙甜芳副教授、新疆大學物理科學與技術學院玉素甫·艾比布拉副教授等來自11所高校的學者,共同發起本次,嘗試用一條普適的線索,把自然界的鳥群蟻群、人類社會的集群行為、以及人工智能時代的多智能體與群智優化,放在同一張地圖上重新理解。讀書會自2026年1月17日開始,安排在每周六下午 14:00–16:00,歡迎所有對群體智能如何涌現、如何被理解、以及如何被設計,感興趣的朋友一起加入:帶著問題來,帶著更有趣的問題去。



詳情請見:

1.

2.

3.

4.

5.

6.

7.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗同意再放行20艘巴基斯坦籍船只通過霍爾木茲海峽,今后每天將有兩艘船通過該海峽

伊朗同意再放行20艘巴基斯坦籍船只通過霍爾木茲海峽,今后每天將有兩艘船通過該海峽

揚子晚報
2026-03-29 07:17:05
虛構:四大靈性動物不能吃,食之折壽,害之受報!別小看其中因果

虛構:四大靈性動物不能吃,食之折壽,害之受報!別小看其中因果

屏兒愛讀書
2025-03-06 14:40:35
后續!男子吃飯拒付款,對著警察狂懟“我愿意給才給”,已被拘留

后續!男子吃飯拒付款,對著警察狂懟“我愿意給才給”,已被拘留

科普100克克
2026-03-29 17:34:00
一枚“火烈鳥”導彈引爆俄3萬噸產能的炸藥廠

一枚“火烈鳥”導彈引爆俄3萬噸產能的炸藥廠

桂系007
2026-03-28 23:48:41
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
做教培的閨蜜:張雪峰身價8億,為啥還吃外賣?她的回答讓我沉默

做教培的閨蜜:張雪峰身價8億,為啥還吃外賣?她的回答讓我沉默

藍色海邊
2026-03-27 18:08:02
伊朗女孩這場模仿秀,比任何抗議都狠

伊朗女孩這場模仿秀,比任何抗議都狠

老馬拉車莫少裝
2026-03-27 22:59:05
0-4慘??!韓國球迷哀嘆:我們已不配跟日本比 只能找中國隊尋安慰

0-4慘?。№n國球迷哀嘆:我們已不配跟日本比 只能找中國隊尋安慰

風過鄉
2026-03-29 07:56:36
第84波猛攻!伊朗向華求援,中方斬釘截鐵給美指路

第84波猛攻!伊朗向華求援,中方斬釘截鐵給美指路

硯底沉香LIU
2026-03-29 14:54:03
李昌鈺去世僅24小時,惡心的事情發生,私生活被扒,翁帆也被牽連

李昌鈺去世僅24小時,惡心的事情發生,私生活被扒,翁帆也被牽連

林輕吟
2026-03-28 19:23:49
一場127-95讓雷霆無奈!馬刺創歷史第1神跡,亞歷山大的MVP不保了

一場127-95讓雷霆無奈!馬刺創歷史第1神跡,亞歷山大的MVP不保了

八斗小先生
2026-03-29 13:50:03
愧對600萬!全場2分+正負值最低,4失誤比得分多,新老東家都噴

愧對600萬!全場2分+正負值最低,4失誤比得分多,新老東家都噴

籃球看比賽
2026-03-29 11:35:11
穆帥再拒豪門高薪,為何只愿等本菲卡回頭?

穆帥再拒豪門高薪,為何只愿等本菲卡回頭?

行舟問茶
2026-03-29 18:55:54
女人敢開口向你要“這樣東西”,就是“生理性喜歡”了,騙不了人

女人敢開口向你要“這樣東西”,就是“生理性喜歡”了,騙不了人

i書與房
2026-02-07 15:36:43
誰是下一個?紋身師曬顧客感染者咬痕紋身引熱議

誰是下一個?紋身師曬顧客感染者咬痕紋身引熱議

游民星空
2026-03-29 10:06:07
再見,曼聯!曝“大核”決定離開紅魔!欽點2億新援“空降”加盟

再見,曼聯!曝“大核”決定離開紅魔!欽點2億新援“空降”加盟

頭狼追球
2026-03-29 10:15:30
去了一趟伊朗才發現:原來在伊朗人眼里,中國人是這樣的

去了一趟伊朗才發現:原來在伊朗人眼里,中國人是這樣的

千秋文化
2026-03-24 21:40:40
70艘貨船被扣,美方指責中國公報私仇,中方只用一句話,反將一軍

70艘貨船被扣,美方指責中國公報私仇,中方只用一句話,反將一軍

夢史
2026-03-29 00:09:01
比亞迪終于豪華起來!全新騰勢D9來了,這才叫頂級顏值!

比亞迪終于豪華起來!全新騰勢D9來了,這才叫頂級顏值!

米粒說車唯一呀
2026-03-29 15:37:15
訂單已排到2030年!震驚歐美國家,中國趁此機會突圍上位

訂單已排到2030年!震驚歐美國家,中國趁此機會突圍上位

春風笑語
2026-03-28 08:28:33
2026-03-30 05:40:49
集智俱樂部 incentive-icons
集智俱樂部
科普人工智能相關知識技能
5731文章數 4665關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創始人均離職

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

體育要聞

絕殺衛冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

汪峰定律再現!李榮浩喊話單依純侵權

財經要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態度原創

親子
房產
藝術
旅游
軍事航空

親子要聞

罕見五胞胎全保住,20多名醫護深夜齊上陣

房產要聞

首日430組來訪,單日120組認籌!??谑讉€真四代,徹底爆了!

藝術要聞

600 年前的「產亡孤魂」,藏著中國女性最痛的記憶

旅游要聞

2026上海旅游產業博覽會開幕,一城三館聯動書寫文商旅體展消費新篇章

軍事要聞

美兩棲攻擊艦載3500名增援到達

無障礙瀏覽 進入關懷版