337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

文生圖進入Agent時代:港中文聯合伯克利開源Gen-Searcher

0
分享至



過去兩年,圖像生成模型在質感和審美上一路狂飆,但大多仍是 “直接出圖” 的范式。

一旦 prompt 涉及真實世界知識、最新信息、冷門事實,或者需要跨多個來源核對細節,傳統文生圖模型就很容易翻車。

因為生成模型缺乏面向真實世界的 Agent 能力,仍然依賴固化的參數知識,缺少主動搜索、驗證和整合外部信息的能力。

最近,來自香港中文大學 MMLab、UC Berkeley 和 UCLA 的研究團隊提出了 Gen-Searcher,首次嘗試為圖像生成任務訓練一個 “深度搜索” 智能體。它讓圖像生成模型能夠像 Agent 一樣進行搜索、推理、找圖和瀏覽網頁,從而輸出真正可靠的生成結果。所有數據,模型,和代碼,均已開源。



  • 論文標題:Gen-Searcher: Reinforcing Agentic Search for Image Generation
  • 論文地址:https://arxiv.org/pdf/2603.28767
  • 項目主頁:https://gen-searcher.vercel.app/

現實需求:從 “直接生成” 到 Agentic 生成

現實世界中的圖像生成任務,往往不只是 “按 prompt 作畫”。很多場景會涉及真實世界知識、最新信息、冷門事實,甚至需要跨多個來源核對細節。模型不僅要會生成,還要先判斷哪些信息需要確認、哪些視覺細節需要參考、哪些內容必須依賴外部知識支撐。

在這種背景下,傳統文生圖模型有兩個核心問題:一是主要依賴預訓練學到的參數知識,缺乏主動搜索、驗證和整合外部信息的能力;二是整體流程仍是 “輸入 prompt,直接出圖”,缺少像 Agent 那樣先搜索、推理、整理證據的過程,因此在真實場景里很容易 “畫得像,卻畫不對”

為了解決這個問題,研究團隊提出了 Gen-Searcher,希望把文生圖從 “直接生成” 推進到 Agentic 生成

數據構建與 KnowGen 基準

為了訓練這種能力,作者先構造了一批真實世界需要搜索才能完成的生成數據,覆蓋名人、動漫、物理、化學、藝術、建筑、新聞等約 20 個類別。



隨后,作者讓強模型配合搜索工具生成多輪軌跡,收集文本知識和視覺證據,再用 Nano Banana Pro 合成目標圖像,得到約 30k 條原始樣本。經過 Seed1.8 篩選后,最終保留約 17k 條高質量數據,并整理成 Gen-Searcher-SFT-10k 和 Gen-Searcher-RL-6k。



在此基礎上,作者還提出了新的 benchmark —— KnowGen。它包含 630 條人工驗證樣本,用于圖像生成 Agent 評測。

模型訓練

Gen-Searcher 的核心,是把生成前的信息獲取過程做成一個可訓練的 Agent。模型不再拿到 prompt 就直接生成,而是先在多輪交互中決定何時搜索、搜什么、是否瀏覽網頁、是否補充視覺參考,最后輸出準確的 prompt 和參考圖。

它配備了三類工具:文本搜索、圖像搜索和網頁瀏覽。訓練上則分兩階段進行:先通過 SFT 訓練學會工具使用,再通過 agentic RL 優化搜索策略和長程決策。

論文還提出了雙獎勵反饋。因為只看最終圖像效果并不穩定,作者額外加入了一個文本獎勵,用來評估輸出的 prompt 是否已經包含足夠、正確、與生成相關的信息,再與圖像獎勵結合起來共同訓練。這樣,模型不僅要 “畫得好”,也要 “搜得對”



實驗結果

在 KnowGen 上,原始 Qwen-Image 的 K-Score 為 14.98,接入 Gen-Searcher-8B 后提升到 31.52,提高 16.54 分。而且這種能力還能遷移到其他圖像生成器上:Seedream 4.5 從 31.01 提升到 47.29,Nano Banana Pro 也從 50.38 提升到 53.30。



在 WISE 測試基準上,模型同樣帶來了巨大的提升。



可視化分析表明,Gen-Searcher 能夠真正提高模型生圖的準確性和質量。



Gen-Searcher 的推出,不僅展示了 Agentic 生成在知識密集型圖像生成任務上的潛力,也為構建真正能夠連接搜索、推理與生成的一體化系統提供了清晰路徑。

它不僅能 “畫”,還能 “查”;不僅能完成傳統的文本到圖像生成,更能在生成之前主動搜索信息、核對事實、整合證據,展現出面向真實世界復雜任務的生成能力。

在大模型不斷走向多模態、強推理與 Agent 化的趨勢下,Gen-Searcher 的工作或許只是一個起點,但它所驗證的方向,正在成為生成系統邁向 Agentic 時代的重要一步。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“兩岸統一”突破點不在馬英九,也不在國民黨,可能在這個人身上

“兩岸統一”突破點不在馬英九,也不在國民黨,可能在這個人身上

今夜繁星墜落
2026-03-05 06:56:40
爭端升級,鄭麗文剛在南京吃晚宴,就遭綠營攻擊,蘇起判斷沒有錯

爭端升級,鄭麗文剛在南京吃晚宴,就遭綠營攻擊,蘇起判斷沒有錯

娛樂小可愛蛙
2026-04-09 15:56:21
壽命與大便次數有關!研究發現:每天排便在這個次數,身體更健康

壽命與大便次數有關!研究發現:每天排便在這個次數,身體更健康

39健康網
2026-03-28 20:20:38
趁你病要你命!鄭智遭1-5暴擊主場搶分 李金羽上門補刀劍指三連勝

趁你病要你命!鄭智遭1-5暴擊主場搶分 李金羽上門補刀劍指三連勝

刀鋒體育
2026-04-09 09:32:17
凱美瑞換個車漆貴2萬,豐田把用戶當調色盤

凱美瑞換個車漆貴2萬,豐田把用戶當調色盤

碼上閑敘
2026-04-09 16:46:42
浙大名嘴揭開殘酷真相:當年恒大倒臺,壓根不是因為2萬億負債!

浙大名嘴揭開殘酷真相:當年恒大倒臺,壓根不是因為2萬億負債!

阿器談史
2026-04-02 13:31:44
72歲大爺斑塊消失,他把血管變干凈的三個方法,連醫生也贊嘆

72歲大爺斑塊消失,他把血管變干凈的三個方法,連醫生也贊嘆

荊醫生科普
2026-03-03 16:40:19
又打起來了,以軍機被擊落,美國或已出兵伊朗?白宮下令“撤僑”

又打起來了,以軍機被擊落,美國或已出兵伊朗?白宮下令“撤僑”

Ck的蜜糖
2026-04-09 16:13:54
為什么飛機提前40分鐘停止值機了?網友:那40分鐘就不是留給你的

為什么飛機提前40分鐘停止值機了?網友:那40分鐘就不是留給你的

夜深愛雜談
2026-03-18 19:53:27
零緩沖!全國一刀切!6月1日起,車主自己去車管所“橫著走”!

零緩沖!全國一刀切!6月1日起,車主自己去車管所“橫著走”!

混沌錄
2026-04-07 22:00:19
為什么沒人聯合打以色列,答案很簡單:不是沒人想打,是沒人敢打

為什么沒人聯合打以色列,答案很簡單:不是沒人想打,是沒人敢打

墨印齋
2026-04-07 13:47:02
波羅的海三國:用九十多年證明的兩條路

波羅的海三國:用九十多年證明的兩條路

民間鐵血柔情
2026-03-24 22:50:56
遲重瑞與陳麗華結婚付出了3大犧牲!他的姐姐和弟弟人生現狀如何

遲重瑞與陳麗華結婚付出了3大犧牲!他的姐姐和弟弟人生現狀如何

胡一舸南游y
2026-04-09 14:16:56
曼城的痛:阿爾瓦雷斯飆無敵任意球世界波,轟開巴薩大門,太絲滑了

曼城的痛:阿爾瓦雷斯飆無敵任意球世界波,轟開巴薩大門,太絲滑了

側身凌空斬
2026-04-09 04:14:41
反轉!陳光標改口,1000萬捐款用途改變可用于醫院房租與患兒救治

反轉!陳光標改口,1000萬捐款用途改變可用于醫院房租與患兒救治

放開他讓wo來
2026-04-09 14:31:02
錯失最年輕147!中國斯諾克新星險創紀錄,3分37秒轟單桿112分

錯失最年輕147!中國斯諾克新星險創紀錄,3分37秒轟單桿112分

全景體育V
2026-04-09 07:56:24
004航母核動力謎底揭曉:放棄最新反應堆選擇特定動力系統

004航母核動力謎底揭曉:放棄最新反應堆選擇特定動力系統

小柨拍客在北漂
2026-04-09 14:57:14
官方出手了!282人微信群罵全紅禪三年,群成員被扒,身份不簡單

官方出手了!282人微信群罵全紅禪三年,群成員被扒,身份不簡單

離離言幾許
2026-04-09 12:20:45
拉黑蔡徐坤數月,金子涵曝王思聰秦嵐,疑遭操控搞“人體實驗”

拉黑蔡徐坤數月,金子涵曝王思聰秦嵐,疑遭操控搞“人體實驗”

仙味少女心
2026-04-09 16:01:06
殲10CE打出原形!阿聯酋拒當冤大頭,叫停57億,中國軍工迎來狂歡

殲10CE打出原形!阿聯酋拒當冤大頭,叫停57億,中國軍工迎來狂歡

安珈使者啊
2026-04-09 09:46:45
2026-04-09 17:19:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12719文章數 142621關注度
往期回顧 全部

科技要聞

Meta凌晨首發閉源大模型 扎克伯格又行了?

頭條要聞

湖北文旅歌曲創作項目中標價2年暴漲159.2萬 紀檢發聲

頭條要聞

湖北文旅歌曲創作項目中標價2年暴漲159.2萬 紀檢發聲

體育要聞

8萬人面前心臟驟停 現在他還站在球場上

娛樂要聞

金莎官宣結婚 與老公孫丞瀟相差18歲

財經要聞

談判基礎已被破壞!霍爾木茲海峽關閉

汽車要聞

文飛的回歸 給神行者帶來什么?

態度原創

家居
健康
教育
時尚
親子

家居要聞

清新自然 復古風尚

干細胞抗衰4大誤區,90%的人都中招

教育要聞

省政府發文:高校需引進足球教練員

ED網紅病,正在掏空年輕女性

親子要聞

“喪偶式育兒”缺位的不只是父親,媽媽也難辭其咎

無障礙瀏覽 進入關懷版