337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

這個AI能自己造AI,十幾分鐘寫完代碼,一天交付可用模型

0
分享至

近日,在 OpenAI 發布的機器學習工程師基準測試(MLE-bench)中,一個名為 AIBuildAI 的智能體系統以 63.11% 的整體得分穩居第一。

AIBuildAI 是一個可以自動構建 AI 模型的 AI 智能體。這意味著,你只需給它一個自然語言任務描述和數據文件夾,它就能在一天內獨立完成模型設計、代碼生成、模型訓練、超參數調優、性能評估,并持續迭代改進模型性能。


(來源:受訪者提供)

這個“AI 工程師”背后的主要負責人,正是加州大學圣地亞哥分校(UCSD)電氣與計算機工程系副教授謝澎濤(Pengtao Xie)。他擁有卡內基梅隆大學機器學習系博士背景,研究方向聚焦人類學習技能啟發的機器學習,并將其應用于大語言模型、基礎模型以及生物醫學領域。

據謝澎濤介紹,AIBuildAI 的誕生,最初是為了解決實驗室內部一個非常現實的困境。

“我們團隊有兩類學生。一類是生物醫學背景的,他們希望用 AI 預測 RNA 功能、蛋白質結構等具體問題,但缺乏建模和編程能力;另一類是 AI 方法背景的,雖然能自己寫代碼,卻要花好幾天甚至幾周反復實驗。”謝澎濤告訴 DeepTech。

“如果有一個智能體,能讓用戶只用自然語言描述任務,后續所有步驟——模型架構設計、代碼編寫、訓練、超參數調優、性能評估、甚至自我復盤改進——全部自動完成,那對兩類學生都是巨大解放。”他補充道。

于是,AIBuildAI 項目正式啟動。“智能體本身大約做了半年,但底層的推理、合成數據等技術我們已經積累了好幾年。”謝澎濤透露,團隊對于這款智能體的定位也十分明確:基于成熟 AI 模塊組合設計模型,解決落地性強的常規任務。

據悉,AIBuildAI 是一套模塊化、可閉環運行的 AI 智能體系統,整體分為三層,各司其職又深度聯動,實現從任務理解到模型交付的全流程無人干預。

頂層是任務理解與決策層。當用戶輸入“預測 RNA 功能”或“蛋白質酶分類”等自然語言指令時,這一層負責解析意圖、判斷任務類型并拆解執行步驟。它是整個系統的“指揮中心”,決定了建模的方向和邏輯。

在這一核心中樞的選擇上,團隊選用了 Claude-Opus-4.6 大模型。“我們測試對比了多個模型,雖然 GPT-5 在某些設計思路上表現出色,但在智能體最關鍵的環節——‘寫代碼’上,Claude 的穩定性、長流程邏輯理解和結構化指令執行力是最適配建模場景的。”

中層是推理與代碼生成層,也是 AIBuildAI 的技術核心,搭載團隊自研的 Dream PRM(過程獎勵模型)、Dream ORM(結果獎勵模型)推理模塊,負責模型設計、代碼編寫、迭代復盤。PRM 負責步驟級精準推理,ORM 負責結果校驗與優化建議,雙重保障每一步執行不出錯,避免“一步錯、全流程崩”的問題,也是實現自動復盤改進的關鍵。

底層是執行與訓練層,其承接中層生成的代碼和方案,自動完成數據加載、模型訓練、超參數調優、性能評估、結果輸出,同時管控硬件資源和算力消耗。這一層把上層的“設計思路”轉化為可運行、可部署的實際模型。


(來源:受訪者提供)

為了驗證 AIBuildAI 的能力,團隊在 MLE-bench 的 75 個任務(涵蓋醫療、物理、生物等多個學科)中進行了測試。MLE-Bench 是 OpenAI 推出的全球頂尖的全自動機器學習測評平臺,專門考核 AI 智能體 “獨立構建有效 AI 模型” 的能力,測評覆蓋簡單(Low)、中等(Medium)、高難度(High) 三類真實 AI 任務,最終按整體準確率排名,是行業內公認的“全自動 ML 能力試金石”。

AIBuildAI 在這個測評中交出了亮眼的成績,在無測試數據泄露的前提下排名第一。其中簡單任務準確率77.27%;中等任務準確率 61.40%;高難度任務準確率 46.67%;整體綜合準確率 63.11%。

以“蛋白質酶類別預測”為例,該任務基于發表在 Science 論文的數據集,AIBuildAI 自動構建的模型,效果完全對標論文成果,普通用戶借助簡化數據集就能快速復現。

“對比學生手動寫代碼需要好幾天,AIBuildAI 十幾分鐘就能完成代碼編寫,大多數數據量不大的任務,一天內就能落地。”謝澎濤介紹道。

目前,AIBuildAI 已深度融入團隊實驗室工作,主要服務生物醫學背景的研究者,完美適配分類、回歸、序列分析等單模態任務,無論是生物信息數據分析,還是產業界的預測建模需求,都能輕松勝任。但對于 AI方向博士生的前沿研究、多模態融合任務,目前仍無法完全滿足,團隊仍在持續迭代優化。

針對用戶關心的系統適配問題,謝澎濤表示,現階段 AIBuildAI 僅支持 Linux 系統,暫無適配 Mac、Windows 的計劃。“AI 模型訓練依賴 GPU,而 99% 的 GPU 環境都部署在 Linux 上,足以覆蓋絕大多數使用場景。”

據悉,AIBuildAI 已開啟中小企業試用,收獲了不少真實反饋,也明確了下一步優化方向。用戶反饋的核心問題集中在兩點:數據處理能力不足,難以應對缺失值、標注混亂等問題;對用戶意圖理解不夠精準。

謝澎濤坦言,數據處理的技術難點并不大,通過增加數據質量檢查工具就能逐步優化,但現實場景中數據問題繁雜,實現泛化適配仍有挑戰。這也是團隊接下來的重點攻堅方向。

對于 AIBuildAI 的長遠未來,謝澎濤有著更宏大的構想:讓智能體具備自我學習、自我進化的能力。“未來它能主動閱讀最新論文,歸納新知識、轉化為自身技能,不用人工干預就能實現能力升級。”

1.https://pengtaoxie.github.io/

2.https://github.com/aibuildai/AI-Build-AI

3.https://github.com/openai/mle-bench/pull/126

4.https://www.science.org/doi/10.1126/science.adf2465

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“房坐空亡,家敗人亡”,不是迷信!“空亡”到底指的什么

“房坐空亡,家敗人亡”,不是迷信!“空亡”到底指的什么

三農雷哥
2026-03-18 14:17:21
東契奇NBA生涯第60次單場得分40+,位列現役所有球員第5

東契奇NBA生涯第60次單場得分40+,位列現役所有球員第5

懂球帝
2026-03-26 11:45:09
張水華為賺錢拼了!7天2賽沖連冠:獎金3萬+出場費10萬+一輛車

張水華為賺錢拼了!7天2賽沖連冠:獎金3萬+出場費10萬+一輛車

念洲
2026-03-26 13:14:49
干翻埃爾法?尊界MPV實車曝光,前臉照搬S800

干翻埃爾法?尊界MPV實車曝光,前臉照搬S800

泡泡網
2026-03-26 11:21:11
特朗普據悉將請扎克伯格、 埃里森和黃仁勛加入 科技委員會

特朗普據悉將請扎克伯格、 埃里森和黃仁勛加入 科技委員會

每日經濟新聞
2026-03-25 23:07:37
炸毀美雷達和直升機后,伊拉克官方下令:民兵可放開打美以

炸毀美雷達和直升機后,伊拉克官方下令:民兵可放開打美以

阿芒娛樂說
2026-03-26 13:16:54
32.29萬起!全新一代A6L正式上市,華為乾崑智駕上車!

32.29萬起!全新一代A6L正式上市,華為乾崑智駕上車!

小南看車
2026-03-25 22:59:29
50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

Hi科普啦
2026-03-25 14:57:31
上海警方發布警情通報:左某某已被警方依法刑事拘留

上海警方發布警情通報:左某某已被警方依法刑事拘留

新京報
2026-03-25 20:46:14
特朗普被曝希望“快速”結束對伊朗戰爭

特朗普被曝希望“快速”結束對伊朗戰爭

界面新聞
2026-03-26 12:37:58
爆料廣東隊教練組大調整,杜鋒面臨下課,替代者現身,球迷支持

爆料廣東隊教練組大調整,杜鋒面臨下課,替代者現身,球迷支持

宗介說體育
2026-03-25 10:31:37
穆雷轟53+6+4無緣今日最佳!對不起,東契奇暴走創神級紀錄

穆雷轟53+6+4無緣今日最佳!對不起,東契奇暴走創神級紀錄

世界體育圈
2026-03-26 13:01:23
76人最多領先47分大勝公牛 恩比德復出35+6+7喬治解禁28分

76人最多領先47分大勝公牛 恩比德復出35+6+7喬治解禁28分

醉臥浮生
2026-03-26 09:25:57
癡呆癥的風險降低35%!哈佛追蹤13萬人:每天2-3杯,讓大腦衰老踩剎車

癡呆癥的風險降低35%!哈佛追蹤13萬人:每天2-3杯,讓大腦衰老踩剎車

王二哥老搞笑
2026-03-26 13:56:44
張召忠預言或將成真:美國一旦倒下,亞洲這2國將會打起來?

張召忠預言或將成真:美國一旦倒下,亞洲這2國將會打起來?

紀中百大事
2026-03-26 09:44:20
石油危機爆發?普京徹底醒悟,美財長通告全球:對中國根本沒用

石油危機爆發?普京徹底醒悟,美財長通告全球:對中國根本沒用

閱識
2026-03-26 11:25:47
沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國別造島

沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國別造島

云上烏托邦
2026-03-24 14:50:45
國民黨大亂!馬英九緊急發聲,鄭麗文下場開罵:扯破臉、斗到底

國民黨大亂!馬英九緊急發聲,鄭麗文下場開罵:扯破臉、斗到底

小小科普員
2026-03-25 19:25:13
臺灣最先倒下?陷入斷油斷氣危機,大陸給出承諾,指了一條明路

臺灣最先倒下?陷入斷油斷氣危機,大陸給出承諾,指了一條明路

照亮你的前行之路
2026-03-23 00:17:18
南京女教師停職風波反轉!大批家長發聲力挺,懇請恢復崗位與聲譽

南京女教師停職風波反轉!大批家長發聲力挺,懇請恢復崗位與聲譽

火山詩話
2026-03-26 06:37:23
2026-03-26 15:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16487文章數 514797關注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權,700名員工卻下崗

頭條要聞

擔心特朗普突然停戰 以總理下令48小時盡力摧毀伊設施

頭條要聞

擔心特朗普突然停戰 以總理下令48小時盡力摧毀伊設施

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰家人首發聲 不設追思會喪事從簡

財經要聞

黃仁勛:芯片公司的時代已經結束了

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

時尚
藝術
親子
家居
旅游

2026年了,最好看的還是“這件針織”!

藝術要聞

哪一座橋不是風景?

親子要聞

躺平的孩子意外覺醒了,在父母學會當“烏龜”!

家居要聞

傍海而居 靜觀蝴蝶海

旅游要聞

淡季旺銷!南明住宿業今年前兩月營收斬獲1.18億元

無障礙瀏覽 進入關懷版