品玩3月25日訊,Anthropic Labs團隊發布最新研究,通過引入生成器與評估器分離的多智能體架構,大幅提升了Claude在前端設計及長周期自主編程中的表現。
針對模型在長任務中易喪失連貫性及自我評估過于寬容的痛點,該方案采用類似GAN的機制,將主觀設計標準轉化為可量化指標,并利用Playwright MCP進行實時交互測試與迭代反饋。
實驗顯示,相較于單智能體模式,新架構雖增加了計算成本與耗時,但能生成具備完整功能的全棧應用。在構建復古游戲制作器與數字音頻工作站的案例中,系統成功實現了從需求規劃、代碼生成到自動化QA的閉環,有效修復了邏輯漏洞并豐富了功能細節。隨著Opus 4.6等模型的演進,該研究證實動態調整智能體協作策略仍是挖掘AI工程潛力的關鍵路徑。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.