網易首頁 > 網易號 > 正文申請入駐

萬字實錄：AI究竟是普通人的“印鈔機”，還是更狠的「收割機」？| GAIR Live 021

2026-01-09 17:44:22　來源: AI科技評論

廣東舉報

分享至

當全市場都在用Agent炒股，人類的唯一勝算在哪？

作者丨岑峰

編輯丨馬曉寧

一年前，金融大模型賽道還在為“通用底座微調”還是“純垂類自研”爭論不休；一年后，一場全球首個 AI 投資大賽Trading Arena的賽果讓行業重構了認知：國產通用大模型通義千問、DeepSeek 擊敗一眾美國基礎模型，在實盤模擬中脫穎而出。

當“通用邏輯”開始在極端專業的金融賽道展現統治力，我們不禁要問：AI 是否真的具備了超越人類分析師的“投資直覺”？在高收益、低風險、高流動性的“不可能三角”面前，AI 是破局者，還是加速收割的“軍備競賽”？

近日，雷峰網 & AI 科技評論特別邀請了香港科技大學（廣州）袁子軒老師、浙江大學方榯楷老師、資深分析師張菁老師，圍繞“AI 大模型金融應用的機遇與挑戰”展開了一場深度對話。他們從投資大賽的底層邏輯出發，拆解了 Agent 智能體在金融場景的落地瓶頸，并對“黑天鵝”預判及人類分析師的終極核心競爭力進行了深刻反思。

提及Trading Arena，嘉賓認為，這場比賽是一次極佳的“大規模科普”，它證明了大模型已經可以承擔70%~80%的數據收集與基礎分析工作。

然而，比賽的勝出并不等同于對現有金融體系的超越。DeepSeek 等模型的勝出，或許并不完全靠“更懂金融語料”，而是靠更強的通用推理能力與穩健的投資風格勝出。這標志著行業路徑的收斂——相比于堆砌金融語料，打造一個具備頂級邏輯推理能力的“大腦”才是金融應用的第一性原理。

此外，Agent Workflow（智能體工作流）已成為金融機構的核心攻堅點。AI 的躍遷不在于寫了一篇多么漂亮的研報，而在于“研究覆蓋廣度”與“邏輯一致性。

然而，Agent 并非萬能。三位嘉賓達成共識：金融是一個容錯率極低的行業，未來的金融 Agent 不應只是調取通用接口，更需要配備專業的“金融工具箱”。在人類實地調研、獲取“離線數據”的能力面前，AI 目前仍是一個需要人類駕駛員隨時準備“踩剎車”的輔助系統。

“黑天鵝”預判一直是投資界的“圣杯”。AI 是否能發現那些難以量化的非理性風險？對此，方榯楷老師提出了兩條路徑：一是基于自然語言的多模態感知，通過感知推特、新聞、公告等微小擾動來推演風險；更有想象力的第二條路徑是構建金融“世界模型（World Model）”，他分享了在微軟參與的 Mars 項目，通過建模二級市場最底層的“訂單流”來打造金融市場的數字孿生。在這種仿真環境下，AI 可以遍歷數萬種極端場景，捕捉可能引發崩盤的“觸發點”。

袁子軒老師則堅持“知識圖譜 + 大模型”的混合路徑。他認為，知識圖譜是人類經驗的“行動綱領”，大模型是執行的“肌肉”。只有通過結構化的因果推演，才能在不確定性中找到邏輯的抓手，避免模型陷入“一本正經胡說八道”的幻覺陷阱。

當全市場都擁有了頂級的 AI 工具，金融市場會發生什么樣的變化？對此，張菁老師給出了一個令投資者警醒的觀點：AI的普及會迅速壓平“信息層”的Alpha。投資不是比誰預測得準，而是比誰能承擔結構性代價。在 AI 軍備競賽中，超額收益會變得更集中、更短命且更暴利。

那么，人類的終極競爭力在哪里？張菁認為，是“認知差”。在大規模范式轉移、新敘事產生、以及缺乏歷史樣本的定性決策面前，人類對于“不可規則化”風險的直覺和認知是 AI 難以企及的。

“投資中最危險的不是犯錯，而是精確地犯錯。”AI 可能會因為邏輯趨同而制造流動性真空，而人類則需要保持清醒，在“完全理性”的算法叢林里尋找非共識的生存機會。

以下是此次圓桌討論的精彩分享，AI 科技評論進行了不改原意的編輯整理：

岑峰：大家好，我是雷峰網的岑峰，歡迎來到Gair live 第 21 期，本期主題是“AI 大模型金融應用的機遇與挑戰”。

在正式討論前，我想分享一個震撼金融圈和 AI 圈的消息：上個月結束的全球首個 AI 投資大賽Trading Arena中，來自中國的通用大模型通義千問、 DeepSeek 獲得前兩名，而美國另外 4 個參賽的大模型，另外 4 個來自美國的基礎模型均告虧損。一年前行業還在爭論是通用模型加金融語料的微調更強，還是金融垂類的大模型更專業，但現在的局面似乎發生了變化。在未來，AI 大模型將會給金融投資帶來怎樣的躍遷，能否成為普通投資者獲得更好的收益的投資工具？今天我們請到了港科廣的袁子軒老師，浙大的方榯楷老師以及分析師張菁老師。首先請三位做簡單的自我介紹。

袁子軒：大家好，我是袁子軒，現任香港科技大學（廣州）金融科技學域助理教授。主要研究方向為金融文本挖掘、事件驅動、股票交易知識圖譜構建與推理。我的實驗室與券商、基金、銀行及 IT 公司保持緊密的科研與項目合作。同時，我是一家初創企業的創始人，公司愿景是通過構建AI Agent，為每一位個人投資者配備一個數字人團隊，其中包括數字人分析師、數字人投資顧問和數字人基金經理，為普通投資者提供具有個性化的專業財富管理服務。

方榯楷：大家好，我叫方榯楷，現任浙江大學信電學院百人計劃研究員、博士生導師。研究方向包括機器學習、生成式 AI 及時間序列。加入浙大前，我曾任職于微軟亞洲研究院機器學習部金融組，參與過金融基座大模型及金融 Agent 的開發。在求學期間我對量化投資非常感興趣，曾在摩根斯坦利、世坤（Worldquant）及私募機構有實習和比賽經歷，對二級市場比較熟悉。

張菁：大家晚上好，我是張菁，理工科背景。目前在投資機構從事科技行業研究和 A 股策略研究，協助投資經理進行組合管理。我的工作重點是搭建從宏觀策略到細分行業的基本面研究框架，跟蹤科技產業趨勢并轉化為可執行的投資判斷。此外，我也與袁老師團隊合作，提供 A 股市場基本面研究邏輯及部分細分行業的特異性跟蹤框架。

01
揭秘國產AI“橫掃投資大賽”的背后真相

岑峰：謝謝三位。我們從全球首個 AI 投資大賽談起。我注意到袁老師團隊在大賽結束后發表了一篇相關的論文，您如何看待大賽的結果？

袁子軒：大賽結果非常有意思。第一賽季以加密貨幣為標的，通義千問表現最佳，DeepSeek 緊隨其后，再次凸顯了國產大模型的能力。后續加賽標的變為美股，Grok-4.20 和 ChatGPT 表現較好。

我的看法有以下幾點：

以 DeepSeek 為例，其表現反映出頭部量化公司及 IT 機構已在大范圍部署大語言模型，輔助交易員或投資經理做決策。模型展現出了超常的市場敏感度和機會挖掘能力。

我認為這場比賽更多的是一種大規模的科普，這種“打擂臺”的方式讓大家意識到大模型可以直接用于投資。雖然目前投資結果不穩定性較高，但隨著技術迭代，模型終能承擔 70%~80% 的數據收集與分析工作，人類只需負責最終拍板。

另外，大模型在不同經濟周期和市場環境下的表現并不穩定。兩周的賽期太短，這種短期表現的局限性不足以證明其能力強于人類交易員。驗證策略有效性通常需要經歷牛熊市場的長周期，以剔除噪聲、運氣及市場波動等因素。

最后，普通投資者不能盲目相信大模型的投資建議。大模型目前更多起到“傳話筒”的作用，通過聯網搜索將市場觀點糅合推給用戶，是一個強大的信息整合工具。但涉及最終買賣決策，仍需要嚴謹的決策系統或經驗豐富的交易員，才能生成長期穩健的策略。

岑峰：袁老師在論文中提到的方法也證明，模型正從直覺判斷轉向有理有據的思考。我想請問方老師，您如何看待比賽結果？此外，像清華推出的金融 K 線大模型（Chronos）等前沿工作，對這類比賽和行業應用有何促進？

方榯楷：關于這個比賽，我認為它對現實的參考意義有限，原因在于模型的輸入信息極其匱乏。比賽第一季中，模型能看到的信息僅限于交易幣種及過去一段的價格序列，幾乎沒有基本面輸入。即便在第二季，也僅能看到排名或對手盤信息。這種純粹基于價格序列的決策，更多是捕捉了加密貨幣市場高流動性、高 Alpha 的特性。

雖然 DeepSeek 和通義千問成績不錯，但我對其展現的“強推理”持保留意見。在加密貨幣這種波動大、機會多的市場，簡單的趨勢跟蹤信號就能獲利。DeepSeek 的勝出可能更多源于其交易風格的穩健，比如它對交易節奏和成本的把控較好；而 GPT 或 Claude 輸在過于激進，傾向于梭哈或加高杠桿。這可能受模型訓練過程中形成的“人格化特征”影響，而非純粹的邏輯推理。

您提到的清華 Chronos 屬于時間序列大模型，它將金融時間序列作為一種非語言模態進行預訓練。雖然目前直接用于交易可能仍有爭議（有用戶反饋實測效果不佳），但我認為這條路徑更具前景。

在金融市場，技術面因子和價格始終是最核心的數據。與其繞道語言模態去推測時間序列，不如直接在時間序列模態上構建通用底座模型（Foundation Model）。如果模型能精準預測股價漲跌，哪怕沒有復雜的語言推理，簡單的交易策略也能獲得極佳表現。因此，在技術面交易上，我更看好非語言模態的通用模型。

岑峰：張老師，您又是如何看待這場比賽的呢？

張菁：剛才兩位老師從模型和比賽解讀上已經分享了很多，我從真實的投資交易的視角和底層資產的角度補充兩方面看法：

從投資角度，我個人對結果持謹慎態度。在投資中，收益率高低不能直接映射為模型的智能水平，只能說明該模型生成的策略在特定時期更適配當期的市場與約束。
金融交易存在三重隨機性：一是大語言模型在采樣輸出層面的隨機性；二是金融市場作為高噪聲系統，價格波動存在大量的不可預測性；三是真實交易中存在滑點、風控、強平等現實約束。在這種疊加狀態下，單一賽季的成績更像是一個樣本，而非模型長期能力的反映。

從資產類別的底層邏輯來看，第一賽季標的是高波動、高杠桿的加密貨幣永續合約。這更多是一個“在規則中如何幸存”的游戲，對風險紀律和倉位控制的要求遠高于對方向的預測。

后續賽季標的變更為美股，無杠桿且有更多基本面信息。Grok 的勝出很大程度被歸因于其背后的 X 平臺在實時信息與輿情獲取上的優勢，這在短周期決策中非常有效。
真正的通用能力應對任務分布的變化不敏感。兩場比賽結果的巨大差異，恰恰說明目前比賽測算的是模型在噪聲、杠桿及約束下的風險控制與行為一致性，而非純粹的智力水平。

岑峰：感謝張老師。您提到了兩個關鍵點：一是隨機性，這讓我想起《隨機漫步的傻瓜》一書，說明了金融投資的不可控性；二是風險因素與條件約束。不同策略在不同場景下的表現迥異，這正體現了金融投資的復雜性。

02
“既要又要還要”，AI能打破投資的“不可能三角”嗎？

岑峰：我們順著這個話題延展：面對復雜的金融投資環境，究竟是傳統金融垂類模型更有優勢，還是說通用大模型在比賽中的勝出，預示著其已具備超越傳統模型的能力？

袁子軒：模型能力的提升并不等同于對現有模型的超越。無論是 AI 還是人類，挖掘策略時必須搞清楚“賺的是哪部分錢”。投資不是簡單地通過提示工程將信息整合并交給模型，利用其先驗知識（Prior Knowledge）尋找鏈路，而是要深入研究其背后的投資邏輯（如量價因子、反轉因子或價值因子）。

真實的交易離簡單的信號或趨勢判斷很遠。我們需要在風控層面上做大量工作，確保模型做出的每一個決策都是可落地的。

大模型本質是知識的壓縮。不同模型（如通義千問與 DeepSeek）的訓練語料截然不同，推理時可能會堆疊無關信息。在不同時間與場景下，篩選并權衡關鍵因素的能力與邏輯推理同等重要。

優秀的策略需經受不同周期與極端行情的考驗。目前大模型在極端環境下常表現出不理性行為（如盲目梭哈），僅在與預訓練環境相似的條件下表現較好。一旦市場環境發生切換，其分析與交易優勢可能蕩然無存。
大模型目前缺乏自我校驗能力。即便使用多智能體框架（Multi-agent framework），仍會出現“一本正經胡說八道”的情況。目前基于一致性的校驗方法（如 LLM-as-a-judge）只能說明輸出內容在多次采樣中保持一致，并不代表判斷正確。這是大模型在金融決策領域面臨的最大風險隱患。

岑峰：袁老師提到通用模型策略無法完全替代專業人士的實戰經驗，這似乎說明金融垂類模型在未來競爭中仍具優勢。我想請教張菁老師，從金融機構的需求角度，是否能驗證這一看法？

張菁：關于模型底層的技術細節我了解不多，但從機構需求角度來看，目前大家尚未完全決定走哪條路線。

以彭博（Bloomberg）為例，他們曾投入巨資從頭訓練垂類模型 BloombergGPT，擁有終端數據和高效解讀優勢，但目前行業內對其后續聲量和實際效果討論較少，說明純垂類路徑成本極高且結果具有不確定性。

從機構的核心訴求看，無論走哪條路徑，機構最關注的是效率提升、覆蓋面拓展和成本節省。金融是一個容錯率極低的行業。大模型無法為決策負責，最終責任必須由具體的人承擔。因此，我們在評估模型時，核心不在于它有多聰明，而在于其風險是否可控、結果是否可預測。

岑峰：除語料因素外，美國大模型在比賽中表現不一，是否也受技術路線影響？

方榯楷：我不認為這個比賽能證明技術路線的優劣，目前大模型技術在預訓練和架構上已經高度收斂。

現在的工業界 follow 論文和架構優化、強化學習 trick等新技術的速度非常快，一旦某個架構被證明有效，大家會迅速同步。正如 OpenAI 成員所言，Scaling 的時代可能已結束，現在更多進入了研究驅動的階段。

評價模型不能只看 BenchMark 上微小的分差。我常用招聘來打比方：金融機構更喜歡理工科背景、視野開闊的復合型人才，而非只懂金融的“純專才”。模型也一樣，通用基礎打得越好、推理能力越強，其能力的上限就越高。

垂類工作（Domain Knowledge）負責托住模型的“下限”。一年前大家覺得做知識庫、掛 RAG（檢索增強生成）就是垂類模型，但現在這已成為主流且平凡的技術方案。

真正的垂類優勢不應僅體現在擁有更多數據或簡單的微調，這種方式難以說服市場。真正有價值的垂類路徑，是將金融領域的專業范式（如信號預測、風控邏輯、不確定性分析）內化為一套 Agent Workflow（智能體工作流）。讓模型像專業人士一樣，在決策前必須收集特定信息、調用時序工具或輿情工具，并完成結構化的分析。這種將行業 Know-how 結構化地融入模型執行鏈路的能力，才是金融應用真正有意義的方向。

岑峰：投資領域存在一個“不可能三角”，即高收益、低風險和高流動性難以兼得。AI 大模型是否讓這個不可能三角松動，甚至打破了“不可能三角”？在實際工作中，各位老師如何考慮并試圖破解這一難題？

袁子軒：直覺告訴我“不可能三角”基本不可能被打破。作為“游戲參與者”，想要改變游戲規則是非常困難的。

張老師和方老師都提到，金融市場存在嚴重的信息不對稱、高度不確定性以及大量噪聲，本質是多方博弈。引入 AI 玩家并不能從底層改變這種博弈的邏輯，因此“不可能三角”將繼續存在。

從短期來看，市場參與者之間的收益是零和博弈，一個人賺錢了，另一個人必定虧錢。但如果從長期來看，收益源于 GDP 增長和價值創造，這意味著只要采取正確的投資策略，從長期來看一定是能夠賺到錢的。

我認為，AI 的核心價值在于作為輔助工具，快速處理非結構化或半結構化數據，挖掘投資機會；同時，利用 AI 模擬不同場景和假設，幫助投資者判斷長期增長趨勢及潛在收益，而不是從根本上改變投資規則。

方榯楷：我用一個比喻來回答：相比個人，AI Agent 是一個更理性、更專業的投資者，它知識儲備更廣，且不會由于“頭腦一熱”做出沖動決策。

對比起機構化程度較高的美股。 A 股情緒驅動較多，經常出現類似“川普獲勝，川大智勝漲停”這樣受輿論裹挾的非理性波動。未來隨著更多 AI Agent 加入，市場會變得更加理性，非理性的炒作和泡沫會相應減少。

現在大家做投資，往往關注的是二級市場里的這些一些波動或一些大的趨勢，但它可能是來自于一級市場，甚至說整個經濟，甚至說整個產業的那種變化。AI Agent 或許能幫人挖掘 Alpha（超額收益），但真正決定長期表現的是 Beta（市場表現）。而 Beta 往往由二級市場之外的產業、經濟等宏觀因素決定，對此 AI 往往愛莫能助。
“不可能三角”是基于數學假設的客觀規律，不因投資者是否理性而改變。

我不認為該規律應該被打破：如果真的出現能完美預測一切的“神級AI”，會導致嚴重的馬太效應，財富將極度集中，就像劉慈欣在《贍養人類》中描述的“終產者”一樣。因此，這一規律某種程度上也保護了普通人，維持了系統的平衡。

張菁：我非常認同，“不可能三角”無法打破，這本質上不是技術問題，而是市場結構本身的約束。不可能三角的三個頂點本質是沖突的，高流動性意味著信息被迅速消化，壓縮了基于信息差的超額收益；低風險意味著拒絕承擔尾部風險，而尾部風險恰恰是高收益的來源；高收益來自信息不對稱或承擔他人不愿承擔的風險。無論是真人還是模型，本質都是在三者之間做取舍。
AI 的優勢在于單位時間內處理信息的能力，看似符合“完全理性人”假設，但無法改變市場結構。在收益端，AI 擅長“時間套利”，更快發現并執行，但這會導致超額收益的持續性變短；在風險端，AI 只能降低“可建模的風險”，無法消除尾部風險。甚至可能由于“模型趨同”，在極端行情下同時做出相似決策，制造流動性真空，從而放大系統性風險。

投資中最危險的不是犯錯，而是“精確地犯錯”。模型可能會給人一種“因為技術高，所以判斷精確、風險低”的錯覺。大語言模型的核心價值不是替代投資者做判斷，而是降低人類在不確定環境中的結構性認知偏差。保持對工具優勢與局限性的清醒認識，才是最有意義的。

03
從“復讀機”到“印鈔機”：頂級機構是如何調教“數字分析師”的？

岑峰：的確，不可能三角之間相互制約，同時金融數據具有稀疏性、高波動性和非結構化等特點，這是否是 AI 理解市場的關鍵限制？在應用中如何克服？

袁子軒：針對這三個難點，我分別談談我們的對策：

金融市場中有價值的信息其實非常稀缺。我們主張做“減法”，通過方法論獲取最精準的數據喂給模型。我們會與張菁老師等優秀分析師或基金經理深度溝通，將他們的行業觀點和看待市場的框架轉化為知識圖譜或高質量標注，讓模型在推理階段參考這些專家經驗做決策。

針對高波動性的特點，市場變化極快且數據分布不斷“漂移”，單純基于歷史數據訓練的模型延展性較弱。因此，我們將大模型與傳統的主觀或量化模型結合，接入實時市場信息，并通過場景模擬、壓力測試等手段，確保模型在波動市場下的決策魯棒性。

最后是非結構化處理，我們利用微調后的模型將研報、公告、新聞等轉化成結構化信息表。配合投研分析框架，模型可以高效識別核心觀點和核心數據，并實現自主探索、分析與驗證。雖然仍有“人機協作（Human-in-the-loop）”環節，但在多數情況下模型能自主迭代，大幅提升了處理復雜數據的效率。

AI 是高效工具而非替代品。它能幫助分析師快速收集整理重要信息，顯著提升工作效率與決策效率。

岑峰：袁老師提到充分利用大模型能力去自主調研、自主分析，請教張老師，這種多智能體協作方式在金融機構的落地效果如何？它能否真正進入分析師的核心工作流？

張菁：目前大模型工具在金融機構的應用，主要在紀要整理、初稿生成、數據匯總及合規檢查等環節，智能體協作已在多家機構落地，且在這些初級場景中的提效穩定性優于初級人工。

但在涉及“核心判斷”的環節，大模型尚未真正涉足。原因不在于技術能力，而在于金融決策中存在大量無法規則化的“灰度判斷”、非公開的政策預期以及最終的責任歸屬問題。

與袁老師團隊的合作讓我看到了未來工作的兩個躍遷維度：首先是廣度，過去人腦由于精力有限，撰寫一篇深度報告可能需要兩個月；現在通過將投資框架拆解為判斷規則、約束條件和因果路徑，交給 Agent 掃描全市場，能極大擴展研究覆蓋面；其次是邏輯的一致性，這種基于邏輯的掃描不僅能輔助研究，還能幫分析師發現被忽視的機會或糾正之前的錯誤觀點。

目前合作產出的行業觀點及點評已接近初級行研員水平。不同于通用大模型僅能做“相關性分析”或“事實陳述”，袁老師團隊的產品基于產業鏈傳導的因果推演，能真正理解市場邏輯并指導投資。我認為這種基于專家邏輯的深度結合，是大模型在金融領域真正實現價值的方向。

04
預測下一次“金融海嘯”：AI能識別那些看不見的黑天鵝風險嗎？

岑峰：張老師提到真實投資場景中存在許多難以量化的“灰色規則”。請問方老師，AI 大模型能否通過分析推理，發現金融市場中難以量化的風險，甚至預判“黑天鵝”事件以避免重大損失？目前的障礙在哪里？

方榯楷：這是一個非常有深度的問題。關于 AI 如何預測“黑天鵝”，我理解目前主流有兩條技術路徑：

第一條路徑是基于自然語言的多模態感知推理，盡可能擴展 AI 的輸入模態，不僅是專業分析師的觀點，還包括輿情、產業鏈因果鏈條、圖片、表格等豐富信息。期待 AI 憑借強大的感知與推理能力，從復雜信息中推斷出風險。

不過，我對此路徑持保留意見。黑天鵝事件之所以被稱為黑天鵝，是因為其邏輯關鍵點往往是反主流、背離常識且屬于極小概率的。大模型接收的多是主流觀點，而黑天鵝往往是“未定義”或“未知”的。目前的 AI 推理對于處理這種非主流邏輯、預測未知領域（Unknown）仍非常困難。

路徑二是構建金融“世界模型（World Model）”或數字孿生，借鑒機器人領域的“世界模型”思路，通過建模真實事件來實現仿真。

我在微軟期間參與了金融基座大模型 Mars 的工作。我們收集二級市場最底層的訂單信息進行建模，因為價格形成的核心是訂單撮合與多空博弈。將訂單邏輯學會后，模型更像是金融市場的“數字孿生”或模擬器。我們可以進行無風險仿真，比如研究大額拆單的“市場沖擊（Market Impact）”，或觀察市場在自由演化下是否會突然崩潰。通過在平行世界中遍歷各種極端操作或隨機事件，尋找引發黑天鵝的“觸發點（Trigger）”。
總結一下，預測黑天鵝的兩條路一是通過超強的多模態推理發現端倪；二是通過構建金融世界模型進行壓力測試與仿真。這兩者都是目前非常前沿且酷的研究方向。

岑峰：過去我們利用知識圖譜（KG）關聯金融知識，現在大模型通過隱式推理直接給出結果。袁老師提到大模型已具備一定的因果理解能力，在您的研究中，這種能力達到了什么程度？

袁子軒：大模型在推理任務中表現優異，但在處理行業專家的邏輯時仍存在不穩定性，且通過精準微調來更新知識的成本極高。因此，我們將傳統知識圖譜與大模型結合，主要邏輯如下：

一是將知識圖譜作為“行動綱領”。知識圖譜能夠記錄分析師的決策路徑和思考鏈路，雖然它在表達隱性知識上有局限，但能作為結構化的分析工具輔助模型判斷。

在知識圖譜設定的路徑上，我們部署由多個 Agent 組成的“行動小組”，分別負責搜索、分析、驗證、回測和交易。通過多角度交叉驗證，確保模型給出的答案可靠且可落地。

知識圖譜不僅能提升模型效能，還是連接分析師與專家的媒介。未來，分析師的投研方法論可以轉化為高價值的數字化金融資產，通過人機共創模式實現知識共享，幫助普通投資者做決策。

岑峰：在將專業知識落地的過程中，有哪些關鍵點和難點？

張菁：在與袁老師團隊的合作中，我們主要通過持續的交互和反饋來解決落地問題：

首先是框架拆解與輸入，我會將通用的股票研究框架、細分產業鏈邏輯以及不同市場環境下的交易關注點提供給技術團隊進行初步訓練。

然后是閉環測試與糾偏，我們會針對生成結果進行嚴謹判斷，檢查模型是否找到了精確數據，是否存在“幻覺”或自說自話的邏輯補足。

我們利用突發事件（如財報發布、供應鏈新聞、個股黑天鵝等）進行壓力測試，觀察模型對股價波動影響的評價是否符合真實市場反應，從而不斷優化整個體系，確保模型真正理解行業和二級市場邏輯。

岑峰：從學術研究角度看，如何讓大模型能力與金融專家經驗達成完美協同，而不是簡單的替代？

方榯楷：我認為未來大模型在實際場景的應用一定是 Agent化的，協同的核心體現在兩個維度：

一是工作流（Workflow）的節點連接，智能體的核心競爭力在于其工作流設計。在復雜的決策鏈條中，某些關鍵節點必須引入人為的經驗和價值判斷，以此消除模型的不確定性，保證輸出質量；

二是專業工具箱（Skill/Tools）的打造：決定 Agent 能力上限的是它的“工具箱”。我們不應依賴模型從頭學習解決每一個具體且困難的問題，而應由專業分析師針對細分領域打造專業的工具（如輿情分析工具、產業鏈調研工具），并匹配好模型接口。
專業人士的未來價值不在于重復性勞動，而在于兩點：一是設計專業的工作流；二是打造更強的專業工具，讓大模型在特定領域內發揮出超越通用的專業水平。

岑峰：方老師提到了 Agent Workflow 的重要性。在技術層面，我們應如何為 Agent 裝上“安全閥”，防止其在自主決策中“跑偏”？在決策路徑中，最容易出問題的環節在哪里？

袁子軒：“安全閥”應貫穿事前、事中與事后：

事前主要通過上下文工程（Contextual Engineering）進行指令約束，給模型足夠的示例（Demonstration）。目前大模型的指令跟隨能力很強，通過規則約束能解決大部分問題。

事中則是工具箱驗證與歸因，引入可解釋性工具、多模型驗證及回測工具。關鍵要判斷模型從研報或信息中提取的觀點，對最終決策產生了多大貢獻。目前落地難點有兩點，一是時效性，每一步都調用大模型會導致決策過慢，錯過交易時機；二是幻覺問題，同一問題可能給出多種解法，判斷其有效性是長期挑戰。只要 Transformer 架構不變，幻覺可能長期存在。

事后進行壓力測試與回測，站在策略角度，通過長周期時間窗口或極端場景模擬，判斷 AI 給出的買賣信號是否穩健、能否真正盈利。

高質量數據往往是“離線的”，需要實地調研、交流，這是目前機器人無法替代的。投資是一門藝術，AI 目前像個“Baby”。人機協作能提升“藝術創作”的效率，讓模型處理初級資料搜集工作，分析師則通過決策邏輯給模型施加約束，讓模型更關注投資本質。

岑峰：金融行業極其講究準確性。對于大模型的幻覺問題，學術界目前有哪些思路，讓 AI 在提供客觀、周全參考的同時避免“胡說八道”？

方榯楷：徹底解決幻覺是諾貝爾獎級的難題，但我們可以從以下幾個方向改善：

·RAG（檢索增強生成）：通過外部加載信息（如知識圖譜）進行事實核查（Fact-checked），讓模型在輸出前查證事實。

·外部驗證環境：當模型提出觀點或引用數據時，應由外部環境（人或系統）進行驗證。

·沙盒測試（Sandbox）：針對高價值、高影響力的決策，應建立獨立于大模型之外的驗證器。例如，下單決策前需經過自動化的回測環境，測試其潛在的風險和夏普比率，或由專家進行評估。這種“外掛”的風險評估環節和不確定性驗證器是必不可少的。

05
AI金融之辯：當全市場都是“算法”，普通人怎么辦？

岑峰：投資最終是為了尋找 Alpha（超額收益）。正如張老師所言，AI 工具的應用雖然能幫助發現機會，但也讓 Alpha 消失得更快。在這種“AI 軍備競賽”中，專業分析師的工作方式受到了怎樣的影響？人類分析師的終極核心競爭力又該如何體現？

張菁：確實，當所有人都使用 AI 時，Alpha 會變得更短命、更集中且更暴利，收益分布也會變得極端，尾部風險增大例如 2024 年初的微盤股閃崩。

投資的本質不是預測，而是承擔結構性代價。Alpha 不是市場的獎勵，而是你替市場承擔了他人無法或不愿承擔的風險。AI 的優勢在于它會迅速壓平“信息層”的 Alpha，它比人類更擅長捕捉由流動性錯配、行為偏差帶來的交易機會；而人類不可替代的優勢在于認知差，在范式識別、定性決策、和邏輯深度上是AI難以替代的。

·范式識別：在新敘事產生或范式轉變時進行識別與應對的能力。

·定性決策：在缺乏歷史樣本的情況下，進行定性決策的能力。

·邏輯深度：當工具和數據拉平了技術門檻，變量就只剩下邏輯與認知。頂尖投資者賺的是“認知差”的錢。

AI 不是在取代分析師，而是在重塑核心能力。理想狀態下，應將“可規則化”的認知勞動交給 AI，人類專注于“不可規則化”的判斷，從而獲取難以消磨的超額收益。

岑峰：AI 工具在拉平水平的同時，我們也觀察到散戶在面對量化機構時似乎更加弱勢。您如何看待量化工具對市場生態及普通投資者的影響？

張菁：這是一個復雜的問題。量化在交易層面（如拆單、多賬戶配合引導走向）具有人類無法抗衡的優勢，尤其在微盤股等低流動性資產中已形成類似的“資金盤”。
我的建議是：不要參與到量化的游戲中去。散戶應利用自己的優勢進行真正的“投資”，去研究商業模式、思考公司的長遠發展。如果只是將其作為賭博，那就只能“愿賭服輸”。

岑峰：有觀眾提問：金融本質是資源的分配。更多使用 AI 進行決策，是否意味著人類最終會將資源的分配權交給 AI？

袁子軒：我認為應從兩個層面來看：金融不僅僅是分蛋糕，長期投資于有價值的公司是在創造價值、做大蛋糕；其次，AI 始終是高級工具。如果人類保留最終的“拍板權”，AI 就不會主導人類的命運。人類的優勢在于創造力、價值發現及非共識的觀點，這些比 AI 挖掘出的信息總結更重要。

方榯楷：我也認為 AI 是讓分配過程變得更理性、更高效的手段。一個健康的金融體系應將資源分配給有價值的行業。AI 的加入能提供更多的有效性與流動性，減少市場中的噪音與不理性，這是好事。

至于是否讓 AI 做出重大戰略決策，如果只是腦洞一下是可以的，但從更深層次看這是關乎公平、效率與多樣性的哲學話題，目前的問題不是市場由于 AI 而變得“過度理性”，而是存在太多的噪音與非理性。引入更多高效、理性的工具，對當前市場是有益的。

岑峰：回到開頭提到的 Trading Arena 比賽，如果明年繼續舉辦，從機構投資的角度出發，您認為應在哪些維度增加更有挑戰性的考核指標？

張菁：如果比賽的目標是貼近真實的機構投資場景，就不應只關注收益率，否則訓練出的是“賭徒”而非“投資者”。我建議從以下三個維度增加挑戰：

首先，強化風險維度的考核，考察最大回撤、杠桿暴露、倉位分布以及交易行為的一致性，避免模型通過“梭哈”博取排名。同時，需考慮真實交易中的資金容量和沖擊成本問題；

其次，模擬完整經濟周期，在比賽中引入人為的宏觀干預或風格切換，考核模型識別環境變化并調整策略的能力。這種“跨周期生存能力”對投資至關重要；

最后也是最重要的，強制模型在交易前給出邏輯說明，避免“黑盒式”撞大運。基于幻覺數據或邏輯錯誤而賺到的錢應判定為無效。對于機構投資者，一個“可解釋的虧損”比“莫名其妙的盈利”更有價值，因為前者能幫助優化框架，而后者可能在下一次黑天鵝事件中帶來毀滅性打擊。

實際投資并非面對清洗好的數據。應在輸入中混入市場謠言或假新聞，考核 AI 是“聽風就是雨”，還是能自主調用工具進行交叉驗證。真實世界充滿噪音，AI 需要具備批判性思維。

岑峰：節目的最后，請三位嘉賓用一句話總結 AI 大模型在金融領域應用的機遇與挑戰。

袁子軒：AI 大模型顯著提升了金融決策效率和信息處理能力，但真正的挑戰在于：如何在市場不確定性、可解釋性與風險約束之間，找到“人機協同”的最優邊界。

方榯楷：最大的機遇是人類擁有了功能強大的“外置大腦”和跨模態信息處理器；最大的挑戰是“黑箱”變得更大，且當市場充滿智能體時，會產生趨同效應等不可描述、尚未被定義的“未知風險”。

張菁：大模型工具的本質不是“造神”，而是幫助人類拓展理性的邊界，解決“有限理性”的痛點；但在極端不可預測事件主導的投資世界中，人類必須始終擔任那個“最后踩剎車”的駕駛員。

岑峰：感謝三位老師的精彩分享。大模型與金融的結合既有令人興奮的效率躍遷，也伴隨著對風險和邏輯深處的審慎考量。本期圓桌實錄后續將在“AI 科技評論”公眾號發布，謝謝大家，再見。

完整視頻觀看地址：https://youtu.be/SSpF16S2uus

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.