337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

百川開源醫療大模型 M3,王小川:今年會發布兩款 ToC 產品,正在做硬件

0
分享至

AI 醫療突然成為了這個月的熱點。

1 月初 OpenAI 發布醫療產品 ChatGPT Health,Anthropic 推出 Claude for Healthcare,昨天,百川智能正式開源新一代醫療大模型 Baichuan-M3。

評測成績很突出,在全球最權威的醫療 AI 評測 HealthBench 中以 65.1 分的綜合成績位列全球第一;在專門考驗復雜決策能力的 HealthBench Hard 上,也以 44.4 分的成績奪冠。這一成績,不僅刷新了 HealthBench 的最高分,更首次在醫療領域實現了對 GPT-5.2 的全面超越。

在 OpenAI 引以為傲的低幻覺領域,M3 也實現了超越,幻覺率 3.5 全球最低。

此外,M3 還首次具備了原生的「端到端」嚴肅問診能力。能像醫生一樣主動追問、逐層逼近,把關鍵病史和風險信號問出來,進而在完整的信息上進行深度醫學推理。評測顯示,其問診能力顯著高于真人醫生的平均水平。

百川的醫療應用「百小應」已同步接入 M3,面向醫生與患者開放相關能力。醫生可借助它推演問診與診療思路,患者及家屬也可通過該應用更系統地理解診斷、治療、檢查與預后背后的醫學邏輯。

發布會上,我們跟創始人王小川就百川在醫療領域的下一步、ToC 產品的策略以及商業化落地上進行了交流。


??關注 Founder Park,最及時最干貨的創業分享

超 19000 人的「AI 產品市集」社群!不錯過每一款有價值的 AI 應用。

邀請從業者、開發人員和創業者,飛書掃碼加群:

進群后,你有機會得到:

  • 最新、最值得關注的 AI 新品資訊;

  • 不定期贈送熱門新品的邀請碼、會員碼;

  • 最精準的AI產品曝光渠道

01低幻覺之外,

核心是端到端的問診能力

百川 M3 這次將醫療幻覺抑制前移至模型訓練階段,在強化學習過程中將醫學事實一致性作為核心訓練目標之一,通過將事實一致性約束融入訓練流程,M3 重構了幻覺抑制的訓練范式,在不依賴工具或檢索增強的純模型設置下,醫療幻覺率 3.5,超越 GPT-5.2,達到全球最低水平。


除了強推理和低幻覺,端到端的問診能力是本次 M3 最重要的一項突破。

AI 應用實踐中,通過 prompt「你是一位經驗豐富的醫生」,激活模型的「角色扮演」是更常見的做法。這種方式得到的是模型的表演行為,而非內生能力,激活的是模型應該提問的行為,而不是必須獲取關鍵信息的思考。即便對話看似完整,也難以支撐安全、可靠的臨床判斷,從根本上偏離了醫療「安全第一」的原則。

針對這一問題,百川提出了「嚴肅問診范式」與「SCAN 原則」,通過 Safety Stratification(安全分層)、Clarity Matters(信息澄清)、Association & Inquiry(關聯追問)與 Normative Protocol(規范化輸出),將臨床問診中高度依賴經驗的思維過程,第一次系統性地「白盒化」。

借鑒醫學教育里長期使用的 OSCE 方法,聯合 150 多位一線醫生,搭建了 SCAN-bench 評測體系,該體系以真實臨床經驗作為「標準答案」,將診療過程拆解為病史采集、輔助檢查、精準診斷三大階段,通過動態、多輪的方式進行考核,完整模擬醫生從接診到確診的全過程。相比于 HealthBench,SCAN-bench 是更加全流程端到端的動態評測新范式。

同時,還使用原生模型訓練方法取代角色扮演 prompt,針對 GRPO 無法穩定進行長對話訓練的問題,設計了新的 SPAR 算法,使模型能夠在有限對話輪次中,把臨床真正需要的關鍵問題問全、問準,把風險兜住,讓輸出經得起復核。

在實驗過程中發現,問診準確度每增加 2%,診療結果準確度就會增加 1%。評測結果顯示,M3 在 SCAN 的四個維度均顯著高于人類醫生基線水平,并大幅領先于國內外頂尖模型,成功構建了從精準的臨床問詢、深度醫學推理到安全可靠決策的閉環。


02想用 AI 實現醫患權力的讓渡,

而不是取代醫生

Q:百川主要想解決醫療場景中的哪些問題?

王小川:醫療行業有幾個核心痛點:

第一好醫生不夠。上一波互聯網醫療,像好大夫、春雨醫生,它們的模式是通過互聯網解決連接問題,這就像做滴滴和美團,前提是供給端要充足。醫療行業的供給恰恰是不足的,所以互聯網時代解決不了這個問題。AI 的爆發,可以創造出高質量的醫生供給。大家可能 2023 年還不太信這個東西,但到了 2025 年,感受就會越來越明顯。

第二醫患關系不平等。醫療是少有的受益和決策分離的行業。作為受益方,患者很難在決策中獲得充分的信息和話語權。

我們認為 AI 可以填補醫患之間的 gap,不是說醫生什么都不干了,檢查、手術、治療都是醫生干的事情,但我們希望讓患者明明白白地看病,對于自己的健康狀況有更多地了解,更好地理解醫生說的話。之前談得比較少,要么就是 AI 取代醫生,要么就是 AI 幫助醫生,但更重要的是醫患權力的讓渡,醫生把一部分權力逐步讓渡給患者。

我們認為,未來的醫療模式既不會動醫生的蛋糕,也不會讓患者產生焦慮,解決權力讓渡的問題,這是必然的趨勢。比如,一個病癥,醫生可能給出兩個方案,一個保守,一個激進,或者三個醫生每個方案都不一樣,患者怎么選?我們的 AI 醫生足夠強,能夠補充各種信息,把解釋做好時,患者和醫生的關系就會進入一個新的階段。

第三,三甲醫院消耗過度。中國和美國有個區別,美國有家庭醫生體系,大多數人都有自己的全科大夫,小病先找他們,有了大病再轉到專科,醫療行為主要發生在基層。中國,大家習慣都往大醫院、三甲醫院擠,導致醫療負擔非常重。國家雖然一直在推行基層首診,但虹吸效應依然很強。今后一個大的趨勢就是醫療場景會發生變化,大家擁有 AI 助手以后,更不去基層了,小毛病自己就看了。國家號召的「強基層」,未來可能不僅包括社區醫院,居家也會成為一個重要的醫療場景。人們在家里就能跟 AI 對話、獲取初步診斷,從根本上改變中國三級診療的格局。

第四,對人體的醫學機制認知還不夠深入患者總是覺得自己不懂,醫生懂,其實醫生有的時候也不懂,每個科室的醫生都是知道局部的信息,復雜問題需要跨科室會診。今天的 AI for Science,比如過去的蛋白質解碼、虛擬細胞、臨床數字孿生,可以幫助我們更好地建立人體模型。現在我們有能力收集更豐富的患者真實數據,在 AI 的輔助下,有機會做到「看病即入組」,更有機會做好生命模型。

Baichuan-M3 在今年上半年就能輔助做出更好的醫療決策,不僅是幫助醫生,也會幫助患者。這就是我們想推動的事,能夠有 AI 醫生陪著你,時時刻刻照顧你。

Q:未來的大模型,多模態會是主戰場嗎?

王小川:多模態主戰場這句話我是不認同的。

我們在 2023 年就提過,語言是智能的中軸。ChatGPT 發布時,大家最震撼的是它展現的智力。智力是把不抽象的事情變成抽象事情的能力,所以符號才是核心。類比即智力,人類智能主要通過三種符號語言來體現:自然語言、數學語言和代碼語言。

到目前為止,評判哪個公司的模型能力強,核心標準依然是基于符號的。像 Sora 這種視頻生成能力,可用性很強,但它不代表智力本身。在醫療場景里,很多都是決策問題,不只是看片子就行了。醫院里已經有很多小模型在輔助閱片,比如推想醫療或其他影像公司的模型。這些圖像模型輸出結果后,最終還是要符號化,然后用語言模型來做后續的推理工作。

感知模型和認知模型需要結合,表現就是把影像變成報告和診斷模型。最近還有胰腺癌頻掃 CT 模型,這些感知模型更像是主干上的葉子,不是「主戰場」。我們很快也會發布和圖像相關的模型,把醫療影像診斷做到 SOTA 的水平。

Q:很多公司都提到,多模態數據很難「出院」,百川怎么看待醫院內數據的處理?

王小川:主要是兩個要點:技術和場景。

我們認為,未來巨大的增量是在院外,不在院內。院內更多是執行場所,比如做手術、輸液。我們的目標不是在院內幫醫生解決流程問題,那個想象空間是有限的。我們的策略是「隔山打牛」,最重要的價值是幫到患者。

今天大家總是講數據不夠,投了上千億進去,去年發布了 500 款醫療垂直大模型,但大家有體感嗎?美國,已經有兩件事做成了:OpenEvidence,很多醫生都在用它輔助診療,安全性和準確度提升了很多;二是 ChatGPT 馬上就要接入健康數據,2.3 億人很快就可以直接受益。

AI 直接產生作用是在院外,以前信息化是以醫院為中心、醫生為中心的這種模式,它都離 AI 的本質和 Toc 是遠的。我們始終強調,這次的技術紅利是發生在語言智能上,不是在圖像識別上。能力識別不代表真正的智力,它只是一個「做題家」手里的活兒。

03今年會發布兩款 ToC 產品,

正在做睡眠類硬件產品

Q:像「阿福」這類擁有海量用戶的 App,他們獲得的動態反饋數據,會不會讓模型迭代速度超過你們?

王小川:用反饋來推動模型迭代,主要體現在兩點:第一,你的個人檔案完善了,服務更個性化了,這跟用戶多少沒關系;第二,用戶多了,團隊可以通過反饋來改進產品,但這更像是傳統互聯網的產品迭代,不是技術層面的模型進化。你看 Anthropic、Gemini 也沒有那么龐大的 C 端用戶,但模型依然發展得很快。這件事本質上還是技術驅動的。

注:「阿福」是由螞蟻集團推出的一款 AI 健康應用。

Q:百川接下來的產品路線想怎么走?

王小川:我們跟「阿福」的定位不太一樣,阿福更偏向泛健康,「健康」本身是一個很寬泛的概念。我們希望更聚焦,做到至少能取代家庭醫生的角色。

從第一天起就想做 ToC,幫助患者做輔助決策這件事,價值非常清晰。我倒不擔心商業模式,只要我們能跨過醫療的專業門檻,真正為用戶創造價值,無論是直接向用戶收費,還是通過服務包整合后續的醫療、藥械資源來收費,都會是很容易的事情。

我們今年上半年就會正式入場,之前停頓了一段時間,目標想得很清楚,我們不是只賺醫院或醫生的錢。我們會有兩款產品發布,免費使用,但包含付費模塊。

首先是百小應,醫生和患者都能用。雖然是同一個產品,但醫生和患者的身份不同,給出的結果也不同。醫生版更像 OpenEvidence,非常強調循證,每一句話的出處、引用的文獻都會清晰標明。醫生可以接受各種專業的答案,我們給到患者的,是幾個清晰的選項和要點,必須讓他們看得懂,把專業語言翻譯成他們能理解的內容,同時保留循證的能力。

患者模式會強調補充信息,具備進入啟發式的、端到端的問診能力。醫生不會這樣,因為醫生有自己提問的方法。在這種情況下,我們和 OpenEvidence 的區別在于,OpenEvidence 只是服務于醫生,我們的產品是信息可復現、專業內容可懂、患者可決策、建議可行動、最終服務到患者本人,這樣的產品定位,在全球是獨一無二的。

Q:如果做 ToC 產品,早期怎么培養用戶心智?

王小川:需要三件事:第一,需要一定的市場宣傳投入,我們會適量增加;第二,要得到醫生的認可。我們的路線和阿福不同,他們可能對老醫生觸動不大,但我們希望醫生和患者是一體兩面,共享一款產品。所以不僅要讓患者鼓掌,更要讓專家點頭;第三,產品本身做得足夠好,能自然形成一定的口碑效應。

Q:百川的護城河是什么?

王小川:護城河分三部分。第一,模型本身。在前沿領域,模型領先一代就是優勢,尤其在醫療領域,大家一定會選擇更好的;第二,對問題切入點的選擇。我們更愿意切入一些嚴肅、高價值、非共識的場景。大廠通常要從共識的地方切入;第三,產品形態。大家后續會看到,我們的產品形態也是不一樣的。

Q:你提到做嚴肅醫療,這會涉及權責問題,診療責任由誰來負責?

王小川:今天我們不會去碰法律紅線。法律要求診斷結論和治療方案必須由執業醫師給出。但我們可以在這個框架內,把輔助診斷做得更好。

現在的痛點是,患者在拿到結論之前,需要大量的解釋和信息。我們主打的概念是「讓患者明明白白看醫生」,核心是縮短醫患之間的 gap。比如醫生給了兩個治療方案,一個保守一個激進,選哪個?我們可以幫助患者分析利弊,輔助他們做決策。診療和決策是兩回事,我們認為未來決策權會更多地讓渡給患者。我們不是替患者做決策,是給建議,幫助患者自己做決策。

Q:M3 的能力已經可以支撐這個目標了嗎?

王小川:模型能力已經足夠了,現在需要的是建立產品形象和用戶信任。

Q:國內會出現類似 OpenEvidence這樣的產品嗎?

王小川:可能性不大。在美國,OpenEvidence 確實能對醫療效果提升很多。但在中國有幾個障礙:第一,中國醫生沒有使用這類輔助系統的習慣;第二,他們非常忙,沒有額外的時間去使用一個新工具;第三,用不用這類工具,對他們的職稱評定和論文發表可能幫助不大。

Q:百川最初為什么選擇兒科作為切入點?

王小川:一開始選兒科,也是想從院外、從相對輕癥的場景切入。兒童很多時候是小問題,但家長焦慮感很強。所以它不是從疾病的嚴重程度出發,而是從用戶的焦慮感出發。現在技術進步了,我們才敢拓展到腫瘤這種最核心的領域。

Q:兒科還會繼續重投入嗎?

王小川:會的。「一老一小」始終是我們的方向,我們主要就是慢病、兒科和腫瘤這三個方向。

Q:你們會做硬件嗎?

王小川:會,目前正在做一款和睡眠相關的硬件產品。

轉載原創文章請添加微信:founderparker

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
印度專家:伊朗能打掉薩德雷達,中國的雷達也能被打掉

印度專家:伊朗能打掉薩德雷達,中國的雷達也能被打掉

超喜歡我
2026-03-28 23:56:27
萬科前董事長秘書被帶走調查

萬科前董事長秘書被帶走調查

地產微資訊
2026-03-27 18:10:58
美官員稱中芯國際已向伊朗軍方提供芯片制造工具 外交部回應

美官員稱中芯國際已向伊朗軍方提供芯片制造工具 外交部回應

財聯社
2026-03-27 15:34:12
光速掉粉!瑞幸被羅永浩坑慘了?!

光速掉粉!瑞幸被羅永浩坑慘了?!

廣告案例精選
2026-03-26 08:59:17
扎哈羅娃警告日本:任何試圖向烏提供致命武器之舉,都將招致強硬回應

扎哈羅娃警告日本:任何試圖向烏提供致命武器之舉,都將招致強硬回應

環球網資訊
2026-03-26 08:55:12
張雪峰靈堂花圈擺滿松柏:遺孀付幸保持沉默,前妻李麗婧也未露面

張雪峰靈堂花圈擺滿松柏:遺孀付幸保持沉默,前妻李麗婧也未露面

眼光很亮
2026-03-27 14:45:20
iPhone 50周年紀念版上架,真好看!

iPhone 50周年紀念版上架,真好看!

劉奔跑
2026-03-27 23:58:41
我做風水先生40年,如今金盆洗手,有些實話不說,到死都閉不上眼

我做風水先生40年,如今金盆洗手,有些實話不說,到死都閉不上眼

千秋文化
2026-03-20 20:36:55
江蘇女排大勝上海,山東奪銅夫妻帶領黑馬崛起

江蘇女排大勝上海,山東奪銅夫妻帶領黑馬崛起

縱橫之策
2026-03-28 23:37:36
原來這就是初老癥狀!網友:句句不說是我,句句都是我

原來這就是初老癥狀!網友:句句不說是我,句句都是我

夜深愛雜談
2026-03-28 18:13:11
CarPlay 史詩級加強,痛點終于解決!

CarPlay 史詩級加強,痛點終于解決!

黑貓科技迷
2026-03-26 23:53:32
今日最佳:殺敵一千,自刎歸天。

今日最佳:殺敵一千,自刎歸天。

差評XPIN
2026-03-28 00:05:39
張雪峰追悼會畫面流出,遺像曝光:原配和現任均現身,女兒哭暈倒

張雪峰追悼會畫面流出,遺像曝光:原配和現任均現身,女兒哭暈倒

博士觀察
2026-03-28 10:33:39
看了觀眾對何潤東的評價,我才明白當年陳道明那番話的含金量

看了觀眾對何潤東的評價,我才明白當年陳道明那番話的含金量

糊咖娛樂
2026-03-26 17:22:19
正式退出,22歲陳熠遺憾,官宣決定,原因找到,王曼昱祝福

正式退出,22歲陳熠遺憾,官宣決定,原因找到,王曼昱祝福

運動探索
2026-03-28 18:03:56
教育部宣布中考重大變革,取消 5:5 分流,升學規則將全面調整?

教育部宣布中考重大變革,取消 5:5 分流,升學規則將全面調整?

今朝牛馬
2026-03-26 20:22:18
最壞情況發生,美軍艦載機在沿海被擊中,白宮意識到大國出手了!

最壞情況發生,美軍艦載機在沿海被擊中,白宮意識到大國出手了!

蕭祃記錄風土人情
2026-03-29 00:43:36
臺灣統一的風向:賴清德由獨轉統,或能成就統一功績

臺灣統一的風向:賴清德由獨轉統,或能成就統一功績

混沌錄
2026-03-15 16:17:03
她曾擔任中紀委副書記,離休16年后仍驕傲的說:我辦的案都是鐵案

她曾擔任中紀委副書記,離休16年后仍驕傲的說:我辦的案都是鐵案

明月清風閣
2026-03-28 13:25:06
沙特削減對華供應,油少賣800萬桶,中方通知全球,指出當務之急

沙特削減對華供應,油少賣800萬桶,中方通知全球,指出當務之急

丁丁鯉史紀
2026-03-28 16:51:54
2026-03-29 02:04:49
FounderPark incentive-icons
FounderPark
關注AI創業,專注和創業者聊真問題
1184文章數 160關注度
往期回顧 全部

健康要聞

干細胞抗衰4大誤區,90%的人都中招

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經要聞

臥底"科技與狠活"培訓:化工調味劑泛濫

科技要聞

華為盤古大模型負責人王云鶴確認離職

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

藝術
手機
親子
本地
公開課

藝術要聞

不可思議的芭蕾之美,竟讓人屏息凝視!

手機要聞

華為手機全面回歸!暢享90 Pro Max下周首銷:1699元起

親子要聞

小孩子能口無遮攔到什么程度!網友:恨不得當場找個地縫鉆進去

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版