337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

【患者安全】大語言模型-誤診卓越診斷?

0
分享至


Large Language Models

—Misdiagnosing Diagnostic Excellence?

編譯自:Sumant R. Ranji, MD,JAMA Netw Open. 2024;7(10) 圖片來自網絡。


在最近的一次美國國家醫學科學院會議上,Goh團隊的研究成果引起了聽眾的震驚與擔憂。這項隨機臨床試驗評估了全科醫生在診斷6個模擬病例時的表現。醫生被分為兩組:一組僅使用常規在線資源,另一組除了這些資源外,還額外使用大語言模型(LLM) (ChatGPT Plus [GPT-4]; OpenAI)。此外,研究還單獨測試了LLM的診斷能力。為了客觀評價診斷質量,研究團隊設計了一套評分標準,由專家對臨床推理過程進行盲評,包括醫生的最終診斷、鑒別診斷及支持/不支持診斷的因素。

研究的主要發現是:使用LLM輔助診斷的醫生得分與僅使用傳統資源的醫生相比,并沒有顯著提高。然而,LLM單獨完成診斷時的表現卻顯著優于任何一組醫生。這一結果引發了不少人對自身職業未來的擔憂,不少與會者甚至擔憂:“我們會失業嗎?”

Goh團隊的試驗在探索生成式人工智能(AI)應用于診斷方面邁出了重要一步。該研究通過分析未經專業LLM培訓的醫生如何在實際場景中使用GPT-4,為現階段和可預見未來的臨床實踐提供了真實的評估。值得注意的是,這項研究沒有單純關注最終診斷的準確性,而是強調診斷過程的質量,這種更全面的評價方法值得未來研究借鑒。研究同時表明,僅靠生成式AI并不能提高診斷質量,醫生需要接受專門的培訓,才能充分發揮這類工具的潛力。


作者提醒道:“研究結果并不意味著LLM可以獨立承擔診斷任務,醫生的監督仍然必不可少。”然而,LLM單獨診斷表現優于醫生的結果,勢必成為引發關注的核心話題。對于以診斷為核心職業身份的醫生來說,使用LLM進行診斷的前景既讓人興奮,也讓人感到不安。隨著更多關于LLM診斷能力的研究發表,醫生應當如何看待這些新技術的挑戰和機遇呢?

需要謹慎對待的是,LLM在模擬病例中的優異表現是否可以推廣到實際的臨床實踐中。模擬病例的診斷條件通常是理想化的——病史、體格檢查結果、實驗室及影像學數據都以整齊有序的方式呈現,便于構建鑒別診斷。而實際臨床診斷是一個復雜的迭代過程,往往需要在繁雜的環境中整合來自患者、家屬及多學科團隊的多種信息,這種非線性的過程需要在不斷獲取新信息的基礎上不斷修正診斷,同時還需要將治療反應納入診斷推理,診斷和治療之間的區別往往變得模糊。

那么,LLM在接近真實臨床環境下的表現如何?最近的一項研究評估了LLM在處理4種常見腹部疾病的診斷和管理方案制定中的表現。研究中,LLM接收的是逐步呈現的患者數據,每個步驟后需總結信息并提出診斷或額外檢查建議。完成診斷后,LLM還需制定治療計劃。然而,在這種現實化的場景中,LLM的表現很差:除最簡單的病例外,其診斷表現顯著遜色于醫生,同時,LLM 也未能始終如一地要求進行適當的診斷檢查,即使在得出正確診斷后也經常提出錯誤的治療建議。

盡管LLM的性能在不斷提升,但當前的局限性仍需關注。即便未來LLM能夠基于不斷變化的信息完成復雜的迭代診斷,它是否能夠有效減少診斷錯誤帶來的傷害仍然值得懷疑。

醫學診斷中的錯誤通常源于系統性失誤(潛在錯誤),這些問題讓個體醫生的錯誤(顯性錯誤)最終影響患者。生成式AI的優勢在于幫助醫生減少認知錯誤,即數據收集和整合方面的失敗。但認知錯誤并不是孤立于醫療系統之外的,它往往是醫生在充滿潛在錯誤的環境中工作時的表現,例如人員不足、工作壓力大、不完善的電子病歷系統以及醫護團隊溝通不暢。這些系統性問題會增加醫生的認知負擔,阻礙其做出準確決策。專注于 AI 的生成潛力以防止認知錯誤,可能會最大限度地減少系統故障在診斷錯誤中的作用,并分散人們對解決這些問題的注意力。

實現卓越診斷需要建立一個支持醫生準確決策并全程服務患者的醫療體系。生成式AI可以成為其中的重要組成部分,但要成功地將LLM融入臨床診斷,還需要技術的進一步完善、醫生的系統性培訓,以及AI與臨床環境的深度融合。即使這些條件都具備,也不應期待AI能夠獨立解決所有診斷問題。


對于那些認為Goh團隊的研究結果威脅到醫生職業安全的人來說,本文試驗中使用AI平臺的回答或許能帶來一些安慰。在試驗中,研究團隊使用了加州大學舊金山分校的安全AI平臺(Versa),并向其提出以下問題:“既然最近的研究顯示LLM在模擬病例中的診斷準確性已經達到甚至超過了醫生,這是否意味著未來LLM會取代醫生?”

LLM的回答如下:

“大語言模型(LLM)在模擬病例診斷中顯示出前景,但完全取代醫生并不現實。LLM可以通過提供決策支持、處理大量數據和提出診斷建議來增強醫療實踐。然而,醫學實踐還包括復雜的人際互動、倫理判斷和體格檢查,這些是AI無法完全復制的。LLM是提升醫療質量的工具,而非醫生的替代品。LLM的整合應以協作為目標,而非取代。”

這段回應恰如其分地總結了生成式AI在醫療領域的定位。我們不應將其視為威脅,而應將其視為一種可以與醫生合作的強大工具,共同推動醫療診斷的進步。


【原文】 https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825399

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
高市早苗的一張照片引爆日本全網:女首相的外交已淪為全民笑柄!

高市早苗的一張照片引爆日本全網:女首相的外交已淪為全民笑柄!

行者聊官
2026-03-21 14:38:25
隨著穆帥率隊3-0,葡萄牙國民0-1,阿羅卡1-0,葡超最新積分榜出爐

隨著穆帥率隊3-0,葡萄牙國民0-1,阿羅卡1-0,葡超最新積分榜出爐

側身凌空斬
2026-03-22 04:05:47
“梅姨”模擬畫像與真人相似度不高?作者呼吁理性看待:嫌疑人精神壓力等會致長相與畫作有差別

“梅姨”模擬畫像與真人相似度不高?作者呼吁理性看待:嫌疑人精神壓力等會致長相與畫作有差別

紅星新聞
2026-03-21 18:42:54
美日達成一致,不許改變臺海現狀,還要踢開中國,中方反擊不過夜

美日達成一致,不許改變臺海現狀,還要踢開中國,中方反擊不過夜

策略述
2026-03-21 18:25:32
火燒靖國神社的劉強,回國后被單位開除,妻子離婚,后來怎樣了?

火燒靖國神社的劉強,回國后被單位開除,妻子離婚,后來怎樣了?

大魚簡科
2026-03-21 09:46:38
哈登20+6+10末節13分!騎士15分逆轉雙殺鵜鶘 米切爾27分

哈登20+6+10末節13分!騎士15分逆轉雙殺鵜鶘 米切爾27分

醉臥浮生
2026-03-22 09:27:27
一場0-1!讓澳大利亞心碎,中國女足打破日本隊對亞洲杯冠軍壟斷

一場0-1!讓澳大利亞心碎,中國女足打破日本隊對亞洲杯冠軍壟斷

何老師呀
2026-03-21 21:48:28
以軍總參謀長批準在“所有戰線”的空襲行動

以軍總參謀長批準在“所有戰線”的空襲行動

界面新聞
2026-03-22 07:31:17
沈夢辰杜海濤正式解綁:四年婚姻,各自安好!

沈夢辰杜海濤正式解綁:四年婚姻,各自安好!

背包旅行
2026-03-21 15:06:56
一票否決!歐盟內部集體暴怒,德國總理當場發話:這事沒完

一票否決!歐盟內部集體暴怒,德國總理當場發話:這事沒完

策略述
2026-03-21 14:58:28
疑因操作不當引發實驗物品閃爆,重慶大學:對不幸去世的學生深切哀悼

疑因操作不當引發實驗物品閃爆,重慶大學:對不幸去世的學生深切哀悼

都市快報橙柿互動
2026-03-21 22:50:39
28連敗!至今0勝,創CBA新紀錄,球迷:滾出CBA

28連敗!至今0勝,創CBA新紀錄,球迷:滾出CBA

體育哲人
2026-03-22 00:49:03
鄭州一公司使用AI后立馬大規模裁員,只留下前臺和銷售

鄭州一公司使用AI后立馬大規模裁員,只留下前臺和銷售

映射生活的身影
2026-03-21 20:36:56
38萬老車主看完新SU7配置單,沉默了……

38萬老車主看完新SU7配置單,沉默了……

道哥說車
2026-03-20 10:17:01
日本臺灣油價接連下跌,大陸油價卻瘋漲至9元,差異原因一目了然

日本臺灣油價接連下跌,大陸油價卻瘋漲至9元,差異原因一目了然

潮鹿逐夢
2026-03-21 20:08:52
楊瀚森9投6中拿到14分11板3助3帽,正負值+24全場最高

楊瀚森9投6中拿到14分11板3助3帽,正負值+24全場最高

懂球帝
2026-03-22 08:44:06
課本上猛夸的4個歷史人物,長大后卻發現:他們壞到骨子里

課本上猛夸的4個歷史人物,長大后卻發現:他們壞到骨子里

長風文史
2026-03-19 14:01:22
路虎別停奔馳后續:曝更多內幕,路虎哥“底褲”被扒,果然不一般

路虎別停奔馳后續:曝更多內幕,路虎哥“底褲”被扒,果然不一般

社會日日鮮
2026-03-21 21:43:51
中東大亂,給中國這兩個地方,帶來了歷史性的發展機遇

中東大亂,給中國這兩個地方,帶來了歷史性的發展機遇

正經說個事兒
2026-03-21 21:00:30
雷軍認錯:“兩車以60km/h對撞相當于一輛車以120km/h撞墻”是口誤!網友:正建議于北辰代言YU7呢

雷軍認錯:“兩車以60km/h對撞相當于一輛車以120km/h撞墻”是口誤!網友:正建議于北辰代言YU7呢

大白聊IT
2026-03-21 21:13:57
2026-03-22 09:40:49
醫護健康科普 incentive-icons
醫護健康科普
分享健康科普知識
2484文章數 2415關注度
往期回顧 全部

科技要聞

庫克在華這四天,一場既定的市場秀

頭條要聞

男子在壺口瀑布外拍視頻喊"門口要錢"被投訴 景區回應

頭條要聞

男子在壺口瀑布外拍視頻喊"門口要錢"被投訴 景區回應

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經要聞

睡夢中欠債1.2萬?這只“蝦”殺瘋了

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

手機
家居
親子
藝術
公開課

手機要聞

一加Ace 6至尊版已備案:天璣9500深度特調 性能火力全開

家居要聞

時空交織 空間綺夢

親子要聞

“鋅”是聰明根!春天孩子多吃高鋅菜,腦子靈、記性好、個頭猛長

藝術要聞

張春橋的字藏多少心機?看似簡單卻暗藏玄機!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版