摘要:這期跟大家聊一篇?jiǎng)偘l(fā)在Discover Oncology上的新研究,關(guān)于AI驅(qū)動(dòng)的腫瘤生物標(biāo)志物發(fā)現(xiàn)。做腫瘤研究的都懂,找一個(gè)靠譜的生物標(biāo)志物,有多難。傳統(tǒng)方法要么是假說(shuō)驅(qū)動(dòng),要么是大海撈針,耗時(shí)耗力還不一定能成。這篇文章把AI在標(biāo)志物發(fā)現(xiàn)里的玩法、真實(shí)臨床案例、繞不開(kāi)的坑和倫理問(wèn)題,全捋明白了。我結(jié)合自己做生信的感受,把這些內(nèi)容拆給大家看,都是能直接用到自己研究里的東西。
![]()
為什么我們做腫瘤標(biāo)志物,繞不開(kāi)AI了
全球每年因癌癥死亡的人數(shù)約1000萬(wàn),中低收入國(guó)家占了70%。人口老齡化、生活方式的改變,讓癌癥發(fā)病率還在往上走。早篩和精準(zhǔn)治療的核心,就是腫瘤生物標(biāo)志物。
傳統(tǒng)的標(biāo)志物發(fā)現(xiàn),全是假說(shuō)驅(qū)動(dòng)的。面對(duì)基因組、轉(zhuǎn)錄組、蛋白組這些海量的多組學(xué)數(shù)據(jù),傳統(tǒng)統(tǒng)計(jì)方法,根本抓不住里面隱藏的、非直觀的規(guī)律。很多時(shí)候篩出來(lái)的標(biāo)志物,換個(gè)隊(duì)列就不成立了。
AI,尤其是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,剛好補(bǔ)上了這個(gè)短板。它能從高維生物數(shù)據(jù)里,挖出人眼和傳統(tǒng)方法完全看不到的關(guān)聯(lián)模式。甚至能把影像、病理、臨床記錄這些多模態(tài)數(shù)據(jù)整合起來(lái),找更穩(wěn)定、更靠譜的標(biāo)志物。
還有像PandaOmics這種AI驅(qū)動(dòng)的平臺(tái),直接把多組學(xué)數(shù)據(jù)分析做成了標(biāo)準(zhǔn)化流程。我們實(shí)驗(yàn)室試過(guò),原本要幾個(gè)月的靶點(diǎn)篩選工作,用平臺(tái)幾周就能跑完,還能找到我們完全沒(méi)預(yù)判到的關(guān)聯(lián)。
AI找的標(biāo)志物,到底在臨床上好用嗎?
AI發(fā)現(xiàn)的生物標(biāo)志物,最直觀的提升,是診斷的靈敏度和特異性。比如乳腺鉬靶、PSA篩查,一直被假陽(yáng)性、假陰性困擾,要么漏診,要么給患者帶來(lái)不必要的穿刺和過(guò)度治療。
AI模型能精準(zhǔn)鎖定不同癌癥亞型的標(biāo)志物特征。訓(xùn)練好的深度學(xué)習(xí)算法,看病理切片找癌變組織,準(zhǔn)確率經(jīng)常超過(guò)資深病理醫(yī)生。尤其是肺結(jié)節(jié)、早期乳腺癌這種小病灶,人眼看花了都不一定能發(fā)現(xiàn),AI幾秒鐘就能定位。
在預(yù)后和療效預(yù)測(cè)上,AI的作用更明顯。尤其是免疫治療,患者的響應(yīng)差異太大了,臨床上一直缺靠譜的預(yù)判指標(biāo)。AI能找到特定的標(biāo)志物特征,精準(zhǔn)分出哪些患者能從免疫檢查點(diǎn)抑制劑里獲益,不用再讓患者賭運(yùn)氣。
它還能通過(guò)循環(huán)腫瘤DNA、RNA的細(xì)微變化,提前捕捉到疾病復(fù)發(fā)或者治療耐藥的信號(hào)。比臨床癥狀出現(xiàn),早了好幾個(gè)月,給醫(yī)生留足了調(diào)整治療方案的時(shí)間。
說(shuō)起來(lái)最有落地性的,是影像和分子標(biāo)志物的整合。AI能把CT、MRI、病理切片里的影像特征,和基因、蛋白的分子改變對(duì)應(yīng)起來(lái)。不用反復(fù)穿刺,靠一張片子就能預(yù)判腫瘤的異質(zhì)性、惡性程度,甚至靶向藥的響應(yīng),這在臨床上太實(shí)用了。
給大家看幾個(gè)已經(jīng)落地的真實(shí)案例:
PathAI的AI模型分析乳腺癌病理切片,準(zhǔn)確率超過(guò)病理醫(yī)生,尤其是小的、不明顯的惡性病灶,還能大幅減少良惡性組織的誤判。
Tempus的AI平臺(tái)整合基因組和臨床數(shù)據(jù),靠找到的標(biāo)志物指導(dǎo)治療,臨床試驗(yàn)里,患者對(duì)靶向和免疫治療的響應(yīng)率有明顯提升。
Guardant Health的AI液體活檢,靠血液里的ctDNA找結(jié)直腸癌的驅(qū)動(dòng)突變,微創(chuàng)不說(shuō),還能實(shí)時(shí)監(jiān)測(cè)患者的治療響應(yīng)。
坦白講,AI找標(biāo)志物不是萬(wàn)能的,最大的坎就是數(shù)據(jù)。AI模型的上限,完全由訓(xùn)練數(shù)據(jù)的質(zhì)量和規(guī)模決定。高質(zhì)量、多中心、多樣化的數(shù)據(jù)集,在腫瘤研究里有多難拿,做過(guò)的人都懂。
很多罕見(jiàn)癌種,連像樣的隊(duì)列數(shù)據(jù)都湊不齊,模型根本沒(méi)法訓(xùn)練。就算有數(shù)據(jù),要是訓(xùn)練集里的人群太單一,做出來(lái)的標(biāo)志物換個(gè)種族、換個(gè)地區(qū)就失效,反而會(huì)加劇醫(yī)療差距。
還有繞不開(kāi)的「黑箱問(wèn)題」。很多深度學(xué)習(xí)模型,你只知道它找到了一個(gè)標(biāo)志物,卻不知道它為什么選這個(gè),決策邏輯是什么。腫瘤科醫(yī)生要做生死決策,根本不敢信一個(gè)說(shuō)不明白原理的結(jié)果。這也是很多AI標(biāo)志物,論文發(fā)了一堆,卻沒(méi)法真正走到臨床的核心原因。
更別說(shuō)倫理和監(jiān)管的問(wèn)題了。患者的醫(yī)療數(shù)據(jù)隱私怎么保障?AI找的標(biāo)志物,要走什么樣的驗(yàn)證和審批流程,才能合規(guī)進(jìn)臨床?這些問(wèn)題,現(xiàn)在都還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)答案。
表1 AI方法與傳統(tǒng)方法的簡(jiǎn)要對(duì)比
![]()
我眼里,AI找腫瘤標(biāo)志物的未來(lái)到底在哪
其實(shí)我更愿意相信,未來(lái)的方向不是AI替代傳統(tǒng)方法,而是兩者互補(bǔ)。比如**可解釋AI(XAI)**的發(fā)展,能把模型的決策邏輯拆解開(kāi),明明白白告訴醫(yī)生,這個(gè)標(biāo)志物為什么有效,權(quán)重是多少,直接解決黑箱問(wèn)題。
還有隱私計(jì)算、聯(lián)邦學(xué)習(xí)這些技術(shù)的成熟,能讓全球的研究機(jī)構(gòu)共享數(shù)據(jù)訓(xùn)練模型,同時(shí)不泄露患者的原始隱私數(shù)據(jù)。這對(duì)解決數(shù)據(jù)不足、人群?jiǎn)我坏膯?wèn)題,是根本性的幫助。
AI和單細(xì)胞測(cè)序、CRISPR這些技術(shù)的結(jié)合,也有很大的想象空間。能把標(biāo)志物的發(fā)現(xiàn),從組織層面推到單細(xì)胞層面,找到更精準(zhǔn)、更早期的腫瘤信號(hào)。甚至能從找標(biāo)志物,直接推進(jìn)到找治療靶點(diǎn),形成一個(gè)完整的研究閉環(huán)。
說(shuō)起來(lái),AI從來(lái)不是給我們一個(gè)偷懶的捷徑。它只是給了我們一個(gè)更強(qiáng)大的工具,能從海量數(shù)據(jù)里挖到我們看不到的東西。但最終這個(gè)標(biāo)志物靠不靠譜,還是要靠細(xì)胞實(shí)驗(yàn)、動(dòng)物實(shí)驗(yàn)、臨床試驗(yàn)一步步去驗(yàn)證,一步都省不了。
識(shí)別微信二維碼,添加生物制品圈小編,符合條件者即可加入
生物制品微信群!
請(qǐng)注明:姓名+研究方向!
本公眾號(hào)所有轉(zhuǎn)載文章系出于傳遞更多信息之目的,且明確注明來(lái)源和作者,不希望被轉(zhuǎn)載的媒體或個(gè)人可與我們聯(lián)系(cbplib@163.com),我們將立即進(jìn)行刪除處理。所有文章僅代表作者觀不本站。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.