AI虛擬細胞,又迎來重磅里程碑!
近日,融資10億美元的AI+生物醫藥公司Xaira Therapeutics宣布,推出其首個虛擬細胞模型X-Cell。
該模型基于擴散模型打造,高達49億參數,是迄今為止最大的虛擬細胞模型,各項性能全球領先。
團隊表示, 頂級數據與新穎架構結合后,結果是讓模型具有極強的零樣本推理能力:
未見的細胞類型、未見的暴露,以及來自不同實驗室使用不同技術的結果。
該研究的預印本論文已發布,文中分享了該工作的大量細節,以及驗證過程。
![]()
公司表示, Xaira計劃將部分模型及其底層數據提供給其他科學家。
可以說,AI虛擬細胞領域,又向前邁進了一步。
![]()
最強細胞模型誕生
為什么需要虛擬細胞?
很多時候,人們想知道吃某種藥對身體有沒有用,科學家也想知道 “改變某個基因或藥物,細胞會出現什么情況”。
但細胞太復雜了。
同樣是敲掉一個基因,在皮膚細胞里和在免疫細胞里的效果可能完全不一樣;而且能干預的基因、細胞類型太多,不可能一個個做實驗。
虛擬細胞模型就是為了這一愿景而來,僅僅通過在電腦上調整幾個數據,我們就能知道細胞對不同干預后的反應。
為了打造該模型,團隊打造了有史以來最大的全基因組擾動數據集X-Atlas/Pisces。
該數據集涵蓋 2560 萬個擾動單細胞轉錄組,涵蓋 15.2 萬 + 獨特的擾動 - 環境組合,分布在七個生物多樣性的細胞環境中,規模是 Xaira 之前數據集X-Atlas/Orion 的三倍多。
于是基于X-Atlas/Pisces, Xaira訓練了虛擬細胞X-Cell。
這是一款擴散模型,通過迭代擴散過程模擬從對照狀態到擾動狀態的轉錄組轉變,還融合多模態生物先驗知識。
![]()
圖: X-Cell模型框架
其數據規模相較于此前的細胞模型有了大幅度提升。
![]()
圖:虛擬細胞參數規模
數據顯示,X-Cell具有性能優勢。
PearsonΔ核心指標,它專門用來衡量模型預測"擾動"效果的能力,X-Cell 較 STATE、scGPT 等現有最好模型提升最高 5 倍。
X-Cell還有較強的泛化能力。
例如,零樣本的條件下,它成功預測激活態 Jurkat 細胞中 T 細胞失活擾動(如 CD3 復合物),準確識別 APPL2、LRBA 等潛在調控因子。
![]()
圖: X-Cell區分了JurkatT細胞中的生理狀態轉變
X-Cell還具有 跨細胞類型遷移能力。對未見過的 iPSC 衍生黑素細胞祖細胞、多供體原代人 CD4+ T 細胞,零樣本預測性能優于所有基線。
不僅如此,模型還具有預測從基因擾動預測信號通路和化學藥物擾動效果,Tahoe-100M 藥物數據集上 Pearson Δ 達 0.31(優于 STATE 的 0.22)。
預印本還表示,隨著數據和模型容量的增加,性能可預測地提升,這對之后模型性能提升有重要意義。
![]()
能用來干什么?
很多人疑問,虛擬細胞能夠用來干什么?
基礎研究:它能幫助搞懂細胞運作規律,為基礎生物學研究提供線索。
新藥研發:可以先讓模型預測 “關掉哪個基因能抑制癌細胞”,再針對性做實驗,大大減少時間和成本。
精準治療:比如同樣一種藥,模型能預測它在不同患者的細胞里效果如何,幫醫生判斷 這個患者適合用這個藥。
事實上,很多大佬已經看到虛擬細胞的巨大潛力。
被譽為“女版巴菲特”木頭姐,其創辦的ARK Invest發布《Big Ideas》報告中,將虛擬細胞列為未來AI+生命科學最具有顛覆性的領域之一。
諾貝爾化學獎的Demis Hassabis曾表示,他的終極夢想之一是構建虛擬細胞,這將徹底改變生物學研究,可能需要長達10年的時間去實現。
扎克伯格旗下的陳-扎克伯格倡議(CZI)也正在將數億美元投向虛擬細胞。該機構擁有全球最大的單細胞生物數據存儲庫之一。
為了這一宏大目標,全球多個組織和公司正積極探索AI虛擬細胞的構建與優化。
模型層面,近年來涌現了多個單細胞大模型,以及整合生命分子的生物學基礎大模型,都極大地促進了技術突破與發展。
![]()
圖:單細胞以及生物學基礎大模型
![]()
Xaira:AI制藥夢之隊
此次打造X-Cell的團隊,也是AI制藥公司Xaira Therapeutics成立2年來的重磅成果。
Xaira究竟是何方神圣?這家公司成立之初就獲得10億美元支持,轟動業界。
公司成立于2024年4月,其創始人、高管、投資人、顧問都是生命科學領域的頂級陣容,希望打造下一個顛覆生命科學行業的公司。
Xaira的使命是運用人工智能技術,創造下一個基因泰克。
公司科學聯合創始人為諾貝爾化學獎得主、華盛頓大學蛋白質設計研究所所長David Baker博士,該實驗室設計了多個全球領先的基于蛋白質的藥物開發模型,多位博士生全職加入了Xaira Therapeutics。
公司的首席執行官Marc Tessier-Lavigne是前斯坦福校長,他還曾任基因泰克首席科學官。另一位聯合創始人Hetu Kamisetty 博士,他曾供職于Meta和蛋白質設計研究所。
![]()
左:Marc Tessier-Lavigne;右:David Baker
去年4月, Xaira 宣布任命多倫多大學頂尖 AI 學者Bo Wang為生物醫學 AI 負責人,也是上述項目的主要負責人。
這家最強初創則獲得包括ARCH、Foresite Labs、F-Prime、NEA、紅杉資本、Lux Capital、Lightspeed Venture Partners、Menlo 、 Ventures、Two Sigma Ventures、帕克癌癥免疫治療研究所 (PICI)、拜耳、Rsquared 和 SV Angel 等一眾海外頂級投資機構的支持......
其中,著名的生物醫藥風險投資基金ARCH Venture Partners,押上了其成立以來的最大賭注,向該公司投了2億美元。
這樣豪華的團隊,正在引領AI+生物學的下一個圣杯。
—The End—
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.