337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2024年諾貝爾化學獎:又又又雙叒叕是AI?

0
分享至


作者:奶樹

編輯:蝌蚪

當昨天的諾貝爾物理學獎剛剛頒給了開發(fā)了人工神經網(wǎng)絡的AI之父杰弗里·辛頓和約翰·霍普菲爾德,大家還在暗想: 今年不會AI來了個大滿貫吧? 化學獎也可能給AI預測蛋白質結構啊!

于是,不出意外地,瑞典皇家科學院10月9日宣布,2024年諾貝爾化學獎一半給了開發(fā)人工智能設計蛋白質結構的大衛(wèi)·貝克(David Baker)、另一半則給了開發(fā)了人工智能預測蛋白質結構的德米斯·哈薩比斯(Demis Hassabis)和約翰·M·詹珀(John M. Jumper)。


其實在RostteFoldAlphaFold2在2021年橫空出世的時候,結構生物學家、生物化學家、計算生物學家就已經知道,這項成果,肯定值得一個諾貝爾獎

蛋白質結構:困擾生物學家的難題

說起蛋白質,相信不少人其實并不陌生,甚至了解蛋白質是細胞里行使各種功能的“元件”。不僅如此,蛋白質也是組成我們身體的基本物質之一。比如說健身可以鍛煉肌肉,但想要肌肉增強變大,就必須有足夠的蛋白質供給才行。

餐桌上的雞蛋、牛奶以及各種肉類都是富含蛋白質的食物,對于人類來說,蛋白質唾手可得;但是,想要得到蛋白質的結構卻難于上青天


富含蛋白質的飲食 | 圖源:iSlide

因為蛋白質的結構非常復雜:簡單講,氨基酸組成蛋白質,一個個氨基酸會有叫肽鍵的結構鏈接,它的連接可以形成兩種不同的角度。

那現(xiàn)在給大家出一個簡單數(shù)學題:假設有100個氨基酸組成蛋白質,那就需要99個肽鍵,99個肽鍵有兩種不同角度的結構,同時不同角度還會有三種可能的穩(wěn)定結構,那就是3的198次方種可能,你要是慢慢窮舉,從宇宙爆炸到現(xiàn)在都數(shù)不完,這就是利文索爾悖論——蛋白質結構非常非常多樣,沒辦法用窮舉來算完


氨基酸組合過程中不同的二面角會產生不同的結構,因此才有利文索爾悖論這樣的無窮種結構可能| 圖源:Wikipedia

結構這么復雜該怎么辦?生物學家最直接的想法就是觀測,用不同的方法來測量:上世紀五六十年代,用的是X光衍射——把蛋白質結晶,然后打上X光,通過反射的角度可以推測蛋白質長什么樣子,這個難點就是怎么把蛋白質純化結晶出來。

另一個現(xiàn)在很熱門的研究方法叫冷凍電鏡,就是利用冷凍切片技術,加上電子顯微鏡直接看蛋白質結構,但缺點就是非常非常貴,太燒錢了。


冷凍電鏡的基本原理 | 圖源:Wikipedia

那大家猜猜這么些方法,測量了幾十年了,我們分析出來多少個蛋白質結構?其實已經不少了,根據(jù)數(shù)據(jù)庫記載,現(xiàn)在實驗已經解析了18萬種蛋白質

但是相對的,我們剛剛說到蛋白質是氨基酸組成的,只要測序技術測得到DNA序列,就能推導出蛋白質序列。查找數(shù)據(jù)庫可以發(fā)現(xiàn),現(xiàn)在已知的有十幾億種蛋白質序列,這和18萬之間差了將近一萬倍。

所以結構生物學家就很苦惱——測序太簡單了,導致結構生物學遠遠跟不上測序的速度。


蛋白質結構解析數(shù)量變化 | 圖源:Nucleic acids research, 2019.


蛋白質序列測序的速度 | 圖源:www.ncbi.nlm.nih.gov/genbank/statistics/

計算預測也許可以解決問題?

所以很多開發(fā)算法的計算生物學家就想預測結構,通過算法預測肯定比做實驗快很多。但是剛剛也說了利文索爾悖論,預測結構非常非常難,你要是窮舉那是天文數(shù)字。

所以有很多的計算思路,比如我可以類比,實驗解出來的結構我可以類比相似的序列,推測相似的序列會不會有相似的結構,這個叫同源建模;也可以拆開來類比,比完再像縫縫補補拼積木一樣把結構拼出來,這個叫穿線法……但是這么多方法都有個問題:精度特別差。這就好像我想看1080P的高清視頻,但是怎么調都只有馬賽克高糊版,看都看不清。


做個類比的話,比如實際的蛋白結構是左圖,但是預測結果往往只能得到左圖的效果,很多信息都無法得知(僅作示意進行處理,實際并不僅僅是模糊,還會有很多完全不同的差別) | 圖源:Wikipedia

為了促進各國科學家不斷向前,從1994年開始,每兩年都會舉辦CASP,叫蛋白質結構預測關鍵測試,來評估大家的算法預測準不準,來提高算法的精度。

簡單來說就是從各種蛋白質序列里挑幾個出來,一邊讓結構生物學家做實驗解出一個“標準答案”,然后計算生物學家就用自己的算法來比,看看誰跟標準答案更接近。

但很遺憾,24年過去了,仍然進展很慢。


CASP官網(wǎng)

AI出場,勢不可擋

直到2018年,一個叫AlphaFold的方法出來,得到了80分的高分,兩年之后2020年AlphaFold二代打分到了90分,基本就和實驗做出來的標準答案一樣了。還是剛剛1080P的比喻的話,別人預測像個馬賽克,但AlphaFold2預測就已經差不多1000P,和1080P基本大差不差。

這個大家也知道了,就是Deepmind公司的德米斯·哈薩比斯約翰·M·詹珀開發(fā)的人工智能方法。


AlphaFold2方法預測的精度遠遠超過其他算法(圖a),同時預測的結果和實驗結果基本吻合(圖b-d)| 圖源:Nature, 2021.

隨后這個方法開始廣泛應用到了生物學上,一發(fā)不可收拾。

一是Deepmind開發(fā)的AlphaFold2算法,在短短幾個月時間里,就把幾十年結構生物學家解析的沒解析完的蛋白質都解了:人體98%的蛋白質都試著預測了一遍,其中三分之一能準確預測,還有一些也能大概預測一半多。同時他們聲稱后面幾個月就把數(shù)據(jù)庫擴展到一億個蛋白質。這就比實驗方法快了上萬倍了。


基于AlphaFold2預測的蛋白質結構數(shù)據(jù)庫

另一個生物學上的應用,是同樣基于人工智能算法,由大衛(wèi)·貝克開發(fā)的RoseTTAFold,它挑戰(zhàn)的是更難的領域——怎么預測蛋白質和蛋白質相互結合,也在短時間預測了幾千種蛋白質的相互結合。


RoseTTAFold的宣傳圖,最突出的就是對于蛋白質互作的結構預測

在AlphaFold2正式發(fā)布后只過了半年多,2022年7月,DeepMind公司的CEO,德米斯·哈薩比斯就在新聞發(fā)布會宣布:我們已經掌握了“整個蛋白質世界”(The entire protein universe)——AlphaFold馬不停蹄地運轉,成功完成了現(xiàn)有蛋白質數(shù)據(jù)庫中全部2.14億種蛋白質的結構預測。


德米斯·哈薩比斯 | 圖源:Jung Yeon-Je/AFP/Getty

2.14億種蛋白質中,有35%被評估為高度準確,雖然這個數(shù)字看起來不高,但是按照目前實驗檢測的水平,全部做完也就差不多這個水平——更何況,截至目前實驗檢測花了幾十年也只測出了14萬種。

僅在DeepMind公司宣布完成了“整個蛋白質世界”三個月后,2022年10月,Meta公司(原名Facebook)就拓寬了這個“蛋白質世界”的邊界(‘dark matter’ of the protein universe)——他們利用自己開發(fā)的大型語言模型算法ESMFold,預測了6.17億種來自宏基因組信息的微生物蛋白質結構。

ESMFold算法的準確度雖然略遜于AlphaFold,但它的優(yōu)勢在于能以60倍于AlphaFold的速度去預測短序列蛋白質的結構,這就使得它在預測結構相對簡單的微生物蛋白質上有了很大的優(yōu)勢。


6.17億種蛋白質結構的全覽 | 圖源:ESM Metagenomic Atlas

沒過幾天,AI又開始顛覆生物學家的認知了——創(chuàng)造蛋白質。

這其實是一個和蛋白質結構預測剛好相反的問題:蛋白質結構預測是從序列到結構,而創(chuàng)造蛋白質是要求從我們希望得到的結構,反推出合適的蛋白質序列。過去這是個計算量巨大的工作,現(xiàn)在AI也能完成了。


四種目前常用的設計蛋白質策略 | 圖片翻譯自:Nature

相比于大批量預測蛋白質結構,創(chuàng)造蛋白質的目的就更加明確——我們希望能創(chuàng)造出自然界不存在,但是對人類非常有用的蛋白質。

設計蛋白質的嘗試還在不斷進步和迭代,已經逐漸用到了實際應用當中。例如在RoseTTAFold的研究中,利用ProteinMPNN和RoseTTAFold方法設計出來的蛋白質,不僅在自然界完全不存在,并且大大提高了這些蛋白質結構的穩(wěn)定性,預計在未來會被用作疾病治療的抗原抗體,或者生物化學反應所需的生物酶。


蛋白質設計的過程,通過不斷改變序列讓蛋白質結構趨于穩(wěn)定(結構的穩(wěn)定基于AlphaFold預測,越紅代表越不穩(wěn)定,越藍代表越穩(wěn)定) | 圖源:Nature

不少人可能要問了:預測蛋白質結構,到設計蛋白質,有啥用呢?

我們最開始就提到了蛋白質在我們生活無處不在,而蛋白質要發(fā)揮功能,基礎是要有一定的結構。所以預測蛋白質結構,可以幫助我們更好地理解蛋白質的功能,進而去比如構建蛋白質分子藥物,或者研究復雜的生物化學現(xiàn)象。

一個最簡單的例子,比如現(xiàn)在我們知道新型冠狀病毒的新變異奧密克戎傳播力特別強,而這傳播關鍵的刺突蛋白結構,就可以利用人工智能來預測,進而可以推測什么藥物或者治療方法可以更有效的針對奧密克戎。


使用AlphaFold預測的奧密克戎突變體的S蛋白結構

但同時,雖然說人工智能已經完成了結構生物學家很多的工作,但是這個預測仍然是不完善的:

比如有些復雜的結構,可能結構生物學家實驗還沒有解析出來,人工智能也就還沒辦法學習到,因此也預測不出來,所以很多問題仍然需要結構生物學家的深入探究;

還有很多蛋白在發(fā)揮功能的時候是一個動態(tài)變化的過程,這種時候預測的結果就不準確,還是用1080P舉例的話,就是理論上是一個1080P的視頻,但是人工智能在這幾秒預測出來是1080P高清,那幾秒預測出來卻是馬賽克,所以也不準確。

這些都是人工智能預測蛋白質的瑕疵,但是瑕不掩瑜,人工智能在蛋白質結構預測帶給我們的驚喜實在太多了,而這項諾貝爾獎,就是計算科學在生命科學上應用的最好證明。

參考資料:

Callaway E. 'The entire protein universe': AI predicts shape of nearly every known protein[J]. Nature, 2022, 608(7921): 15-16.

Lin Z, Akin H, Rao R, et al. Evolutionary-scale prediction of atomic-level protein structure with a language model[J]. Science, 2023, 379(6637): 1123-1130.

Callaway E. Scientists are using AI to dream up revolutionary new proteins[J]. Nature, 2022.

Ferruz N, Heinzinger M, Akdel M, et al. From sequence to function through structure: deep learning for protein design[J]. Computational and Structural Biotechnology Journal, 2022.

Wicky B I M, Milles L F, Courbet A, et al. Hallucinating symmetric protein assemblies[J]. Science, 2022, 378(6615): 56-61.

Wang J, Lisanza S, Juergens D, et al. Scaffolding protein functional sites using deep learning[J]. Science, 2022, 377(6604): 387-394.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
A股突發(fā)!涉嫌嚴重違紀違法,黃東海被查!

A股突發(fā)!涉嫌嚴重違紀違法,黃東海被查!

中國基金報
2026-04-17 18:10:01
官方回應“女子稱遭強奸,嫌疑人被取保”:實施強奸證據(jù)不足

官方回應“女子稱遭強奸,嫌疑人被取保”:實施強奸證據(jù)不足

南方都市報
2026-04-17 16:49:15
巨石強森曝光祖父照片:真人版毛伊原型是他

巨石強森曝光祖父照片:真人版毛伊原型是他

影視情報室
2026-04-17 08:42:31
鄭麗文和家人的一張合影,時間是1971年,地點是眷村。

鄭麗文和家人的一張合影,時間是1971年,地點是眷村。

葉老四
2026-04-15 09:44:36
突發(fā):Claude引入強實名制驗證!必須真人手持證件自拍,否則直接封號!

突發(fā):Claude引入強實名制驗證!必須真人手持證件自拍,否則直接封號!

果殼
2026-04-17 16:11:25
重磅!國產降脂新藥獲批上市,甘油三酯降50%,好膽固醇同步升高

重磅!國產降脂新藥獲批上市,甘油三酯降50%,好膽固醇同步升高

健身狂人
2026-04-17 17:38:36
反轉了!大鵬“背刺張雪峰”,低價提供報考服務,有網(wǎng)友發(fā)聲力挺

反轉了!大鵬“背刺張雪峰”,低價提供報考服務,有網(wǎng)友發(fā)聲力挺

火山詩話
2026-04-17 06:22:23
未公開的1972年尼克松訪華全套高清照

未公開的1972年尼克松訪華全套高清照

深度知局
2026-04-15 00:16:09
越吃血管越通!建議中老年:多吃“3菜1果”,心臟舒服,安康過春

越吃血管越通!建議中老年:多吃“3菜1果”,心臟舒服,安康過春

椰青美食分享
2026-04-17 17:30:55
普京敲定訪華,特朗普緊急下命令,中國通告全球,無懼美國威脅

普京敲定訪華,特朗普緊急下命令,中國通告全球,無懼美國威脅

混沌錄
2026-04-16 16:05:17
廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點才收工,發(fā)文吐槽:這個雞你們是非吃不可嗎

廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點才收工,發(fā)文吐槽:這個雞你們是非吃不可嗎

大象新聞
2026-04-15 12:57:04
看了小米和蔚來的定價,才明白小鵬GX錯失了多大的一盤棋

看了小米和蔚來的定價,才明白小鵬GX錯失了多大的一盤棋

科技Nice
2026-04-16 14:28:04
炸穿臺灣政壇!蔣友松強行遷走兩蔣懸棺,半世紀漂泊終要歸鄉(xiāng)

炸穿臺灣政壇!蔣友松強行遷走兩蔣懸棺,半世紀漂泊終要歸鄉(xiāng)

陳漎侃故事
2026-04-14 17:28:18
信仰不是法外之地,全國開始雷霆出擊整頓寺廟

信仰不是法外之地,全國開始雷霆出擊整頓寺廟

世界圈
2026-04-17 08:50:05
廣東嚴查電動車不是一陣風!背后藏著全省大布局,廣深先嚴有原因

廣東嚴查電動車不是一陣風!背后藏著全省大布局,廣深先嚴有原因

音樂時光的娛樂
2026-04-17 17:48:45
真干了!以色列被錘慘了!

真干了!以色列被錘慘了!

財經要參
2026-04-16 06:00:03
為什么說印度的海岸線,遠看是老天爺賞飯,近看是逗你玩兒?

為什么說印度的海岸線,遠看是老天爺賞飯,近看是逗你玩兒?

半解智士
2026-04-16 17:10:39
特朗普突然稱對伊戰(zhàn)爭已經“結束”!霍爾木茲海峽恢復部分通航,上萬美軍正在執(zhí)行封鎖港口任務

特朗普突然稱對伊戰(zhàn)爭已經“結束”!霍爾木茲海峽恢復部分通航,上萬美軍正在執(zhí)行封鎖港口任務

封面新聞
2026-04-15 09:29:27
鐘麗緹代孕喜得男孩,張倫碩堅決支持,十年備孕終成功

鐘麗緹代孕喜得男孩,張倫碩堅決支持,十年備孕終成功

喜你成疾藥石無醫(yī)
2026-04-15 10:59:34
突發(fā)的數(shù)據(jù)跳升,通脹的玩笑這次開大了

突發(fā)的數(shù)據(jù)跳升,通脹的玩笑這次開大了

重遠投資觀
2026-04-17 13:23:20
2026-04-17 19:47:00
biokiwi incentive-icons
biokiwi
用生命科學的角度看世界!
153文章數(shù) 566關注度
往期回顧 全部

科技要聞

7家頭部平臺被罰沒35.97億元

頭條要聞

"封鎖"行動升級 美軍:在全球公海追捕所有"涉伊"船只

頭條要聞

"封鎖"行動升級 美軍:在全球公海追捕所有"涉伊"船只

體育要聞

遭網(wǎng)暴后,22歲大滿貫冠軍反擊:我的頭發(fā)足夠好

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩(wěn)的開掛動力! 阿維塔06T全系搭分布式電驅

態(tài)度原創(chuàng)

本地
教育
藝術
旅游
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

教育要聞

全國僅99個!綿陽成功上榜教育部區(qū)域優(yōu)秀案例

藝術要聞

18幅印象風景寫生 | 烏克蘭畫家Daniil Volkov

旅游要聞

不想走,還想來!“賞花+采摘+農家飯+夜游”鄉(xiāng)村農趣新體驗點亮春日經濟

軍事要聞

美宣布黎以停火10天 以方稱不會撤軍

無障礙瀏覽 進入關懷版