網易首頁 > 網易號 > 正文申請入駐

Science綜述×諾獎專訪|AI革新蛋白質工程？Baker怎么看？

2026-04-19 20:07:01　來源: 新浪財經

北京舉報

分享至

來源：市場資訊

（來源：DrugAI）

近日一篇發表于Science的重磅綜述“How artificial intelligence is reengineering protein engineering”，以統計學視角系統拆解了人工智能對蛋白質工程的顛覆性重構，將這一依賴漫長實驗迭代的學科，推向了高效、精準、可定制的全新發展階段，也為生物醫藥、農業育種、生物制造等領域帶來了前所未有的變革可能。

生命運作的核心引擎：蛋白質工程的使命與傳統路徑的桎梏

蛋白質作為驅動所有生命形式運轉的核心分子，承擔著催化生化反應、調控基因表達、構筑細胞結構等關鍵功能，而人類改造天然蛋白質、創造全新蛋白質的核心目標，正是為了研發新型治療藥物與疫苗、培育抗逆性更強的農作物、實現抗生素與生物材料的低成本制造，這也是蛋白質工程成為最具社會影響力科研領域的核心原因。在人工智能介入之前，蛋白質工程領域已誕生兩項斬獲諾貝爾獎的經典方法，分別是2018年獲獎的定向進化與2024年獲獎的計算蛋白質設計，二者憑借不同的技術邏輯為蛋白質改造奠定了基礎，卻始終難以突破天然探索效率與物理模型精度的雙重限制。

諾獎級方法的共同困境：浩瀚序列空間中的探索難題

定向進化通過模擬自然選擇的迭代突變與人工篩選實現蛋白質優化，無需復雜生物物理建模卻需耗費大量時間、成本與實驗人力，且只能在初始蛋白序列的小范圍內進行探索；計算蛋白質設計依托蛋白質數據庫的統計數據與物理能量函數開展硅基設計，能夠突破已知蛋白空間的限制卻無法精準捕捉酶催化、蛋白質動態構象等復雜生物特性。

兩種方法共同面對的終極挑戰，是蛋白質序列空間的浩瀚無垠 —— 僅由 100 個氨基酸構成的小型蛋白質，就擁有20^100≈10^130種序列組合，這一數字遠超宇宙中原子總數的估算值，而能正確折疊并發揮功能的序列僅占其中極小部分，盲目搜索無異于大海撈針。

AI 的破局之道：以智能搜索與精準打分重構設計邏輯

人工智能為蛋白質工程帶來的核心變革，集中體現為對序列空間搜索與蛋白質屬性打分兩大核心環節的全面優化。

一方面讓算法能夠在超高維的序列空間中完成大跨度、有方向的智能跳躍，找到傳統方法無法觸及的優質序列，另一方面以更低成本、更高效率精準預測蛋白質的表達量、穩定性、催化活性等關鍵屬性，為序列搜索提供可靠的決策依據。

從統計學本質來看，AI 驅動的蛋白質設計不再是直接尋找目標序列，而是通過模型學習符合設計要求的蛋白質概率分布，再從分布中直接采樣生成理想分子，這一邏輯轉變徹底改寫了蛋白質工程的探索范式。

條件生成的三大范式：AI 定制蛋白質的核心技術路徑

綜述明確提出，獲取條件生成模型是 AI 蛋白質設計的核心，而當前學界主要通過三種技術策略實現這一目標，每一種策略都在靈活性、計算成本與適配場景上形成了差異化優勢。

直接嵌入條件策略在模型訓練之初就將酶活、配體結合、二級結構等目標屬性植入模型架構，直觀直接卻需在新增屬性時重新訓練大型模型；

貝葉斯融合策略將預訓練的泛蛋白模型與屬性預測模型結合，依托貝葉斯定理實現 “即插即用” 的靈活適配，無需重新訓練基礎模型卻面臨計算分母難以求解的問題；

實時引導策略以擴散模型、流匹配模型為核心，在生成過程中用屬性信息實時引導采樣過程，無需訓練新生成模型卻需承擔迭代采樣的計算成本，成為當前蛋白質骨架設計的主流方案。

從序列到原子：AI 驅動的蛋白質全鏈路設計體系

依托生成式 AI 模型，蛋白質工程已實現從序列生成到原子結構構建的全流程自動化，形成了完整且可落地的設計閉環。

序列生成從單一蛋白家族的 Potts 模型、變分自編碼器，升級為覆蓋所有蛋白家族的 ESM 系列、ProstT5 等泛蛋白大模型，實現跨家族、高通量的序列創造；

骨架生成以 Chroma、RFdiffusion 等擴散模型為核心，能夠從噪聲中逐步還原出具備對稱性、結合位點、功能基序的定制化 3D 骨架；

反向折疊通過 ProteinMPNN、ESM-IF1 等模型，將骨架結構轉化為可折疊的氨基酸序列，序列還原率遠超傳統方法；

序列-結構聯合生成則突破分步設計的局限，同步生成序列與原子級空間結構，完美適配活性位點、小分子結合等原子級設計需求。

突破與瓶頸：當前 AI 蛋白工程的能力邊界與待解難題

人工智能的介入讓蛋白質結合體設計的命中率從不足 0.05% 實現數量級提升，微型球狀蛋白、抗體等分子的設計已走向實用化，但領域仍面臨諸多難以攻克的核心瓶頸。酶設計成為當前最難突破的方向，精準的活性位點原子構型與全新反應的催化功能無法僅靠 AI 實現從頭設計；柔性環區、天然無序區域的分子識別缺乏通用模型支撐，而蛋白質與 DNA、RNA、小分子的復合物結構數據稀缺，也限制了跨靶點設計的發展。同時，模型泛化能力、評測標準缺失、濕實驗驗證成本高昂等問題，也成為 AI 蛋白質工程進一步落地的阻礙。

諾獎得主的核心論斷：AI 是強力工具，人類定義科學的終極問題

作為計算蛋白質設計領域的領軍者與諾獎得主，David Baker 在接受ChosunBiz專訪中給出了關于 AI 與蛋白設計關系的權威定論：AI 徹底改變了蛋白質設計的研究方式，但它始終只是工具，永遠無法替代人類研究者。

在他看來，AI 能夠高效解決蛋白設計中的技術難題，卻無法承擔設定研究方向、判別實驗結果意義、規劃臨床轉化路徑的核心責任；比算力、基礎設施更重要的是頂尖科研人才與開放協同的研究生態，構建讓研究者自由交流、深度探索的 “共享大腦” 式科研環境，遠比單純追求技術模型迭代更具價值。

同時 David Baker 也指出，AI 在蛋白設計領域的能力存在明確邊界，將設計出的蛋白質轉化為獲批藥物、完成臨床試驗的過程，因公共數據不足與生物醫學認知局限，難以依靠 AI 實現快速突破，這一階段仍需人類研究者的深度參與與長期攻堅。

從研究方向來看，David Baker 透露未來將聚焦納米機器、農業抗逆蛋白等全新領域，用蛋白質設計技術應對全球變暖、疾病治療等重大挑戰；從科研生態來看，人才培養與開放協同的研究環境將成為核心競爭力，正如 David Baker 所強調的，科學的突破從來不是依靠單一工具的升級，而是源于研究者對核心問題的執著探索與團隊間的深度協作。

參考文獻：

Jennifer Listgarten,Hanlun Jiang,How artificial intelligence is reengineering protein engineering.Science392,159-166(2026).DOI:10.1126/science.aec8444
https://biz.chosun.com/en/en-science/2026/04/08/Y2HAKUH2XNHBXBDHEXUKCPAUUA/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.