網易首頁 > 網易號 > 正文申請入駐

ISQP2025專家訪談 | 鄭青山教授：定量藥理學模型之辯 —— 無關對錯與重在證據

2025-12-16 16:24:50　來源: 藥學瞭望

北京舉報

分享至

編者按：模型化方法已成為早期新藥臨床試驗的主要數據分析方法，甚至是劑量選擇的標準化方法。因此，建模與模擬在藥物研發決策中必可少。但是，國內合格的定量藥理學家屈指可數，年青的同行們在建模過程中，面臨諸多挑戰。在2025年第11屆定量藥理學與新藥評價會議（ISQP）上，上海中醫藥大學鄭青山教授在主題報告中，闡述了模型評價的系統化方法及實踐難題，通過典型案例，揭示了模型評價中的深層次問題。《藥學瞭望》就報告的相關內容，與他深度對話。

《藥學瞭望》：您的選題宗旨是什么，事先有何考慮？

鄭青山教授：業內知道，FDA新指南認為，PK-PD模型化分析是早期試驗的主要設計方法和數據分析方法，也是劑量優選的標準化方法，否則結果可能不被接受。而且，不再提及基于概率的方法，改用劑量-效應關系，或者血藥暴露-效應關系（E-R）分析。因為血藥濃度比劑量要敏感得多，PK-PD的模型化分析，在小樣本量下就可評價有效性和安全性，加上多個試驗可合并或滾動分析，以及橋接和外推等手段，使得定量藥理學成為極為強大的工具。

相對來說，定量藥理學是個小眾學科，當普及性不夠時，作為一個先行者，就會鼓動更多的同行去學習和使用。到了現階段，從業人員很多，出現了新問題。例如，有的同行，可能是缺少經驗，簡單化或亂做一氣，沒有發揮模型化方法應有的作用，甚至建模數據是選擇性的，而不是FDA要求的“全部數據”。有的申辦方也有問題，在研究時間和預算上，提出一些不切實際的要求，讓人應付差事，甚至用R代碼跑一個單因素E-R回歸圖，然后下結論：沒有暴露-效應關系，用探索性結果替代研究結論。國外對此評價十分負面，一般行業內流傳，定量藥理學是生物統計學的“12倍時間量”。作為定量藥理學發展的親歷者，不知道為什么，總有一種責任感，我最近的報告都是在講存在問題，總不能誤入歧途吧，那樣的話，對學科發展不利，對國家新藥研發也是有害的。

《藥學瞭望》：為什么報告一開始就給定量藥理學做了一個理念定位：“模型引導，做多求少（Model-Guided More for Less）”，有何依據？

鄭青山教授：定量藥理學是發展中的年輕學科，國際指南尚在起草階段，對于行業以外的人，難以用一兩句話，闡明其科學內涵，主要是說不清。但有一點是肯定的，定量藥理學手段多樣，靈敏，能夠利用多源數據建模，一旦成功，通過計算機模擬，能夠洞悉數據背后的規律，可以回答諸多疑問，而不是開展額外試驗。例如，通過血藥濃度與心電圖QT間期（QTc）的建模分析，在很小的樣本量下，甚至作為首次人體試驗的加載研究，就可以判斷結果，而不必開展昂貴的完全QTc延長試驗（TQT）。

王亞寧博士曾是FDA定量藥理學部的部長，我記得他曾說過，在整個FDA監管體系中，審評員遇到證據缺失的第一反應是，增加試驗！只有定量藥理學部門，其理念是多建模，少做試驗。這就是模型引導新藥研發模式，又稱為MIDD，在FDA廣受申辦方歡迎的原因。這種理念，如何用一句話來表達，我想了很久，覺得“模型引導，做多求少”是合適的。不要忽視一句口號的作用，有一個統計學家叫Box，說了一句 “模型總是錯的，但有些是有用的”，各人理解不同，產生許多誤解。

《藥學瞭望》：您在報告提到模型評價的5個維度，或者稱為5種方法，又特別強調第1個和第5個特別重要，為什么？

鄭青山教授：在模型評價上，的確需要綜合的和系統的評估，有關5個維度，這里再重復一遍：一是統計學支撐，要求采用最簡模型，防止過擬合；二是擬合優度，應能夠解釋主要變異，且殘差無系統性結構異常，如傘形；三是模型穩健性，要通過Bootstrap法驗證數據輕微變化或擾動時，不引起參數大幅變動；四是預測可靠性，通過可視化預測檢驗，評估三個預測區間的分離度和實測線位置；五是專業合理性，要求參數和結果具有可解釋性，結果符合邏輯或機制，與外部數據保持一致性。

現在的問題主要出在第1和第5種方法。第1種是統計學問題，許多年青同行對統計學概念認識不深，在建模之前，對于關鍵變量進行暴露-效應（E-R）數據檢視時，看到P>0.05，則認為，模型不成立，不能建模，無法建模，無E-R關系，如此等等，從而放棄建模，顯然是不對的。數據檢視是個單因素分析，P>0.05只是提示，暴露變化導致的效應變化沒有統計學意義，或者說，不能解釋效應變化。但是，不代表多因素建模后的結論，即便沒有E-R關系的模型，同樣提供重要信息。

我在報告中的第1個實例，就是一個沒有E-R關系的模型（右圖），結果發現，用藥組0暴露者，與其他不同水平的暴露者，甚至高暴露者，療效一致，提示無效。而右圖中納入了安慰劑人群，反而提示有試驗質量問題，這是多么重要的信息！因此，模型化分析，不但能夠判斷藥物的有效性、安全性，還能判斷試驗質量。一些有爭議的上市藥物，有一個共同特點，就是沒有PK-PD建模與模擬。

左：暴露變化呈現一個水平效應，即無E-R 關系；右：暴露變化呈現兩個水平效應，E-R 關系存疑，需要進一步支撐。

另外，對于某個協變量模型的參數，其相對標準誤（RSE%）大于50%，表示此協變量的變化所引起的效應變化，沒有呈現統計學意義，但是不一定沒有專業意義，FDA認為可以通過模擬來確認。我國早期的定量藥理學分三大塊：藥動學，藥效學，再通過統計學將兩者關聯，而且定量藥理學家就是統計學專家。所以，定量藥理學工作者掌握統計學知識非常重要的。

《藥學瞭望》：的確如此，那么請談談第5個評價方法的重要性吧。

鄭青山教授：實際上，第5個方法是專業上的可解釋性。先說說試驗統計學的原理，在試驗設計階段，統計學人員通過隨機化方式，將各種混雜因素均衡地分配到各劑量組中，當組間出現藥效差異時，就是源自用藥的不同（或稱處理），所以隨機是統計的基石。而定量藥理學則不同，屬于事后分析，通過建模過程扣除混雜因素，然后去發現暴露水平變化是否會引起效應隨之變化，稱為E-R關系。對于較弱的E-R關系，我們總是很小心，希望在臨床終點以外，增加機制指標的模型，或者從動物實驗，或者從文獻數據獲得證據，形成證據鏈。具有證據鏈的結論，就是穩健的，也是可解釋的。

我報告中的第2個例子也是如此，從臨床數據本身看，PK-PD模型無可挑剔，模型很好地描述了數據，而且具有明確的E-R關系，很顯然，藥物是有效的。但是，與同靶點藥文獻數據所建的模型相比，安慰劑療效太好，用藥組的凈療效太低。注意，不同試驗的凈療效具有良好的可比性。由于模型結果不能被外部數據所解釋，促使申辦方檢測了留置的安慰劑患者血樣，最終發現，部分安慰劑與試驗藥搞混了。這種事件在早期試驗，已發生多起，好在沒有造成誤判。可見，模型結果的可解釋性，或者說建立證據鏈，是多少重要！

《藥學瞭望》：就第2個例子的模型來說，這是一個正確模型，還是錯誤模型？

鄭青山教授：還是回到Box那句話，“模型總是錯的，但有些是有用的”。我讀了他的傳記，發現他的真實意圖是，鼓勵建模，小心誤用。但是，用“對和錯”去評價模型，容易讓人產生誤解。我上面介紹是的2個例子，都不能用對錯去判斷。比如，第2個例子，模型建得很好，如果直接用作決策的話，則產生誤導：藥效很弱，停止開發。但是，外部數據，又讓這個模型提供了線索，否則將不會發現錯在何處。因此，我的結論是：模型無關對錯，重在提供證據。

專家簡介

鄭青山

上海中醫藥大學

博士，教授，博士生導師，上海中醫藥大學藥物臨床研究中心主任

中國藥理學會定量藥理學專業委員會主任委員

第3屆和第5屆國際定量藥理學和新藥評價會議的大會主席

第一屆中日韓定量藥理學會議（A3 Symposium）主席；9種重要期刊編委，包括中國藥理學報 (英文）、中國新藥雜志、DIA Global Forum、藥學學報、中國藥理學通報、中國臨床藥理學雜志、中國循證醫學雜志、中國臨床藥理學與治療學雜志、藥物不良反應雜志

參與起草國際指南“計算機化系統在新藥研究中的應用”。
??? 主要從事定量藥理學和臨床藥理學研究，即基于模型化與模擬化手段，定量評價中藥臨床藥效學、藥動學和復方配伍的相互作用動力學。已發表論文200余篇，SCI論文50余篇，單篇最高引用超過490次；省部級科技進步二等獎2項。與孫瑞元教授所主編的大型定量藥理學計算軟件（DAS），用戶發表應用論文引用此軟件已達16400多次。主持過國家和省部級課題多項。

添加藥學瞭望管理員

進入學術交流群

《藥學瞭望》征稿邀請

01.投稿內容

征稿內容不限于：研究進展、團隊科研成果、臨床用藥經驗分享、典型病例解讀、疾病診治經驗、人文故事等

02.聯系人

投稿 | 學術報道 | 合作

投稿聯系人：劉老師 15201320201（微信同號）

投稿郵箱：contact@siri.ntesmail.com

（來源：藥學瞭望）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.