網易首頁 > 網易號 > 正文申請入駐

監測預警基礎21-Serfling回歸模型具體操作步驟演示

2026-03-27 08:19:07　來源: CDC疾控人

陜西舉報

分享至

系列簡介

這是我們一系列原創技術貼，從易到難，每天學習一點。所有內容均為疾控數據分析、科研論文相關，或者說很多和現在的熱門監測預警相關，所以我們這個系列就叫“監測預警基礎”。

今天是第21節，這節課講一講Serfling回歸究竟如何操作，在此之前，我想給大家推薦一個視頻——黑龍江牡丹江疾控中心做的結核病宣傳視頻，采用魔術的方式科普結核病防控知識，非常用心，很有創意，如果大家覺得不錯，歡迎轉發點贊！

好的，我們今天就逐步講一講Serfling回歸模型如何具體操作。

1.計算自變量

好的，假設我們有這樣一個數據，是各月份某病病例數的數據，這個病每年有一次大循環，又有每半年一次的小循環。

所以我們需要算這樣6個自變量

2.根據公式直接計算

計算結果如下，病例數就是因變量，從t開始到cos2這6個變量就是自變量。

3.進行回歸分析

如何操作我們之前專門分節說過，所以我們這個地方就直接看結果，結果的解讀我們之前也說過。

至此，我們就知道了各自變量的系數和常數項，也就可以建立回歸方程了，建立回歸方程之后根據方程帶入t值，就可以算出每個時間點的預測值，然后作圖展示實際病例數和預測病例數歲時間的變化。

這就是Serfling回歸模型，在這種傳統的 Serfling 回歸模型中，算出來的預測值就是預警值，超過該值就可以認為是流行或者說超額。

1.流行期剔除的主觀性與循環悖論——這是最根本、最棘手的缺陷。

由于引人了時間序號和三角函數，Serfling模型可以有效模擬具有周期性特征的疾病流行曲線。在采用Serfling模型對疾病的流行起始進行預警時，為避免歷史數據中流行期的觀測值對流行起始預警閾值設置的影響，通常需要剔除流行期的觀測數據，在剔除流行期內的觀測值后，使用剩余的非流行期數據進行Serfling模型擬合，建立基線。

但是如何剔除？一般人為直接剔除之后再進行擬合，但這就需要定義流行期才能剔除，如何定義“流行期”？通常就是用“病例數顯著高于基線”來定義，這就形成了一個先有雞還是先有蛋的悖論。

或者主觀性剔除，但是這樣往往依賴分析者的主觀判斷（如“連續2個月超過基線2個標準差”），不同人處理可能得到不同的基線，影響結果的可比性和可重復性。

2. 基線對異常值的極度敏感

傳統方法（尤其早期用簡單線性/多項式回歸時）中，一個極端值就能顯著扭曲整條基線，即所謂的“高杠桿點”效應。即使這個極端值被判定為“流行”并剔除，它在剔除前的第一次擬合中已經扭曲了模型，影響了其他“正常”點的殘差，可能導致錯誤的剔除/保留判斷。

3. 季節模式假設過于剛性

使用固定的傅里葉項（如sin(2πt/12) + cos(2πt/12)）來擬合季節性，這隱含了一個強假設：季節性波形每年都完全相同。

但實際上肯定不是這樣的，傳染病的季節性受氣候、人口流動、干預措施等影響，其高峰時間、幅度、甚至波形都可能逐年變化。剛性模型無法捕捉這種時變的季節性，在異常季節轉換年份（如暖冬）表現不佳。

4.長期趨勢擬合能力不足

傳統上用一個簡單的線性項或低階多項式來擬合長期趨勢，這可能會出現過擬合與欠擬合，多項式階數選擇主觀。階數低了（如線性），可能無法捕捉復雜的趨勢變化（如發病率先升后降的“倒U型”）；階數高了，模型會過度擬合隨機波動，導致基線不合理震蕩。

5.對未來的外推風險大

傳統Serfling模型用于預測時，多項式趨勢會沿著設定的曲線無限上升或下降，這可能產生荒謬的長期預測（例如，預測未來20年后病例數為負數）。

編輯：普通疾控人 | 審核：詩酒趁年華

文章來源 | 原創

說明 | 轉載只為分享，如有侵權聯系刪除

轉載請注明

再次轉載請注明出處

科普健康 | 宣傳疾控

本號為多位疾控機構從業者運營

重點關注國內外健康事件

致力于疾控科普

在做好科普服務大眾的同時

做好疾控機構的宣傳

讓更多的人了解疾控，擁抱健康

歡迎加「小編」微信(cdcjkr126com)

本文具體說明

本文為原創內容，文章為個人理解所學，不涉及疫情信息及內部保密數據，發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處，歡迎聯系小編修改、刪除。

更多精彩視頻，盡在“CDC疾控人”視頻號

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.