![]()
系列簡介
這是我們一系列原創技術貼,從易到難,每天學習一點。所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個系列就叫“監測預警基礎”。
今天是第21節,這節課講一講Serfling回歸究竟如何操作,在此之前,我想給大家推薦一個視頻——黑龍江牡丹江疾控中心做的結核病宣傳視頻,采用魔術的方式科普結核病防控知識,非常用心,很有創意,如果大家覺得不錯,歡迎轉發點贊!
好的,我們今天就逐步講一講Serfling回歸模型如何具體操作。
![]()
1.計算自變量
好的,假設我們有這樣一個數據,是各月份某病病例數的數據,這個病每年有一次大循環,又有每半年一次的小循環。
所以我們需要算這樣6個自變量
![]()
2.根據公式直接計算
計算結果如下,病例數就是因變量,從t開始到cos2這6個變量就是自變量。
![]()
3.進行回歸分析
如何操作我們之前專門分節說過,所以我們這個地方就直接看結果,結果的解讀我們之前也說過。
![]()
至此,我們就知道了各自變量的系數和常數項,也就可以建立回歸方程了,建立回歸方程之后根據方程帶入t值,就可以算出每個時間點的預測值,然后作圖展示實際病例數和預測病例數歲時間的變化。
![]()
這就是Serfling回歸模型,在這種傳統的 Serfling 回歸模型中,算出來的預測值就是預警值,超過該值就可以認為是流行或者說超額。
![]()
1.流行期剔除的主觀性與循環悖論——這是最根本、最棘手的缺陷。
由于引人了時間序號和三角函數,Serfling模型可以有效模擬具有周期性特征的疾病流行曲線。在采用Serfling模型對疾病的流行起始進行預警時,為避免歷史數據中流行期的觀測值對流行起始預警閾值設置的影響,通常需要剔除流行期的觀測數據,在剔除流行期內的觀測值后,使用剩余的非流行期數據進行Serfling模型擬合,建立基線。
但是如何剔除?一般人為直接剔除之后再進行擬合,但這就需要定義流行期才能剔除,如何定義“流行期”?通常就是用“病例數顯著高于基線”來定義,這就形成了一個先有雞還是先有蛋的悖論。
或者主觀性剔除,但是這樣往往依賴分析者的主觀判斷(如“連續2個月超過基線2個標準差”),不同人處理可能得到不同的基線,影響結果的可比性和可重復性。
2. 基線對異常值的極度敏感
傳統方法(尤其早期用簡單線性/多項式回歸時)中,一個極端值就能顯著扭曲整條基線,即所謂的“高杠桿點”效應。即使這個極端值被判定為“流行”并剔除,它在剔除前的第一次擬合中已經扭曲了模型,影響了其他“正常”點的殘差,可能導致錯誤的剔除/保留判斷。
3. 季節模式假設過于剛性
使用固定的傅里葉項(如sin(2πt/12) + cos(2πt/12))來擬合季節性,這隱含了一個強假設:季節性波形每年都完全相同。
但實際上肯定不是這樣的,傳染病的季節性受氣候、人口流動、干預措施等影響,其高峰時間、幅度、甚至波形都可能逐年變化。剛性模型無法捕捉這種時變的季節性,在異常季節轉換年份(如暖冬)表現不佳。
4.長期趨勢擬合能力不足
傳統上用一個簡單的線性項或低階多項式來擬合長期趨勢,這可能會出現過擬合與欠擬合,多項式階數選擇主觀。階數低了(如線性),可能無法捕捉復雜的趨勢變化(如發病率先升后降的“倒U型”);階數高了,模型會過度擬合隨機波動,導致基線不合理震蕩。
5.對未來的外推風險大
傳統Serfling模型用于預測時,多項式趨勢會沿著設定的曲線無限上升或下降,這可能產生荒謬的長期預測(例如,預測未來20年后病例數為負數)。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.