![]()
系列簡介
這是我們一系列原創技術貼,從易到難,每天學習一點。所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個系列就叫“監測預警基礎”。
今天是第5節,今天的內容比前面的來說稍微有點往前了,前面幾節可以說基本都是基本內容的系統介紹,今天算是基線和預警線、行動線的繪制操作。
我們已經學習了簡單控制圖法和考慮季節性的簡單移動平均控制圖法,但是這還不夠,我們在監測預警基礎1中就說過,時間序列數據除了季節性,還有一個非常重要的就是趨勢,所以我們這一節要說的就是同時考慮季節和長期趨勢的移動平均控制圖,也被稱為回歸移動平均控制圖或季節調整控制圖。
![]()
簡單控制圖及其移動平均升級版,威力巨大,但它們有一個重要的前提假設:數據是“平穩”的——即圍繞一個相對固定的平均水平上下波動。
然而,傳染病的現實數據往往是“不聽話”的。
現實的數據包括長期趨勢、季節波動等,數據沒有那么簡單,當疾病數據不再“簡單”,我們如何畫出更精準的預警“紅線”?一張圖,不僅要看當下波動,更要讀懂它背后的季節語言和時代軌跡。
“老師,我用之前的簡單移動平均控制圖做預警,夏天總是誤報,冬天又可能漏報,這是為什么?”
這個問題,是許多疾控同仁在深入學習預警方法后都會遇到的困惑。前四期,我們從時間序列數據講到移動平均,再到簡單控制圖及其升級版——簡單移動平均控制圖,逐步揭開了傳染病監測預警的基礎面紗。
今天,我們將迎來一個重要的能力躍升:讓控制圖學會“察言觀色”——不僅能捕捉數據的瞬間異常,更能理解其背后深刻的季節節律和長期走向。
這就是同時考慮季節和長期趨勢的移動平均控制圖,有時在學術上也被稱為回歸移動平均控制圖或季節調整控制圖,它是從“簡單預警”邁向“精準預警”的關鍵一步。
![]()
這個方法可以概括為“分解-學習-重建”三步走策略,我們用一個最常見的案例來拆解:如何預測明年每周的發病數,并畫出其預警線。
第一步,分解
首先,我們擁有過去5年每周的發病數據,目標是先“看懂”這段歷史,用一條直線回歸方程去擬合這5年的數據,這條傾斜的直線,就捕捉了疾病逐年緩慢增加或減少的長期力量,從數據中減去這條趨勢線,我們就得到了“去趨勢數據”,具體來說就是以下3個操作步驟:
第1步:以周次作為X軸,5年就是第1周到第260周,每周病例數作為Y周繪制散點圖,然后選擇畫出線性回歸的趨勢性并顯示回歸方程。
第2步:將周次帶入回歸方程中的X就可以算出Y,此時的Y就是每周的線性方程擬合值。
第3步:計算殘差:殘差=觀測值-擬合值,從數據中減去這條趨勢線,我們就得到了“去趨勢數據”。
![]()
第二步,對殘差進行分析并設置殘差閾值
剩下的“去趨勢數據”主要包含季節性波動和隨機噪音。我們計算每年同一周數據的平均值,或用前后擺動2周的移動平均進行平滑,就能得到一條光滑的、代表典型季節性高低的“季節曲線”,這條曲線,就是疾病在一年中的“節律指紋”,這就是所謂的提取數據的季節規律,具體來說就是以下3個操作步驟:
第1步:計算5年同時前后擺動2周的殘差移動平均值,如上圖,這是一條光滑的、代表典型季節性高低的“季節曲線”。這條曲線,就是疾病在一年中的“節律指紋”。
第2步:和殘差移動平均值同理,計算計算5年同時前后擺動2周的殘差標準差。
![]()
第3步:接下來,我們設置殘差的閾值,比如,可以用“殘差均值 ± 1.96倍殘差標準差”和“殘差均值±2.58倍殘差標準差”分別劃定出殘差的預警限和行動限。這相當于為“不可預測的波動”本身,建立了一套固定的、統計學的異常判定標準。
![]()
第三步,繪制未來的預警控制圖
現在,我們要預測和監控新的一年(比如2015年)。
第1步:預測基準線:將第一步得到的趨勢線延長到2025年,周次相應的從260周開始到312周作為X,通過直線回歸擬合方程得到Y,就是2025年的回歸擬合值,或者可以說是2025年的每一周的“趨勢預測值”。
第2步:殘差=觀測值-擬合值,那么,就可以用擬合值+殘差,就可以得到2025年每一周的期望值,或者叫2025年的基線。好,我們再理解以下,通過回歸得到的2025年的擬合值只考慮了趨勢,沒有季節性,而疊加上從歷史中學習到的“季節曲線”,兩者相加,就生成了2015年每一周的“預期基線”。這條基線不是平的,而是自帶趨勢和季節起伏的“智能基線”。
![]()
第3步:繪制圖,基線就是我們上一步算出來的擬合值+殘差,然后再繪制閾值線,閾值線根據自己得實際情況繪制,比如我們在這舉例繪制2條,一條預警線,一條行動線。預警線就是擬合值+前面設置殘差預警線,殘差預警線怎么算我們前面說過就是“殘差均值 ± 1.96倍殘差標準差”。行動線就是擬合值+前面設置殘差行動線,殘差行動線怎么算我們前面也說過就是“殘差均值±2.58倍殘差標準差”。
![]()
這樣,我們就得到了兩條與基線“同起伏、共進退”的動態預警線和行動線。至此,一張同時考慮了長期趨勢和季節性的移動平均控制圖就誕生了。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.