![]()
系列簡介
這是我們一系列原創(chuàng)的技術(shù)貼,從易到難,每天學(xué)習(xí)一點(diǎn)。所有內(nèi)容均為疾控?cái)?shù)據(jù)分析、科研論文相關(guān),或者說很多和現(xiàn)在的熱門監(jiān)測預(yù)警相關(guān),所以我們這個(gè)系列就叫“監(jiān)測預(yù)警基礎(chǔ)”。
今天是第2節(jié),講一講我們熟悉又不完全熟悉的移動(dòng)平均,這個(gè)也是后面很多操作的基礎(chǔ)。
時(shí)間序列數(shù)據(jù)是波動(dòng)變化的,面對(duì)波動(dòng)的疫情曲線,你是否也曾感到困惑?那些“7日移動(dòng)平均線”究竟是怎么算出來的?它為什么比原始數(shù)據(jù)更能說明問題?
今天,我們就來徹底講清楚這個(gè)疾控?cái)?shù)據(jù)分析中的基礎(chǔ)利器——移動(dòng)平均。
![]()
移動(dòng)平均法(MA:Moving Average Method)是一種處理時(shí)間序列數(shù)據(jù)的技術(shù),通過對(duì)一系列連續(xù)的數(shù)據(jù)點(diǎn)計(jì)算平均值來平滑短期波動(dòng)、揭示長期趨勢或周期性規(guī)律。比如大疫情網(wǎng)每天報(bào)告的病例數(shù),會(huì)因?yàn)橹苣﹫?bào)告延遲、節(jié)假日休息、突發(fā)聚集性疫情而產(chǎn)生劇烈波動(dòng),移動(dòng)平均通過計(jì)算連續(xù)一段時(shí)間內(nèi)數(shù)據(jù)的平均值,能夠有效平滑這些隨機(jī)波動(dòng),讓我們看清疫情發(fā)展的“主干道”。
移動(dòng)平均的主要用途就是 消除隨機(jī)波動(dòng),揭示長期趨勢;進(jìn)行季節(jié)性分解;在信號(hào)處理中去除噪聲。
![]()
移動(dòng)平均怎么計(jì)算,很簡單。比如下表是某地12月1日-15日每天流感的病例數(shù),計(jì)算7日移動(dòng)平均就是:
第7天得出移動(dòng)平均值21.3,代表的是第1-7天這7天內(nèi)的平均水平;
第8天得出移動(dòng)平均值21.0,代表的是第2-8天這7天內(nèi)的平均水平;
以此類推,這個(gè)平均值隨著時(shí)間“移動(dòng)”,形成了“移動(dòng)平均線”。
3日移動(dòng)平均一樣的,第3得出移動(dòng)平均值18.0,代表的是第1-3天這3天內(nèi)的平均水平,如下表。
![]()
我們把它畫出折線可以看出更多的東西:
第一,3日移動(dòng)平均前2天沒有數(shù)據(jù),因?yàn)椴粔?天;7日移動(dòng)平均前6 天沒有數(shù)據(jù),因?yàn)椴粔?天。
第二,平滑效應(yīng):移動(dòng)平均線比原始數(shù)據(jù)平滑得多,波動(dòng)更小;窗口越寬,平滑效果越強(qiáng),極端值的影響被稀釋,原始數(shù)據(jù)的"毛刺"被消除。
第三,滯后性:移動(dòng)平均總是滯后于原始數(shù)據(jù);窗口越大,滯后越嚴(yán)重;在轉(zhuǎn)折點(diǎn)處表現(xiàn)最明顯。
![]()
![]()
用途1:識(shí)別疫情真實(shí)趨勢,擺脫“日波動(dòng)”干擾
場景:比如你要向領(lǐng)導(dǎo)匯報(bào):本周疫情到底是在上升還是下降?周一102例,周二98例,周三150例(一起聚集疫情),周四85例,周五90例,周六45例(周末少報(bào)),周日55例。只看日數(shù)據(jù),你會(huì)被周三的峰值和周日的低谷搞糊涂。應(yīng)用移動(dòng)平均后:計(jì)算7日移動(dòng)平均,得到一條平滑曲線,發(fā)現(xiàn)移動(dòng)平均值從上周的75例/天,穩(wěn)步上升到本周的85例/天。
清晰結(jié)論:雖然日數(shù)據(jù)有波動(dòng),但疫情確實(shí)在緩慢上升。
用途2:準(zhǔn)確判斷疫情拐點(diǎn),把握防控關(guān)鍵時(shí)機(jī)
場景:實(shí)施防控措施后,需要判斷疫情是否出現(xiàn)“拐點(diǎn)”(從上升轉(zhuǎn)為下降)。
原始數(shù)據(jù)每天上下跳動(dòng),今天降一點(diǎn),明天又升一點(diǎn),根本看不出趨勢轉(zhuǎn)折。應(yīng)用移動(dòng)平均后:觀察移動(dòng)平均線的斜率變化,如果移動(dòng)平均線連續(xù)3天走平,然后開始掉頭向下,這很可能就是真正的“拐點(diǎn)”,比看日數(shù)據(jù)提前2-3天發(fā)現(xiàn)趨勢轉(zhuǎn)變,在防控資源調(diào)配、措施調(diào)整上,這2-3天的提前量至關(guān)重要。
用途3:構(gòu)建預(yù)警模型的“基線”
場景:在傳染病自動(dòng)預(yù)警系統(tǒng)(如我國的CIDARS)中,移動(dòng)平均是構(gòu)建“預(yù)期基線”的核心工具。工作流程:第一步,用多年歷史數(shù)據(jù),計(jì)算每個(gè)時(shí)間點(diǎn)的移動(dòng)平均值,作為“預(yù)期發(fā)病水平”,第二步,當(dāng)實(shí)時(shí)數(shù)據(jù)持續(xù)高于這個(gè)移動(dòng)平均基線時(shí),系統(tǒng)觸發(fā)預(yù)警,這個(gè)基線會(huì)根據(jù)疾病季節(jié)性和長期趨勢。此外,可以自動(dòng)調(diào)整,比如流感預(yù)警:冬季的基線自動(dòng)調(diào)高,夏季的基線自動(dòng)調(diào)低,實(shí)現(xiàn)動(dòng)態(tài)預(yù)警
用途4:數(shù)據(jù)可視化和溝通展示
向公眾展示疫情趨勢時(shí),一條平滑的移動(dòng)平均線比鋸齒狀的日數(shù)據(jù)柱狀圖更易于理解,一眼看清趨勢方向;更穩(wěn)定,避免因單日異常值引起不必要的恐慌;更專業(yè),體現(xiàn)疾控部門對(duì)數(shù)據(jù)的深度分析能力。![]()
第一、中心化移動(dòng)平均——用于計(jì)算季節(jié)指數(shù)
當(dāng)需要分析疾病的季節(jié)性規(guī)律時(shí)(比如流感冬春季高峰,手足口病夏季高峰),我們會(huì)使用“中心化移動(dòng)平均月度數(shù)據(jù)用12個(gè)月移動(dòng)平均,季度數(shù)據(jù)用4個(gè)季度移動(dòng)平均,然后再做一次中心化處理
目的是完全剔除季節(jié)性波動(dòng),分離出純粹的長期趨勢成分,從而更準(zhǔn)確地計(jì)算各月份相對(duì)于趨勢的“季節(jié)指數(shù)”。
這里只需要知道就行,具體操作方法后面會(huì)做更詳細(xì)的講解
2. 指數(shù)加權(quán)移動(dòng)平均(EWMA)——更重視近期信息
在快速變化的疫情中,上個(gè)月的數(shù)據(jù)比半年前的數(shù)據(jù)更有參考價(jià)值,指數(shù)加權(quán)移動(dòng)平均會(huì)給近期數(shù)據(jù)更高的權(quán)重,比如最近一周權(quán)重40%,上一周權(quán)重30%,上上周權(quán)重20%,更早數(shù)據(jù)權(quán)重10%
這樣計(jì)算出的移動(dòng)平均對(duì)趨勢變化更敏感,適用于需要快速響應(yīng)的新發(fā)傳染病監(jiān)測。
這里也是只需要知道就行,具體操作方法后面會(huì)做更詳細(xì)的講解。
移動(dòng)平均,這個(gè)看似簡單的統(tǒng)計(jì)工具,實(shí)則是每位疾控工作者都應(yīng)掌握的“數(shù)據(jù)望遠(yuǎn)鏡”。它幫助我們把視線從每日波動(dòng)的“浪花”上移開,聚焦于疫情發(fā)展的“洋流”方向。在信息過載、數(shù)據(jù)紛繁的今天,這種“透過現(xiàn)象看本質(zhì)”的能力尤為珍貴。
下次當(dāng)你繪制疫情曲線時(shí),不妨加上那條移動(dòng)平均線。它不會(huì)增加數(shù)據(jù)的“信息量”,但能極大提升你對(duì)信息的“理解力”。畢竟,在疫情防控這場持久戰(zhàn)中,看清趨勢,比追逐每一個(gè)波動(dòng)更重要。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創(chuàng)
說明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來自公開網(wǎng)絡(luò)
轉(zhuǎn)載請(qǐng)注明
再次轉(zhuǎn)載請(qǐng)注明出處
![]()
科普健康 | 宣傳疾控
本號(hào)為多位疾控機(jī)構(gòu)從業(yè)者運(yùn)營
重點(diǎn)關(guān)注國內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時(shí)
做好疾控機(jī)構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創(chuàng)內(nèi)容,文章為個(gè)人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號(hào)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.