![]()
系列簡介
這是我們一系列原創(chuàng)技術(shù)貼,從易到難,每天學(xué)習(xí)一點。所有內(nèi)容均為疾控數(shù)據(jù)分析、科研論文相關(guān),或者說很多和現(xiàn)在的熱門監(jiān)測預(yù)警相關(guān),所以我們這個系列就叫“監(jiān)測預(yù)警基礎(chǔ)”。
今天是第16節(jié),內(nèi)容是另外一種季節(jié)指數(shù)的計算方式。
上一篇介紹的基礎(chǔ)季節(jié)指數(shù)法有個致命前提:數(shù)據(jù)沒有明顯的長期趨勢。
![]()
現(xiàn)實場景當(dāng)當(dāng)數(shù)據(jù)存在長期趨勢時,用簡單的“同月平均/總平均”來計算季節(jié)指數(shù)會失真。這是因為長期趨勢會“污染”季節(jié)指數(shù)的計算。
具體來說,如果數(shù)據(jù)有上升趨勢,那么后期月份的數(shù)值普遍較高,前期月份的數(shù)值普遍較低。
這樣,在計算同月平均時,后期的高值會拉高該月份的平均值,而前期的低值會拉低該月份的平均值。但注意,由于趨勢的存在,同月平均實際上包含了趨勢的影響,而總平均也是包含趨勢的。
然而,季節(jié)指數(shù)應(yīng)該只反映季節(jié)性波動,不應(yīng)該包含趨勢成分。
所以,我們需要一種方法將趨勢從數(shù)據(jù)中剔除,然后再計算季節(jié)指數(shù)。![]()
移動平均趨勢剔除法的本質(zhì)是:先通過移動平均估計趨勢成分,然后從原始數(shù)據(jù)中剔除趨勢,得到季節(jié)成分和隨機成分的混合,最后通過平均來消除隨機成分,得到純季節(jié)成分。具體步驟的數(shù)學(xué)含義如下:
第一,計算12個月移動平均:因為季節(jié)周期是12個月,所以用12個月的平均可以消除季節(jié)性,得到趨勢成分(T)和部分隨機成分(I)。注意,移動平均的期數(shù)必須等于季節(jié)周期長度,這樣才能完全消除季節(jié)性。
第二,中心化移動平均:由于12是偶數(shù),12個月移動平均值對應(yīng)的時間點是中間兩個月的中間點(比如第6和第7個月之間,即6.5),而我們的數(shù)據(jù)是月度數(shù)據(jù),所以需要將兩個連續(xù)的移動平均再平均,將其對齊到具體的月份(比如第7個月)。這樣得到的中心移動平均(CMA)就是趨勢成分(T)的一個估計。
第三,計算比值(原始值/中心移動平均):原始數(shù)據(jù)(Y)可以分解為趨勢(T)、季節(jié)(S)和隨機(I)成分。在乘法模型中,Y = T × S × I。我們用CMA估計了T,那么Y / CMA = (T × S × I) / T = S × I。這個比值就是季節(jié)成分和隨機成分的混合。
第四,計算同月平均比值:對每年的同一月份的比值求平均,可以消除隨機成分(因為隨機成分的期望為0,或者假設(shè)隨機成分的均值為1),得到純季節(jié)成分(S)的估計。
第五,調(diào)整季節(jié)指數(shù):由于每個月的季節(jié)指數(shù)是相對于趨勢的比值,我們希望全年的季節(jié)指數(shù)平均值為1(或總和為12,對應(yīng)12個月)。所以通過調(diào)整系數(shù),使得12個月的季節(jié)指數(shù)總和為12,即平均值為1。
這樣,我們就得到了剔除趨勢后的季節(jié)指數(shù),它反映了在排除長期趨勢后,各月份相對于趨勢的平均波動幅度。
為什么這種方法能更準(zhǔn)確地反映季節(jié)性?因為它在計算季節(jié)指數(shù)之前,先去除了長期趨勢的影響。這樣,無論數(shù)據(jù)是上升還是下降趨勢,計算出來的季節(jié)指數(shù)都只反映季節(jié)性的相對強度,而不受趨勢干擾。
![]()
基本步驟說明如下:
第一,計算移動平均值(如果是季度數(shù)據(jù),則采用4項移動乎均,月份數(shù)據(jù)則采用12項移動平均),并對其結(jié)果進行中心化處理,也就是將移動平均的結(jié)果再進行一次二項移動平均,即得出中心化移動平均值(CMA).
第二,計算移動平均的比值,也稱為季節(jié)比率,即將序列的各觀察值除以相應(yīng)的中心化移動平均值,然后計算出各比值的季度(或月份)平均值。
第三,季節(jié)指數(shù)調(diào)整。由于各季節(jié)指數(shù)的平均數(shù)應(yīng)等于1或100%,若根據(jù)第2步計算的季節(jié)比率的平均值不等于1,則需要進行調(diào)整。具體方法是將第2步計算的每個季節(jié)比率的平均值除以它們的總平均值。
下面通過實際例子說明季節(jié)指數(shù)的計算過程,有一份2020-2025年每月病例數(shù)的例子,操作步驟如截圖所示:
![]()
我們再通過畫圖理解一下這幾個數(shù)據(jù)和操作,就很清楚了:
![]()
紅色線(病例數(shù)):原始序列 Y = T × S × I
綠色線(CMA):趨勢成分 T
紫色線(比值):季節(jié)+隨機成分 S × I
藍色線(季節(jié)指數(shù)):純凈季節(jié)成分 S
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創(chuàng)
說明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來自公開網(wǎng)絡(luò)
轉(zhuǎn)載請注明
再次轉(zhuǎn)載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構(gòu)從業(yè)者運營
重點關(guān)注國內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時
做好疾控機構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創(chuàng)內(nèi)容,文章為個人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.