![]()
系列簡(jiǎn)介
這是我們一系列原創(chuàng)技術(shù)貼,從易到難,每天學(xué)習(xí)一點(diǎn)。所有內(nèi)容均為疾控?cái)?shù)據(jù)分析、科研論文相關(guān),或者說(shuō)很多和現(xiàn)在的熱門監(jiān)測(cè)預(yù)警相關(guān),所以我們這個(gè)系列就叫“監(jiān)測(cè)預(yù)警基礎(chǔ)”。
今天是第33節(jié),我們今天講一種新的方法或者說(shuō)實(shí)驗(yàn)設(shè)計(jì),中斷時(shí)間序列模型(ITS)。
如有不當(dāng)之處,歡迎留言討論。
![]()
假設(shè)您是某市疾控的監(jiān)測(cè)人員。2019年9月,本市首次對(duì)全市小學(xué)生免費(fèi)接種流感疫苗。一年后,您打開傳染病報(bào)告系統(tǒng),發(fā)現(xiàn)2020年秋冬季的流感報(bào)告病例比2019年同期少了40%。
能直接下結(jié)論說(shuō)"疫苗效果驚人"嗎?
不能。
因?yàn)?020年可能還發(fā)生了其他事情:新冠防控期間戴口罩、保持社交距離、學(xué)校頻繁停課……這些混雜因素讓簡(jiǎn)單的"前后對(duì)比"毫無(wú)意義。
那該怎么辦?
答案就是今天的主角——中斷時(shí)間序列模型(Interrupted Time Series, ITS)。它不需要隨機(jī)對(duì)照組,只需要利用干預(yù)前的時(shí)間序列自身作為對(duì)照,就能把"干預(yù)的真實(shí)效果"從自然趨勢(shì)和季節(jié)波動(dòng)中"摳"出來(lái)。
![]()
中斷時(shí)間序列是一種準(zhǔn)實(shí)驗(yàn)(Quasi-experimental)定量研究方法。
核心思想是在干預(yù)發(fā)生前,建立結(jié)局指標(biāo)(如發(fā)病率、報(bào)告數(shù)、及時(shí)率)隨時(shí)間變化的數(shù)學(xué)模型,然后將這條趨勢(shì)線向前外推(Counterfactual,反事實(shí)),作為"如果沒有干預(yù),數(shù)據(jù)應(yīng)該是什么樣"的對(duì)照。干預(yù)后的實(shí)際數(shù)據(jù)與這條外推線的差距,就是干預(yù)的凈效果。
所以涉及三個(gè)關(guān)鍵詞:
中斷(Interrupted):干預(yù)像一把刀,切斷了原來(lái)的時(shí)間趨勢(shì)。
時(shí)間序列(Time Series):結(jié)局指標(biāo)按固定時(shí)間間隔(通常按月/周)記錄。
反事實(shí)(Counterfactual):用數(shù)學(xué)外推模擬"沒有干預(yù)的平行世界"。
![]()
ITS本質(zhì)上是一個(gè)擴(kuò)展的多元線性回歸模型(也可擴(kuò)展為Poisson回歸或負(fù)二項(xiàng)回歸,適用于計(jì)數(shù)數(shù)據(jù))。
公式如下:
![]()
我們解釋一下每個(gè)變量的含義:
![]()
其中,最核心的參數(shù)就是以下4個(gè):
![]()
比如接種疫苗的例子,關(guān)鍵邏輯就是如果疫苗有效,我們預(yù)期β2為負(fù)且顯著說(shuō)明即時(shí)發(fā)病減少,或者β3為負(fù)且顯著,說(shuō)明長(zhǎng)期下降加速。
其實(shí)看懂上面的公式,基本也就看懂中斷時(shí)間序列了!
![]()
第一步:數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)結(jié)構(gòu)要求為:
時(shí)間單位:月、周或季度。月是最常見的選擇。
長(zhǎng)度要求:干預(yù)前至少12個(gè)時(shí)間點(diǎn)(最好24個(gè)以上),干預(yù)后至少12個(gè)時(shí)間點(diǎn)。
結(jié)局變量:連續(xù)型(發(fā)病率、報(bào)告數(shù))或計(jì)數(shù)型(病例數(shù))。
協(xié)變量(可選):人口數(shù)、氣溫、節(jié)假日等。
第二步:繪制原始序列圖
在Excel、R或Python中畫出時(shí)間序列折線圖。重點(diǎn)觀察:
是否有明顯的季節(jié)性?(流感肯定有)
干預(yù)前趨勢(shì)是否大致線性?(如果呈指數(shù)增長(zhǎng),需取對(duì)數(shù)轉(zhuǎn)換)
干預(yù)點(diǎn)是否有肉眼可見的跳變?
第三步:建立回歸模型,跑數(shù)據(jù)
使用統(tǒng)計(jì)軟件(SPSS、Stata、R、SAS均可)運(yùn)行回歸即可,這一步我們之前也已經(jīng)講過(guò)。
但是要注意,如果結(jié)局是報(bào)告病例數(shù)(非負(fù)整數(shù)),且存在過(guò)度分散(方差>均值),普通線性回歸不再適用,應(yīng)改用:
Poisson ITS回歸:glm(Y ~ ..., family = poisson)
負(fù)二項(xiàng)ITS回歸:當(dāng)Poisson的殘差過(guò)度分散時(shí)采用
ARIMA-ITS:當(dāng)殘差存在嚴(yán)重自相關(guān)時(shí),結(jié)合時(shí)間序列模型
第四步:模型診斷
ITS模型最怕殘差自相關(guān)(Autocorrelation),即上個(gè)月的誤差會(huì)影響這個(gè)月。必須檢驗(yàn):
Durbin-Watson檢驗(yàn):統(tǒng)計(jì)量應(yīng)接近2(1.5-2.5可接受)。若<<1.5,說(shuō)明存在正自相關(guān),需用Newey-West標(biāo)準(zhǔn)誤或ARIMA-ITS模型校正。
殘差圖:畫出殘差隨時(shí)間分布的散點(diǎn)圖,應(yīng)隨機(jī)分布在0軸上下,無(wú)明顯的波浪形模式。
第五步:結(jié)果解讀與可視化
數(shù)值解讀,重點(diǎn)看β2(水平變化)和β3(斜率變化)的系數(shù)、95%CI和P值。
圖形解讀可以畫圖,比如:
圖1:原始數(shù)據(jù)與擬合線:展示干預(yù)前后兩條擬合直線。
圖2:反事實(shí)外推線:將干預(yù)前的趨勢(shì)線"延長(zhǎng)"到干預(yù)后,與實(shí)際數(shù)據(jù)對(duì)比,兩者之間的陰影區(qū)域就是干預(yù)的累積效果。
圖3:殘差圖:驗(yàn)證模型假設(shè)。
圖4:效應(yīng)分解圖:分別標(biāo)注"即時(shí)水平變化"和"斜率變化"的大小。
好了,到此為止,就做完了中斷時(shí)間序列分析,我們需要注意的ITS的適用條件和不適用的情況:
適用條件
干預(yù)時(shí)間點(diǎn)明確:知道具體哪個(gè)月/周發(fā)生了干預(yù)。
干預(yù)前趨勢(shì)穩(wěn)定:干預(yù)前至少10-12個(gè)數(shù)據(jù)點(diǎn),且趨勢(shì)相對(duì)平穩(wěn)(無(wú)明顯斷崖式波動(dòng))。
無(wú)其他同時(shí)期重大干預(yù):如果干預(yù)當(dāng)月同時(shí)發(fā)生了另一項(xiàng)政策,模型無(wú)法區(qū)分兩者的效應(yīng)(多重共線性)。
結(jié)局指標(biāo)可連續(xù)監(jiān)測(cè):有完整的、無(wú)缺失的時(shí)間序列數(shù)據(jù)。
不適用的情況
干預(yù)是漸進(jìn)的:如"慢慢推廣"的干預(yù),沒有明確的中斷點(diǎn)。
干預(yù)前數(shù)據(jù)太少:只有3-5個(gè)點(diǎn),無(wú)法建立可靠的趨勢(shì)線。
結(jié)局指標(biāo)劇烈震蕩:如周數(shù)據(jù)受節(jié)假日?qǐng)?bào)告延遲影響極大,基線不穩(wěn)定。
群體發(fā)生了改變:干預(yù)前后監(jiān)測(cè)人群結(jié)構(gòu)發(fā)生巨變(如大規(guī)模人口遷入),反事實(shí)外推失效。
![]()
![]()
編輯:普通疾控人 | 審核:詩(shī)酒趁年華
文章來(lái)源 | 原創(chuàng)
說(shuō)明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來(lái)自公開網(wǎng)絡(luò)
轉(zhuǎn)載請(qǐng)注明
再次轉(zhuǎn)載請(qǐng)注明出處
![]()
科普健康 | 宣傳疾控
本號(hào)為多位疾控機(jī)構(gòu)從業(yè)者運(yùn)營(yíng)
重點(diǎn)關(guān)注國(guó)內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時(shí)
做好疾控機(jī)構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說(shuō)明
本文為原創(chuàng)內(nèi)容,文章為個(gè)人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號(hào)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.