作者:陈双双,王新强,赵嘉文,张永忠,阚晓红
第一作者及单位:陈双双,安徽省胸科医院(省结核病防治研究所)科教科
通信作者及单位:阚晓红,安徽省胸科医院(省结核病防治研究所)科教科/安徽医科大学公共卫生学院流行病与卫生统计学系
Application of the ARIMA Model in Forecasting the Incidence of Tuberculosis in Anhui During COVID-19 Pandemic from 2021 to 2022
Chen S, Wang X, Zhao J, Zhang Y, Kan X.
Infect Drug Resist, 2022,15:3503-3512.
doi: 10.2147/IDR.S367528.
PMID: 35813085.
背 景
结核病是由结核分枝杆菌引起的一种慢性传染病,最常累及肺部。根据《2020年全球结核病报告》显示,2019年全球有710万例结核病新发患者,2020年中国结核病患者数估计为84.2万例,发病率为59.00/10万。全球30个高结核病负担国家中,中国结核病估算发病率排名第二,仅次于印度。尽管全球结核病发病率每年下降1%~2%,但它仍然是许多发展中国家的主要公共卫生问题。
由于人口聚集、文化、宗教、气候和一些节日的影响,结核病的登记报告数往往呈现出某几个月病例数较高的趋势。因此,探索结核病的发病规律和趋势,建立结核病防控的准确预测模型具有重要意义。
自回归积分移动平均(autoregressive integrated moving average ,ARIMA)模型是20世纪70年代提出的时间序列分析工具,是基于过去数据序列的拟合值来推断未来疾病的发病趋势,目前已被广泛用于疟疾、流感、手足口病等传染病的早期预警中,是最常见的预测模型之一。ARIMA模型共有5种表达方式,即AR(P)、MA(q)、ARMA(p,q)、ARIMA(p,d,q)、ARIMA(p,d,q)×(P,D,Q)s。
方 法
1. 数据收集:从中国疾病预防控制中心(CDC)运营的在线结核病管理信息系统(TBIMS)中收集安徽省2013年1月至2020年12月所有新诊断的结核病患者发病数据。肺结核诊断根据中华人民共和国国家卫生健康委员会发布的《WS 288—2008肺结核诊断标准》。
2. 分析方法:采用传统的流行病学方法描述登记结核病患者的三间分布及流行病学特征。使用2013年1月至2020年6月的结核病月发病率构建ARIMA模型,再使用2020年7—12月的实际发病率来评估预测模型的准确性。采用Ljung Box试验、Akaike信息准则(AICc)、贝叶斯信息准则(BIC)和相对误差等方法评价模型拟合和预测效果,最后用最优模型预测2021年和2022年结核病的预期月发病率,以了解结核病发病趋势。
结 果
1.流行趋势:2013年1月1日至2020年12月31日,安徽省共登记结核病患者255 656例,年均发病率为54.15/10万,范围为40.60/10万~62.90/10万。具体见图1。
图1 2013—2020年安徽省结核病月发病率的时间序列
2.时间分布:2013—2020年不同月份的结核病患者登记报告数如图2所示,3月份是结核病发病的高峰期,2月份是低谷期。
图2 2013—2020年不同月份的结核病患者登记报告数
3.地区分布:从2013—2020年,安徽省登记结核病的年发病率排名前三位的依次为铜陵(71.97/10万)、池州(59.93/10万)和淮南(58.36/10万)。报告的年发病率最低的依次为阜阳(46.55/10万)、宿州(46.09/10万)和黄山(21.31/10万)。具体见图3。
图3 2013—2020年安徽省结核病年均发病率的地区分布
4. 人群分布:汉族是安徽省结核病报告患者数最多的民族,男女比例为2.59:1。2013—2020年男性结核病患者占比为72.17%、女性为27.83%,表明结核病对男性的影响更大。此外,66~75岁年龄组的比例最高,其次是56~65岁,15岁以下的比例最低。
5.ARIMA模型:一阶差分后ADF(augmented dickey-fuller)检验表明P值为0.01,表明数据是平稳的(图4),原始数据差分一次后的ACF和PACF图见图5。通过ACF和PACF图,初步确定模型为ARIMA (0,1,1)(P,1,Q)12。根据最小AICc值和BIC值原则,我们选择ARIMA(0,1,1)(0,1,1)12为最优模型。
图4 2013年1月至2020年6月安徽省结核病发病率数据一阶差分后的时间序列
图5 一阶差分后的ACF(A)和PACF(B)图
6.模型的准确性:所有月份(9月除外)的实际数据与预测值之间的误差均<10%。且所有月份的实际数据都包含在预测值的95%置信区间内(表1),表明本研究中的ARIMA模型的预测精度较高。
表1 2020年7—12月真实值与预测值的比较
7.模型的预测:使用ARIMA模型预测安徽省2021年和2022年月结核病发病率,具体结果见表2和图6。
表2 安徽省2021年和2022年预测月结核病发病患者数
图6 ARIMA模型预测安徽省2021年和2022年结核病月发病率的80%和95%置信区间
结 论
铜陵、池州、淮南应加强结核病防治措施。特别是政府部门应更加重视和预防老年人群的结核感染。另外,由于采取了不同的新型冠状病毒肺炎(COVID-19)防疫政策,以及重新分配了许多医疗资源等措施,使得COVID-19大流行期间结核病的登记发病率有所下降。ARIMA模型可以成为预测未来结核病患者数的有用工具。本研究为相关疾病控制部门制定防控措施、减轻结核病疫情给社会的负担提供了参考。
注:除非特别声明,本公众号刊登的所有文章不代表《中国防痨杂志》期刊社观点。
供稿:陈双双
编辑:孟 莉
审校:范永德
发布日期:2022-08-04
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)