GM(1,1)模型的优化及其在乙肝发病预测中的应用研究

作者:许小珊;孙娜;杜彦春;李望晨;王素珍;石福艳; 刊名:中国卫生统计 上传者:王理申

【摘要】目的通过对传统GM(1,1)模型优化,并探讨优化后的GM(1,1)在乙肝发病预测中的应用,为乙肝防治提供科学依据。方法对传统GM(1,1)建模的维数、背景值和初始值进行改进,通过比较不同模型对2007-2017年全国乙肝发病率数据拟合效果,选择最优模型外推预测2018和2019年乙肝发病率。结果优化组合模型拟合精度最优,可选其预测我国2018和2019年乙肝发病率。结论优化组合GM(1,1)拟合效果理想,预测精度高,可用于乙肝发病预测。

全文阅读

中国疾病预防控制中心法定传染病报告显示,病毒性乙型肝炎报告发病人数一直处于乙类传染病首位。且有研究表明,HBV感染不仅是干细跑癌的重要危险因素,还与B细胞恶性肿瘤之间存在相关性[1],故做好乙肝预测预警工作意义重大。近年来,灰色GM (1,1)模型已被多次应用于乙肝流行趋势的预测[2-3]。但传统模型预测精度往往不易达到要求,故本研究拟对传统GM(1,1)模型的建模维数、背景值和初始值方面改进,尽量弥补传统模型的缺陷,并采用构建的优化组合GM(1,1)模型预测我国2018-2019年乙肝发病率,为乙肝防治提供科学依据。资料与方法1.资料来源本研究资料来源于中国疾病预防控制中心2007-2017年乙型肝炎发病资料及人口资料[4],详见表1。表1 2007-2017年全国乙型肝炎发病率(1/10万)年份2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017发病率88. 55 88. 07 88. 39 79. 09 81. 15 80. 29 70. 77 68. 41 69. 96 68. 74 72. 612.模型构建方法(1)构建GM(1,1)的前提条件根据级比σt=Xt-1Xt是否在区间(e-2n+1,e2n+1)中,判断原始数列Xt是否可建模。(2)传统GM(1,1)预测模型构建步骤[5](1)已知原始非负数列Xt=X1,X2,…,Xn(t=1,2,…,n),Xt一次累加数列Yt和均值数列Zt:Yt=∑Xt(1)Zt=(Yt+Yt-1)/2 (2)(2)Yt的白化微分方程:dYt/dt+αYt=u (3)其中,α为发展系数,负值反映发展趋势是增长的,正值反映发展趋势是衰减的;绝对值越大,则增长(或衰减)越快。u为灰色作用量,其大小反映因子作用的强弱,即数据变化的关系。根据最小二乘法估计:^α=(BTB)-1BTλt(4)其中B=-Z21-Z31-Zt???????????1?,λt=X2X3X????????????n(3)由式(3)、(4)得时间响应函数为:^Yt(t+1)=(X1-u) e-αt+u/α(5)(4)计算Xt的估计值^Xt=^Yt-^Yt-1(t=1,2,…,n)(6)(3)最优建模维数传统GM(1,1)模型对建模维数不作要求,但不同维数的灰色模型,其预测值也不一定相同[6]。为了提高模型的预测精度,本研究以2007-2016年全国乙肝发病率数据为例,以时间序列最后一个数据为基础分别建立4~10不同维数模型,通过比较各模型对2017年发病率的预测效果和模型的精确度,以选择最优的建模维数。(4)背景值和初始值的改进由传统GM(1,1)模型构建过程可见,背景值假定是由一次累加生成序列的紧邻等权生成,即权重u=0. 5,樊新海[7]等学者认为没有理由证明u=0. 5时模型的预测精度最高,故采用自动寻优定权的方法选择u值,即给定一接近于零的初始权u=0,计算在该权值下的模型预测精度,然后令权值有一微小的增量u=u+Δu,重复上述过程,直到u=1,即可得到不同权值下模型的预测精度,取预测精度最高时的权值作为最佳权值。另外,杨华龙[8]对模型的初始值也进行了改 进,其认为数据序列中的每一个数据都带有一定的随机误差,不能将第一个或最后一个原始数值作为初始 值,具体推导过程参考相关文献[8],此处只给出初始值C和时间响应函数:C=(X1-uα)(1-eα)-1+∑nt=2Xte-a(t-1)(1-eα)-2+∑nt=2e-2α(t-1)(7)^Yt(t+1)=C (1-eα)

参考文献

引证文献

问答

我要提问