联系方式

电话:0755-86392209

邮箱:jl.wang2@siat.ac.cn

地址:深圳市南山区深圳大学城学苑大道1068号

深圳先进院等利用大数据分析人口迁移与复工时间对深圳市新型冠状病毒感染肺炎疫情的影响

  目前,新型冠状病毒感染肺炎(以下简称新冠肺炎)造成的疫情仍然形势严峻。根据丁香园的新冠肺炎疫情通报,到2020年2月17日晚间,新型肺炎全国累积确诊病例数达到70643人,死亡总数达到1772人,目前已有11182人治愈。确诊人数目前还处于上升趋势,但趋势略有放缓。


为准确地预测疫情的发展趋势,多种流行病传播模型已被应用于疫情的防控,例如回溯传播模型、元胞自动机、时间序列模型、逻辑回归模型等。其中,以动力学模型为典型代表,国内外多个研究团队针对全国病例数增长进行了建模并分析了疫情走势。由于目前中央及各地政府均采取了相应的干预政策来防止疫情进一步扩散,疫情发展严重的各地也采取了“封城”或“封区”等限流政策,传统的动力学模型需要根据政策进行优化。另一方面,随着春节假期结束,全国多地陆续出台了预期返工的时间,因此考虑跨省市的人口流动数量及时间因素进行区域性的疫情走势建模分析也是极为必要的。传统的动力学模型只适用于人口数目较为确定的相对封闭的系统,无法满足对此情形的建模需求。

  

    针对深圳的疫情发展实际情况,尤其考虑到深圳作为人口迁移大市,中国科学院深圳先进技术研究院数字所与华为AI应用研究中心、西安交通大学公共卫生学院合作,利用互联网人口移动数据(百度迁徙)对新冠肺炎的输入性疫情发展情况进行了建模。通过拟合深圳的历史发病数据,对深圳市输入性病例的疾病动力学进行了定量的表征。此外,由于疫情发展对于深圳市的生产生活具有重大影响,研究人员进一步利用模型对不同复工方案下疫情的未来发展进行了仿真模拟。在模型中重点模拟了三种人数:累计感染者人数、未隔离感染人数(反映当时可能造成传播的感染者数量)、累计迁入感染人数(反映迁入深圳后发病的一代感染病人数量)。


对于深圳市而言,建模的结果显示:如果深圳对返程人口的防控措施继续维持在当前的严格状态,并且市民继续保持当前的高口罩使用率而不松懈,那么,由于目前深圳本地疾病传播性和输入病例数量已经处于较低水平,各延迟开工方案对于疫情发展的影响相对较小。与之相对,深圳未来疫情的发展仍将受到湖北疫情发展与开城时间的较大影响。具体而言,如果假设湖北3月1日开城且彼时仍有较高的潜伏期发病人口,深圳可能在3月中下旬迎来第二波输入型感染高峰。


本文中提出的模型In-time Population Transfer corrected SEIJR(T-SEIJR)对本次新冠肺炎疫情的发展趋势分析,尤其是省级和人口较多的大城市具有一定的参考价值,也可以在其他城市中进行推广分析。




T-SEIJR模型


 

   基于传染病动力学SEIJR模型,我们可以大致描述传染病的传播过程。该模型将人群区分为不同的感染状态,包括S(易感人群)、E(潜伏期人群)、I(感染未隔离人群)、J(感染隔离人群)、R(康复人群)和D(死亡人群)。这些人群按照一定的动力学规则互相转化。通过拟合模型的模拟值和实际观测值,我们可以对模型的动力学参数进行估计,从而在一定程度上反映现实的疾病传播状态。


在上述SEIJR模型的基础上,我们根据深圳市具有大量输入性病例的特点,加入了人口迁移这一重要影响因素,构建了T-SEIJR模型(图1左)。具体而言,考虑了1月1日以来,来自各地的人流带来的可能传播源,作为深圳市疫情传播的主要起点(注:在1月26日以后,结合深圳市的实际防控措施,模型不允许有症状感染者进行流动;另外,考虑到湖北封城的影响,现阶段初步假设湖北来深人口的高峰在3月1日之后)。因此,我们的模型能够响应由于人口输入带来的疾病发展变化。

                                                                                                    微信图片_20200720111920.jpg

 

图1. T-SEIJR模型示意图


   在SEIJR的模型基础上对人口迁移、分段复工和传播率进行了细致的模拟。在人口迁移中,模型考虑了湖北、非湖北的流入和深圳市的流出,以及同时深圳总人口的变化效应。传播率模型则综合了分段复工导致的人们平均每天“密切接触”者数量的变化以及口罩等防控措施造成的人际传播变化。


除了人口流动因素,该模型还考虑了口罩使用与人际接触对于疾病传播的影响。在模型中,我们用一个多项分布刻画人际接触造成的传播概率,同时纳入了人际接触次数和每次接触传播概率两个变量(图1,传播率模型)。模型假设:在疫情发生后,口罩使用率的上升能降低每次人际接触造成的传播概率,并且绝大多数市民在疫情结束前将继续维持佩戴口罩的习惯;此外,即将迎来的复工则会增加人与人接触的频率,从而影响疫情的进展。


对于春节后的复工情况,该模型对几种预设的分段复工方案可能导致的疫情进展行了评估。在模型中,复工主要表现为在某一时间点人际接触的突然上升,从而导致传播率的突然提高(图1中分段复工模型)。




深圳疫情与人口迁徙分析



根据从深圳市政府数据开放平台获得的每日新增确诊病例个案详情,我们梳理了深圳市新冠肺炎个体病例的发病时间、来深时间、入院时间、治愈时间等相关信息,作为模型拟合的目标。


上述病例数据表明,在深圳的早期疫情中,来自外地的输入性病例占据了大部分。根据病例个案详情中的记载进行估算,在截止2月13日发布的400例病例中,外地输入的一代病例约53%,这些病例来深后产生的二次传播病例(主要是家庭内传播)占比30%,剩余病例约占16%。基于这一数据,可以初步发现深圳市的疫情传播总体处于较低水平,且从结构上看以输入病例和输入后的家庭内传播为主,其余的传播较为有限,这也反映了截止目前防控措施的有效性。


本研究是基于百度迁徙的数据基础上进行的分析,虽然这一数据无法完全覆盖过去一个月深圳的所有人口流动,我们在建模中认为百度样本大致反映了人口流动的趋势和比例。分析显示,1月全国来深人数随着春节的临近逐渐下降(图2左),而湖北省来深人数在1月25日左右(武汉封城后)出现了一个高峰,同时深圳累计输入病例亦持续上升(图2右)。

                                                                                                微信图片_20200720112808.jpg


图2. 湖北(左)与非湖北(右)各日来深人数与累计迁入发病人数

(注:来深人数按1/40以及1/4000比例显示,人口迁移数据根据百度迁徙估计)




深圳市疫情趋势模拟



通过参考全国发病情况和上述统计数据,拟合深圳市发布的病例情况,我们对模型的各动力学参数进行了校准。总体而言,校准后的模型能较好的反映深圳市的疫情发展情况(近五天平均误差<1%,图3),并且对迁入病例数量也取得了良好的拟合效果。在下文中,我们将从深圳复工效应和湖北疫情影响两个方面对模型模拟的结果进行说明。


首先,为了分析深圳后续复工可能对疫情产生的影响,我们在模型中引入了相关的参数进行了模拟。具体而言,根据各产业对于民生保障和经济发展的重要性,将所有行业分为了4类(表1),在保障民生的前提下,并根据某些行业可以居家办公的特性,我们提出了几套不同的分批次复工方案(表2),并利用模型模拟了不同时间(2月10日、17日、24日和3月2日)全面复工的方案对于深圳市疫情的影响。


其次,作为疫情的重点区域,湖北省的疫情情况对于深圳市也存在重要的影响。湖北后续开城时(目前假设为3月1日)的感染情况将影响复工后新进入深圳的外来感染者数量,因此对深圳疫情发展的影响也存在不可预知的风险。为了反映这个风险因素,我们在模拟时假设了湖北省疫情发展的两种情况(3月湖北发病率风险高、3月湖北发病率风险低), 并模拟了其对深圳市疫情的影响。此外,该模型也同时考虑了非湖北迁入人流对输入病例的动态影响。


微信图片_20200720112914.png

表1. 行业分类


微信图片_20200720112923.png

表2. 六种分批次复工方案

  微信图片_20200720112808.jpg

图3. 不同的湖北疫情假设下,各复工方案对应深圳市新冠肺炎累计感染人数与未隔离感染人数的变化趋势

如图3所示,首先,在各复工方案下,对应的感染人数并未出现显著的差异。从模型的角度分析,由于假设继续维持当前对返程人口的严格防控措施,并且假设市民继续维持当前的高口罩使用率而不松懈,那么,复工造成的人际接触增加对于病毒的有效传播不明显,提示了返程人口严格防控与市民自我保护的延续在复工过程中至关重要。需要注意的是,该模型仅关注了静态空间(例如,家与工作地等)的疾病传播,例如,假设开工会造成某一行业从业者的“密切接触”人数会比开工前的家庭密切接触扩大3倍,并没有考虑使用公共交通工具(例如,地铁与公交等)等造成的传播。根据测算,各种延迟复工方案预计造成0.6%-2.6%的全年GDP损失。


通过模拟3月湖北开城时的感染情况,我们发现在目前的交通条件和感染防护下,这一因素对于深圳市3月之后的输入型感染依然具有重要的影响。如果湖北在未能完全消除潜伏感染者风险(模型中已经假设有症状的感染者无法迁徙)的情况下即告开城,可能会导致深圳的未隔离感染人数在3月下旬出现第二高峰,感染规模将与第一波感染类似。



结语


通过上述的建模分析,我们对深圳市的输入性新冠肺炎疫情有了一定的定量认识。结果提示:


1. 在目前人口流动及全国发病率的情况下,如果深圳市能够继续维持当前对返程人口的严格防控措施,并且市民继续维持当前的高口罩使用率而不松懈,各种分批次复工方案对于深圳市的疫情发展影响较小,在严格的防控措施下有序推进复工有助于减少经济损失。需要注意的是,该模型暂未考虑使用公共交通工具(例如,地铁与公交等)等造成的传播,因此,复工后对公共交通工具的使用还需加强防控措施。


2. 输入性病例仍然是深圳市当前及下一阶段的防控重点。模型情境性分析显示,如果湖北3月1日开城,并且开城时仍有较高的潜伏期发病人口,则深圳可能在3月中下旬迎来第二波输入性感染高峰。


随着疫情的继续发展和各类数据的进一步完善,我们可以通过调整建模策略和模型参数给出更优的建模结果。希望这项研究呈现的各项数据和发现可以为有需要的人员提供一定的参考,也欢迎大家反馈指正。


上述研究成果由中科院深圳先进技术研究院、华为公司、西安交通大学等多家单位科研人员共同完成,核心成员包括:

中科院深圳先进技术研究院数字所:沙沣、尹凌、王如心、李烨

华为AI应用研究中心:鲁浩楠、胡海林、温雨金、郭秀焱、彭伟、刘陈魏

西安交通大学公共卫生学院:张磊、沈明望


参考文献:

[1] Shen, M., Peng, Z., Xiao, Y., & Zhang, L. (2020). Modelling the epidemic trend of the 2019 novel coronavirus outbreak in China. bioRxiv.

[2] Brockmann, D., & Helbing, D. (2013). The hidden geometry of complex, network-driven contagion phenomena. Science, 342(6164), 1337-1342.

[3] 深圳市政府数据开发平台:https://opendata.sz.gov.cn/data/dataSet/toDataDetails/29200_01503668

[4] 百度迁徙:https://qianxi.baidu.com/


供稿/健康大数据智能分析技术国家地方联合工程研究中心


版权所有 © 生物医学信息技术研究中心:Copyright © 2014-2014 粤ICP备12208465号-5

技术支持 :深圳网站建设(佰达科技)