原标题:我们分析了10省份疫情通报信息,广东四川数据公开质效较高
来源:21世纪经济报道
在不侵犯患者个人隐私的情况下,疫情信息披露数据项较多的,如有广东、四川、北京、广西等,几省份平均每次通报信息中,从文本字段中可以过滤约10项可读数据。
新型肺炎实时滚动数据显示,截至1月24日16时16分,国内省(区、市)累计报告新型冠状病毒感染的肺炎确诊病例887例,治愈35例,死亡26例。
颗粒度精细的数据,有助于读取疫情流散特征,比如此次疫情中确诊病例发病前到过的具体地点。公开各医院接收确诊病例的详细数字,也可帮助疏导医院接诊压力。然而,目前各省份针对新型冠状病毒感染肺炎确诊病例的信息通报口径并非完全统一,公开数据的完整性和透明度参差不齐。
南都大数据研究院数字政府研究中心圈定此次新型肺炎疫情截至1月24日12时确诊病例超过10人的十个省份(湖北、广东、浙江、北京、上海、湖南、安徽、重庆、四川、广西)以及爆发确诊病例最多的武汉市为样本,设立“是否披露确诊病例来源地、是否披露密切接触者数量”等12项指标,梳理比较各省、市出现第一起确诊病例以来疫情信息公开详细度、透明度,从中透视各省有关部门在此次疫情中对信息与数据的处理与公开能力。
多个省份卫健委官网及微信号均披露病例数据
目前,广东、上海、湖北、浙江、北京、湖南、安徽、重庆、四川、广西等10省份卫健委官网及微信公号均披露了疫情病例数据,广东、上海等地卫健委官网披露信息较早。
而在省政府官网及两微渠道疫情病例公布上,截至2020年1月23日,10省份皆已发布新型冠状病毒感染肺炎确诊病例人数。
疫情确诊病例通报中广东、四川、北京数据公开质效较高
截至1月24日12时,国内29个省份相继公开了新增及累计确诊病例信息,广东、上海通报疫情频次较多,从首次通报至统计时间均达到6次。
并非每一份公示都会披露新增病例的详细情况。样本省份卫健委官网截至1月24日12时发布的近40份感染肺炎确诊病例信息中,除了均披露新增确诊病例外,超九成披露了统计截止日期、累计确诊数量,超七成披露了确诊病例分布地市/区、确诊病例病情状态、治疗情况、感染原因,而披露了确诊病例户籍、确诊病例首发病症、确诊病例密切接触者数量等信息的通报则不足五成。在不侵犯患者个人隐私的情况下,疫情信息披露数据项较多的,如有广东、四川、北京、广西等,几省份平均每次通报信息中,从文本字段中可以过滤约10项可读数据。
如果将“信息通报频次”和“每次通报数据项数”通过标准化加权计算形成“信息质效”进一步评估,会发现广东、四川在此次各省疫情信息通报“质量与效率”相对较高。例如,很多在他省疫情通报中未能全面展示的数据,如“累计确诊病例”的性别、年龄、发病原因、疫情聚集特征等,在广东多次通报中都有呈现。
同时值得注意的是,在接下来疫情信息通报中,各省份在“数据完整性”“结构化”“数据格式”等数据质量标准上还有优化空间。另外,在通报渠道方面,除了省卫建委、省政府官网、两微之外,统一的政府数据开放平台也可成为数据公开与透明的媒介。
*以各省卫健委官网首发(不含转载)确诊病例信息为统计口径;信息质效=(标准化平均数据项*0.8+标准化透明度*0.2)*100,满分为100,平均数据项以各省首次披露疫情数据以来每次通报平均披露数据项数计算,透明度以各省疫情披露频次计算;统计时间截至1月24日12时。
广东等五省份最新通报披露了密切接触者数量
具体分析各省疫情通报在每一细项的表现,以10省份1月24日截至12时最新通报的疫情信息为例,均涵盖了“统计截至日期”“新增确诊病例”两项。
在确诊病例来源地分布方面,北京、四川、广东等地公布了比省一级更为详细的来源地,如广东披露了广州、深圳、珠海、佛山等9个地市的确诊病例数据,但上海目前未公布累计确诊病例的具体行政区分布。
确诊病例的年龄也是此次疫情中的关注焦点,从中或可推测易感年龄群。但梳理发现,上海、湖北、浙江、重庆、安徽、广西等地在最新通报中并未提及全部确诊病例的年龄。
除上海、安徽、湖北、重庆、广西外,其余省份还披露了感染的主要原因,如是否曾有武汉旅行史等,但未见更详细感染原因,比如在武汉停留时长,停留地等。
值得一提的是,广东、湖北、重庆、安徽、广西五省份最新通报均披露了具体的密切接触者数量。
*最新疫情通报统计时间截至2020年1月24日12时;统计口径为除截至日期、新增、累计确诊病例外,“是否可通过披露信息直接或间接计算累计病例数”。
随疫情发展,部分省市通报疫情信息详细度发生明显变化
我们同时梳理此次疫情重灾区——武汉市卫健委官网对新型肺炎疫情的通报信息,发现针对新型肺炎首次疫情通报时间是2019年12月31日,截至到2020年1月21日,24天共发布疫情通报信息16次,通报涉及病例统计最新时间为截至1月20日24时。1月22日起,武汉市新型冠状病毒感染的肺炎情况由湖北省卫健委统一通报。
武汉市卫健委官网上16次疫情通报中,只有“确诊病例新增数量”以及“病例患者目前状态”两项较全面,每次通报均会涉及,其次是“密切接触者数量”、“累计确诊数量”以及“病例患者治疗情况(是否隔离)”也较详细。相比之下,通报中提到确诊病例的首发病症、性别、年龄等信息不多,16次疫情通报中不到三成,直到1月19日,通报信息详细程度开始提升,增加披露了部分患者性别、年龄、首发病症等信息。
*截至1月21日,武汉市卫健委官网16次疫情通报信息中涉及具体项,占比越大说明该项披露次数越多。
分析还发现,随着疫情发展,部分其他省市通报疫情信息详细度也发生明显变化,如北京市卫健委官网疫情通报信息的从第3次开始使用简洁明了表格结构化数据,包括新增病例的年龄、性别、是否有湖北接触史、是否有其他省份接触史以及发病时间、初次就诊时间等。广东疫情信息通报从第五次开始还特别点明了疫情扩散特征及数量,最新通报披露“累计发现聚集性疫情10起,均为家庭聚集”。
但遗憾的是,除死亡病例、新增病例信息披露相对较多外,相关省市对目前确诊病例的“发病具体缘由、入住医院名称”等信息公开还存在优化空间。发生疫情时,公众需要的不仅仅是更新的确诊数字以及政府的应急办法,和病例相关的详细医疗信息进展,在不侵犯患者个人隐私的前提下,也值得开放。尤其是,通过及时的、结构化的、完整的、可机读的方式开放,可更有效地满足公众迫切需求,提升政府公信力透明度,促进问题的解决。
中央党校(国家行政学院)教授周文彰在《数字政府和国家治理现代化》的文章中提出,“推进国家治理现代化的着力点当然不仅仅是数字政府建设,但数字政府建设一定是推进国家治理现代化的重要途径”。他在文中说,数字政府是信息化政府,是管理网络化政府、是政务公开化政府。公开透明是法治政府的基本特征……这是保障公众知情权、参与权、表达权和监督权,增强政府公信力、执行力,提升政府治理能力的制度安排。
出品:南都大数据研究院数字政府研究中心