2023-01-10
2022年1月10日,复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院发布了“2022年度中国开放数林指数”和《中国地方政府数据开放报告》(含省域版和城市版)。
开放数据,蔚然成林,“中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品。自2017年首次发布以来,定期对我国地方政府数据开放水平进行综合评价,精心测量各地“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。2018年以来,“中国开放数林指数”为国家互联网信息办公室信息化发展局监测我国公共信息资源开放情况提供数据支持。
平台数量持续增长
截至2022年10月,我国已有208个省级和城市的地方政府上线了政府数据开放平台,其中省级平台21个(含省和自治区,不包括直辖市和港澳台),城市平台187个(含直辖市、副省级与地级行政区)。目前,我国74.07%的省级(不含直辖市)和55.49%的城市(包括直辖市、副省级与地级行政区)已上线了政府数据开放平台。
与2021年下半年相比,新增15个地方平台,其中包含1个省级平台和14个城市平台,平台总数增长约8%。全国地级及以上政府数据开放平台数量持续增长,从2017年的20个到2022下半年的208个。
截至2022年10月,全国各省域政府数据开放平台的整体上线情况如下图所示。平台包括省(自治区)本级和省内下辖地市,图中颜色越深,代表该省域政府数据开放平台的整体上线程度越高。目前,广东省、广西壮族自治区、江苏省、江西省、山东省、四川省与浙江省的省(自治区)本级和下辖所有地市都已上线了数据开放平台(图中显示为全境深绿色的省域)。从整体上看,东南沿海和中部地区的政府数据开放平台已经基本相连成片。
数林奖项出现黑马
报告展示了2022年度全国省域开放数林的指数分值、排名和等级。山东省和浙江省的综合表现最优,获得省域“数开繁盛”大奖;贵州省也总体表现优秀,获得省域“数开成荫”奖。在四个单项维度上,山东省在利用层位列第一,浙江省在准备度和数据层位列第一,贵州省在平台层位列第一。
报告还展示了2022年度全国城市开放数林的指数分值、排名和等级。德州市和杭州市的综合表现最优,获得城市“数开繁盛”大奖,与去年相比进步迅速,成为年度“黑马”;上海市、日照市、青岛市也表现优秀,获得城市“数开成荫”奖。在四个单项维度上,全国所有187个城市中,上海市在准备度、平台层和利用层上都位列第一,德州市在数据层位列第一。
四个直辖市开放数林指数分值和排名如下表所示,上海市综合表现最优,位列第一。
副省级开放数林指数排名前十的地方如下表所示,杭州市综合表现最优,位列第一,青岛市和深圳市也表现优异。
地级开放数林指数排名前十的城市如下表所示,德州市综合表现最优,位列第一,日照市、烟台市、潍坊市和温州市等地也表现优异。
整体上,在省域中,山东省与浙江省持续保持在“第一数级”的领先地位,山东省的省本级和下属地市近年来齐心协力持续进步,今年首次名列全国第一;在城市中,部分中小城市异军突起,实现了超越,如德州市与日照市进入了前五。与此相对应的是部分传统强市出现了上升瓶颈,进步较小甚至有些许退步。
没有躺赢,都是天道酬勤。这些进步较大的地方,主要得益于当地政府对数据开放工作长期持续的重视和积累,不断优化和提升了数据开放工作的方向与方法。还有一些进步迅速的城市除了依靠自身努力,还得益于省级层面对地市在政策、管理和技术多个方面的统筹推动和赋能助力,最终实现了省市双赢。
数据开放是场马拉松
数据开放是一场马拉松,而不是速滑赛,不在于一个地方是否跑得早、跑得急,而在于这个地方能否跑得长、跑得久,能持续稳定地向社会提供优质数据,并坚持不懈地推动开放数据的开发利用。报告继续通过“数林匹克”四年累计分值,反映一个地方在过去四年(2019年-2022年)开放数据的持续水平。
报告展示了2019-2022省域“数林匹克”累计分值排在前十名的地方,浙江省分值最高,其次是山东省、贵州省和广东省。
报告还展示了2019-2022城市“数林匹克”累计分值排在前二十名的地方,上海市分值最高,其次是深圳市、青岛市、贵阳市和济南市,分值都在220分以上。
指标体系动态调整
开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会,以体现跨界、多学科、第三方的专业视角,并每年根据最新发展态势和重点难点问题进行动态调整。2022年起,开放数林指数由每年评估两次,调整为上半年公布当年经调整后的指标体系初步框架,下半年发布评估结果及标杆案例。
针对我国政府数据开放工作目前仍存在不充分、不协同、不平衡、不可持续等问题和挑战,2022年开放数林指标体系重点围绕协同联动、普惠包容、精准务实、安全保护、持续长效等基本理念和方向,由政府数据逐步向公共数据扩展,聚焦企业注册登记、交通、气象与卫生等四个重点领域,特别关注各地数据开放工作的整体性和协同性、数据开放的无歧视原则、安全保护与依法合规利用、以及数据开放工作的重点聚焦和持续发展,继续对数据开放的准备度、平台层、数据层和利用层四个维度开展评估。其中,准备度是“数根”,是数据开放的基础;平台层是“数干”,是数据开放的枢纽;数据层是“数叶”,是数据开放的核心;利用层是“数果”,是数据开放的成效。
2022中国开放数林指数评估指标体系
(省域)
2022中国开放数林指数评估指标体系
(城市)
开放数林中的“啄木鸟”——体验官
值得一提的是今年的评估过程中在平台层首次引入了体验官。数据开放平台是直接服务于用户的第一“界面”,各种功能的建设运营归根到底是为了给数据利用者带来更好的体验。平台做得怎么样、有没有用、好不好用,用户比管理方更有发言权。
在之前的评估中,观察员会按照经过专家委研讨和调整之后确定的指标体系,比照着这个“理想中的好平台”,对现实中的各个平台进行评测,虽然在指标的设计中已经努力融入了用户的视角,但与真正的用户体验之间可能还有一段距离。
为了走完这一段距离,今年报告在评估方法上真正把用户请了进来,也就是新增的“体验官”。这些体验官都对数据开放和利用有着浓厚的兴趣,但同时又对数据开放平台不那么了解,是平台的“小白”用户,他们其实是多数开放数据平台的用户的写照,这些人或许是数据领域的爱好者甚至专家,但并非使用数据开放平台的专家,当然也完全没有必要成为平台专家,因此也常常会因为平台功能和运营上的“缺陷”而受阻。
因此,在实际测评过程中,这些“体验官”们并没有被布置任何必须评估或者不能评估的指标,而只是被安排了数据发现(在平台上找到数据)和数据获取(从平台上拿到数据)两个大方向上的任务,然后在这两个大方向下,体验官们可以以一种“打怪通关”完成任务的形式去探索和体验平台的各项功能和实际运营水平。他们发现的“缺陷”可能是学术论文中都还未被发现的,也可能是专家们都还没有注意到的,但却实实在在地影响了用户的体验。同样,有些平台开发的一些能明显提升用户体验的“小创新”,往往也是文献资料无法告诉我们的,却被我们的体验官找出来了。
开放数林中的惊喜与失望
“中国开放数林指数”发布至今已六年。六年来,社会各界对利用公共数据的需求日益增长,我国各级各地政府对数据开放工作的重视程度和推进力度也不断提升,全国各地政府数据开放平台数量显著增加,数据开放数量与容量也已初具规模,数据开放已成为数字政府建设的重要组成部分,“开放数据,蔚然成林”的愿景正在逐步实现。
在2022年度的评测中,指数制作方明显发现了一些惊喜之处:
一是越来越多的地方制定了专门的年度数据开放工作计划,并列明了计划开放的数据集名称和字段,同时规定了各项工作计划的完成时间,对具体实践具有较强的指导和监督作用。例如,浙江省公布了包含下辖地市的开放清单,并在清单中明确列出了数据来源、数据字段、开放属性、更新时间等具体内容。
二是部分省域和地市,如山东省、江苏省以及杭州市、日照市等10多个地方将数据开放写入当年政府工作报告中,体现出这些地方对数据开放工作的重视程度。
三是大多数平台在平台功能方面越做越好,虽然评测的标准逐年提高,但各地的表现也越来越好,例如数据发现预览相关的功能。
四是企业注册登记、交通、 气象和卫生四个重点领域开放的数据集在质量上优于整体开放数据集的平均质量,尤其是一些中小城市开放出了更多更高质量的数据。
五是多数城市除了开放政府部门的数据外,也开始开放来自国企与事业单位的公共数据。
六是各地组织了更多、更丰富的促进开放数据利用的活动,如线上征集数据需求,线下组织推广宣传活动等,对扩展数据开放影响力,提升社会利用数据参与度具有重要作用,例如,上海SODA大赛设置了英雄帖,让企业参与到赛事组织中,提供数据,发布赛题,从而使开放数据比赛产出的成果更有针对性与现实意义。
与此同时,在评测过程中也仍然有一些失望之处:
一是虽然越来越多的地方出台了法规政策,有些甚至已经形成了完备的数据开放法规政策体系,但其中对实际工作能起到关键务实的推动作用的内容还不多,例如,缺少对社会各主体平等无歧视获取数据、对社会主体权益进行保护等方面作出具体要求。
二是一些地方虚假地应付用户,做表面工夫。如:有些地方平台上对用户所有的反馈都采用模板式的回应,在用户请求开放的是平台上已经提供的数据时,仍回复“您的需求已经收到,会考虑加入到未来的开放清单”;有些地方开放的数据实际质量低,甚至以虚假的、无法理解的数据填充内容;甚至有些平台将一些数据列为有条件开放,但实际上是不开放的。也有部分平台不够稳定,经常会现无法访问、页面卡死等问题。
三是有些过去表现优秀的地方未能持续进步,甚至出现倒退,主要体现在开放优质数据、保持数据可持续性等方面。
四是各地真正落地的利用成果不多,尤其是缺少一些真正能满足社会需求且功能体验较好的优质成果。
开放数林的护林员们有话说
最后,负责评估四个维度的负责人有一些话想对各地开放数据平台的管理部门说:
准备度:准备度体现了各地的基础扎实程度。数据开放是一项长期性、持续性的工作,基础牢固决定了数据开放能够走的远、走的稳。同时,准备度也是最容易让“文本”流于形式的维度,否则会成为“空中楼阁” 而无法落地。因此,识别“文本游戏”,挖掘“真刀实枪”的制度是准备度评估一直在努力的方向,也希望各地求真务实,在数据开放实践的“前端”打好基础,为数据开放更好的产出,增质提效提供保障。
平台层:平台层应该是各地最容易提升的维度,同样也是最容易做表面文章进行糊弄的维度。一些地方的政府部门可能以为照搬其他地方的平台框架或者完全外包给技术公司就万事大吉了,没有给予足够的重视和投入,最终造就了一批无人问津的“僵尸平台”。更好地区分“花架子”与“真功夫”是平台层评估一直在努力的方向,也希望地方平台能更加重视平台运营和用户体验,真正服务好数据利用者。
数据层:各地方开放的数据不在于多,最重要的还是要将精力放在开放满足用户需求的、高质量的数据上,并对这些数据及时更新与描述说明。尽可能扩大无条件开放的范围,对于必须要有条件才能开放的数据则应该清楚列明条件。哪怕开放的数据不多,也能够切实推动地方的数字化发展。静态、不更新的数据建议也要及时存档留存,让用户能够更快、更方便的发现与获取高质量、最新的或历史的数据。
利用层:利用层应该是最能体现“实践见真章”的维度,开放出来的数据好不好,要看有没有人用,有没有产生好的利用成果,以及有没有释放出公共数据的价值。我们发现有些地方并不是没有人利用数据,而是没有开放出真正有需求的数据,也就没法产出好的利用成果。我们还发现有些成果可能是政府自己“造”出来的了,民众“无感”,也不会真正落地,成了“自娱自乐”和“纸上谈兵”。满足需求、解决问题、释放价值、提升感受,既是公共数据开放利用的追求,也是利用层评估不断努力的方向,希望各地能让社会公众广泛参与进来,让他们来做出更多真正“接地气”的好应用。
期待中国开放数林能够成长为一片枝杈相连、万木争荣、精耕细作、遮阳挡雨、生生不息的森林。
欲下载报告全文可访问中国开放数林指数网站(ifopendata.fudan.edu.cn) 或 复 旦 大 学 数 字 与 移 动 治 理 实 验 室 网 站(www.dmg.fudan.edu.cn),并以动态可视化方式了解我国地方政府数据开放现状。
10-24
07-18
07-17
07-16
07-15
07-14
07-12
07-12
07-11
07-10