资源描述
1 001 001 引言 数林概貌 数林指数 数林四年 数林近观 数林建言 评估方法 附录 003 005 008 013 020 033 036 046 本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范: 复旦大学数字与移动治理实验室. 中国地方政府数据开放报告(2020下半年)R/OL. (2021-01-20)引用日期,格式为YYYY-MM-DD. 002 引言 003 中国地方政府数据开放报告和“中国开放数林指数”是我国首个专注于评估政 府数据开放水平的专业报告和指数,由复旦大学数字与移动治理实验室制作出品,复旦 大学和国家信息中心数字中国研究院联合发布。 “开放数林”意喻我国政府数据开放利用的生态体系。开放数据,蔚然成林,一棵 棵地方开放“数木”由最初的丛然并生、成荫如盖,直至枝繁叶茂、花开结果,终将成 长为一片繁盛多样、枝杈相连、持续循环的中国“开放数林”。 “中国开放数林指数”自2017年5月首次发布以来,每半年发布一次,定期对我 国地方政府数据开放水平进行综合评价,精心测量各地“开放数木”的繁茂程度和果实 价值,助推我国政府数据开放生态体系的建设与发展。2018年以来,“中国开放数林 指数”为国家互联网信息办公室信息化发展局监测我国公共信息资源开放情况提供数据 支撑。2019 年以来,报告被收录进复旦智库报告系列,成为复旦大学每年重点推 出的 15-20 份有社会影响力的报告之一。 引言 004 数林概貌 005 截至2020年10月,我国已有142个省级、副省级和地级政府上线了数据开放平台。 与2019年下半年相比,新增了4个省级平台和36个地级(含副省级)平台,平台总 数增长近4成。 截至2020年10月,全国各地上线的省级政府数据开放平台的地区分布如图1所示, 颜色越深代表平台上线时间越早,灰色表示该地区还未上线平台。从整体上看,我国地 方政府数据开放平台已从东部地区向中西部地区不断扩散,东南沿海地区的省级平台已 经基本相连成片。 一、数林概貌 图1 各地平台上线时间的地理空间分布(省级) 006 副省级和地级政府数据开放平台的地区分布如图2所示,山东省、广东省和浙江省 内的绝大多数地市都已上线了政府数据开放平台,形成我国最为密集的省级“开放数林”。 同时,在东中部地区的江苏、安徽、湖北和江西以及西南地区的贵州与四川等地,地级(含 副省级)平台也陆续上线并由点及面。 图2 各地平台上线时间的地理空间分布(副省级和地级) 007 008 省级与地级(含副省级)开放数林综合指数的分值、排名与等级如表1-1、表1-2所示。 在2020年下半年的省级排名中,浙江和上海的综合表现最优,开放数级位列第一等级; 山东和贵州也总体表现优秀,位列开放数级第二等级;其次是广东、福建、北京、天津、 四川等地方。相比2019年下半年,山东进步幅度相对较大。 在2020年下半年的地级(含副省级)排名中,深圳、温州、青岛和贵阳综合表现最优, 开放数级位列第一等级;济南、无锡、成都、威海、台州等地也总体表现优秀,位列开 放数级第二等级。相比2019年下半年,无锡和日照的排名大幅上升,温州和台州在今 年新上线平台的地方中综合指数表现最佳。 在准备度、平台层和数据层三个维度上,各地整体表现与去年同期相比均有进步; 但在利用层上,各地仍有很大提升空间。在四个单项维度上,在全国所有142个在评地 方中,浙江在准备度和数据层上排名全国第一,山东在平台层上排名全国第一,上海在 利用层上排名全国第一。 同时,本次评估发现,部分已上线的地方平台出现了因不明原因下线造成数据供给 中断的情况,或虽然平台仍在线,但实际上未开放数据的问题。 二、数林指数 表1-1 省级综合排名 009 表1-2 地级(含副省级)综合排名 010 全国开放数林指数空间分布如图3和图4所示,颜色越深代表综合指数分值越高。 指数分值较高的地方主要集中在东南部沿海地区,与此同时,位于西部的贵州、四川、 贵阳和成都也表现优秀,成为所在地区的优质“数木”。 图3 开放数林指数空间分布(省级平台) 011 图4 开放数林指数空间分布(副省级、地级平台) 012 013 3.1 平台上线时间 四年来,我国地方政府上线的数据开放平台的数量快速增长,从2017年的20个, 增长到2018年的56个,2019年的102个,再到2020年的142个(如图5所示)。 各地平台上线时间如表2所示。 图5 历年地方政府开放数据平台数量增长情况 中国开放数林指数自2017年首次发布以来,每半年发布一次,至今已满四年,共 发布了八次,本期报告对过去四年我国开放数林的生长态势进行了总结回顾。 三、数林四年 014 表2 各地平台上线时间一览表(按拼音首字母排序) 015 图6 2017-2020年省级平台分布 图7 2017-2020年地级(含副省级)平台分布 3.2平台区域分布 四年来,全国各地的政府数据开放平台已蔚然成林。图6与图7为2017年到 2020年期间,各地省级与地级(含副省级)政府数据开放平台的区域分布情况。截至 2020年10月,已有66%的省级行政区(不含港澳台)、73%的副省级和35%的地 级行政区上线了政府数据开放平台。其中,山东和广东两省的所有地市都已上线了政府 数据开放平台。 3.3 四年生长亮点 四年以来,我国地方政府数据开放的整体情况呈现为进步迅速、蔚然成林的态势。 016 图8 2017-2020年各地开放的有效数据集总量(单位:个) 与政府数据开放直接相关的法规政策和标准规范实现了从无到有、逐渐落地的发 展态势。截至2020年10月,在全国已上线数据开放平台的地方中,上海、浙江、天 津等3个省级地方和威海、连云港、福州、哈尔滨、青岛等5个副省级和地级地方出台 了专门针对政府数据开放的地方政府规章或规范性文件,海南、宁波、南京、湖州等多 地制定的公共数据管理办法中也有专门针对政府数据开放的章节。 此外,上海、广东、 浙江、贵州、山东、江西等省还制定了专门针对政府数据开放的标准规范。 地方政府数据开放平台数量和开放的有效数据集呈现爆发式增长。从2017年到 2020年10月,全国地级以上地方政府数据开放平台从20个增长到142个。全国各地 方政府开放的有效数据集总数从2017年的8398个,增长至2020年的98558个,四 年间增长超过10倍。 在对开放数据的开发利用方面,自上海于2015年率先举办SODA开放数据创新 应用大赛以来,各地开始陆续组织类似的开放数据利用促进活动。截至2020年10月, 全国已有12个省级和47个地级(含副省级)政府举办了不同形式的开放数据利用活动。 而在2017年,全国仅有4个省级地方和2个地级(含副省级)地方举办过类似活动。 四年来,政府开放数据的社会化利用生态体系愈发成熟。 017 3.4 “数林匹克”累计分值 数据开放是一场马拉松,而不是速滑赛,不在于一个地方是否跑得早、跑得急,而 在于这个地方能否跑得长、跑得稳,能持续、稳定地向社会提供优质数据,并坚持不懈 地推动开放数据的开发利用。本期报告首次新增了“数林匹克”四年累计分值,以反映 一个地方在过去四年开放数据的持续水平。 一个地方的“数林匹克”累计分值由2017年到2020年这四年该地方的年终(即 下半年)开放数林综合指数的分值累加而成。如表3-1和表3-2所示,在2017-2020 省级“数林匹克”累计分值上,上海分值最高,其次是广东、贵州、北京等地,都在 190分以上;在副省级与地级“数林匹克”累计分值上,贵阳分值最高,其次是青岛、 哈尔滨、深圳、佛山、广州等地,都超过了200分。 表3-1 省级“数林匹克”累计分值 018 表3-2 地级(含副省级)“数林匹克”累计分值(前四十) 019 020 4.1数根:准备度 4.1.1 法规政策效力与内容 法规政策是推进政府数据开放的法治基础和重要依据。截至2020年10月,我国 共有38个地方出台了与政府数据开放密切相关的法规政策,而在2019年同期这个数 据仅有22个。这些法规政策的出台进一步夯实了数据开放工作的法治基础。 然而,全国范围内的法规政策依然存在效力不高、针对性不强等问题。在法规政策 的效力上,除贵州省和贵阳市出台了有关政府数据共享开放的地方性法规外,其他地方 的相关法规政策都为地方政府规章或规范性文件。在法规政策的针对性上,共有8个地 方制定了专门针对数据开放的法规政策。 4.1.2 组织与实施 组织与实施是指对政府数据开放工作的组织保障与推进实施。截至2020年10月, 制定并公开了专门针对政府数据开放的实施细则、年度工作计划与工作方案的地方数量 从2019年的1个增长到目前的15个,越来越多的地方政府将数据开放列入常态化工作。 虽然有28的地方党政主要领导对数据开放工作公开发表讲话予以重视和支持, 比2019年增长了38%,但在领导的讲话内容上,仅有不到5%的讲话内容较为丰富全面, 其余大部分讲话内容较为笼统或没有专门针对数据开放工作。 四、数林近观 021 4.1.3 标准规范制定 制定数据开放的标准规范和操作指南,有利于数据开放工作的标准化和规范化推进。 截至2020年10月,只有7%的地方制定了地方标准或规范指引,只有 2.8% 的地方制 定了地方标准,我国地方数据开放工作的标准化规范化程度还有待大力提升。在标准规 范的内容方面,虽然已公布的标准规范基本都对数据、元数据等方面都作出了详细的规 定,但其中对平台建设和运营作出规定的仅有 40%。 4.2 数干:平台层 4.2.1 数据发现 数据发现是指政府数据开放平台以醒目便捷的方式帮助用户发现数据。在最新动态、 开放数据目录、搜索功能和相关数据推荐功能上,全国整体上已达到较高水平或取得显 著进步。截至2020年10月,约74%的平台提供了最新动态信息,帮助用户了解平台 开放数据的最新情况。约40%的平台提供了可下载的开放数据目录。约73%的平台提 供了搜索功能,约50%的平台提供了具有筛选项的高级搜索功能。约51%的平台提供 了相关数据集推荐功能,方便用户寻找关联数据集。 在分类导航功能和数据集预览功能上,多数地方仍有待改善。只有约28%的平台 能够按照用户使用场景或标签进行数据导引,只有约29%的平台在数据集预览中提供 了在线分析工具。 4.2.2 数据获取 数据获取是指政府数据开放平台提供了便于用户获取数据集的功能和服务。在无条 件开放数据获取、有条件开放数据申请和未开放数据请求的回复及公开上,多数地方仍 处于较低水平。虽然已有约74%的平台开放了无条件开放数据集,但只有约 4% 的平 台提供了分级获取。只有约27%的平台开通了对于有条件开放数据的申请功能,其中 只有温州列明了申请条件,只有上海、深圳和广州在测评期内对用户的申请给予了及时 回复。尚未有平台对用户申请数据的结果进行了公开。 022 已有约62%的平台为用户提供了对于未开放数据提交请求的入口。然而,只有约 10% 的平台在测评期内对用户对于未开放数据的请求给予了及时回复,且分别只有约 16% 和 13% 的平台对用户此前提出的请求内容和请求回复进行了公开。 4.2.4 互动反馈 互动反馈是指平台提供了便于用户与平台、数据提供方进行互动反馈的功能和服务。 在数据发布者联系方式、意见建议和纠错的回复及公开上,全国整体水平不高。只有约 13%的平台提供了真实的数据发布部门地址、邮箱或电话,以便用户进行联系。只有约 41%的平台公开了用户此前提出的意见建议及平台作出的回复,且只有9%的平台在测 评期内对用户的意见建议进行了及时有效的回复。只有约17%的平台公开了用户此前 提出的数据纠错及平台作出的回复,且只有约4%的平台在测评期内对用户的纠错进行 了及时有效的回复。 4.2.5 用户体验 用户体验是指平台为用户使用平台和账户提供了体验良好的功能和服务。在账户分 类、账户注册便捷程度和个性化服务上,全国整体已达到较高水平。约69%的平台对 自然人账户和法人账户进行了区分。约61%的平台无需注册账户或可通过第三方平台 登陆即可获取数据,便捷度较高。约70%的平台为用户提供了个性化服务功能。 在平台互联互通和包容性功能上,各地整体水平仍较低。只有约29%的平台提供 了与其他政府数据开放平台的链接,只有约22%的平台提供了无障碍浏览模式、语言 翻译等包容性功能。 4.2.3 成果提交展示 成果提交展示是指平台集中展示了用户利用平台上开放的数据所产生的各类数据利 用成果。在利用成果展示和利用成果提交功能上,全国整体上已达到较高水平。约73% 的平台提供了利用成果展示功能,约62%的平台对利用成果的来源信息进行了标注。 然而,只有约38%的平台提供了多种利用成果的提交入口。 023 图9 各地平台开放的有效数据集总数(单位:个) 4.3数叶:数据层 4.3.1 数据数量 政府数据开放平台通常以下载或API接口的方式提供数据集,数据集总量统计的是 平台上可通过下载或API接口获取的有效数据集总数。 在开放数据集总量上,全国开放数据集总量已从2019年10月的71092个增长到 2020年10月的98558个,增幅接近40%(如图9)。然而,各地之间的开放数据集 总量仍差异显著,约20%的地方平台已开放的有效数据集总量超过了1000个,其中山 东的威海、烟台、枣庄等地区开放的有效数据集总量最高,但目前还有约50%的地方 开放的有效数据集在数量上不到100个。 数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集 的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据 集的数据量和颗粒度。截至2020年10月,各地开放的有效数据集的总容量接近19亿, 与2019年同期相比增长约23%(如图10所示)。然而,各地开放的数据容量大小差 异显著,浙江与温州两地平台上开放的可下载数据集的数据容量已分别超过1亿,但仍 有约43%的平台上开放的数据容量在100万及以下。 024 图10 各地平台开放的数据总容量(单位:万) 4.3.2 数据质量 在数据质量上,开放数据容量大、社会需求高的优质数据集是开放数据的重点。报 告对各地平台上所有可下载的数据集(共约94955个)按照数据容量进行排序,在数 据容量相同的情况下再按照下载量排序,最终选出排名居于前1%的数据集作为优质数 据集(共约950个)。截至2020年10月,约40%的地方平台提供了优质数据集,优 质数据集数量前十的地方如图11所示,浙江平台开放的优质数据集数量最高,其次是 温州、上海、贵阳等地。 图11 各地平台优质数据集数量(前十名) 025 表4是排在前十位的优质数据集列表,这些数据集普遍具有较高的条数和字段数, 内容主要涉及行政服务、文化旅游、环保、社会组织、企业、司法、交通等方面。 然而,部分地方的可下载数据集仍存在高缺失、碎片化、低容量等质量问题。目前, 只有上海、深圳与浙江三个地方平台提供了优质API,但普遍存在接口调用难度高,可 调取到的数据容量小、更新频率低等问题。只有不到25%的地方平台能在上线后的每 个季度都持续新增数据集。在2020年4月到11月这段时期,约56%的地方完全没有 对平台上已发布的数据集进行更新。 表4 前十位优质数据集列表 026 图12 开放数据集主题分布 4.3.3 数据规范 在开放数据规范上,全国仅有不到20%的地方平台为数据集标示了分级分类的开 放属性。开放授权协议日益受到各地重视,已有约54%的地方平台提供了数据开放授 权协议,其中山东全省各地、浙江部分地区以及成都和无锡还在平台上针对单个数据集 提供了开放授权协议。约42%的地方平台上开放的数据集全部符合可机读格式的标准, 约27%的地方平台上开放的数据集全部符合非专属格式的标准,还有约25%的地方平 台提供了RDF格式的数据,相比去年同期均有大幅提高。 4.3.4 开放范围 在开放范围上,约22%的地方平台开放的数据集覆盖了所有重要主题,而只有北 京平台开放的数据集覆盖了所有主要部门。图12展现了各地开放数据集的主题分布情况, 其中,社保就业主题开放的数据集总数最高,其次是经贸工商、社会民生、财税金融等 主题。 027 各地平台上开放的数据集的部门分布情况如图13。目前,来自统计部门的数据集 总数最多,其次是市场监管(包括工商、质监、食药监)部门的数据。此外,农业农村、 教育、人力资源与社会保障、住房和城乡建设等部门也开放了较多的数据集。 图13 开放数据集部门分布 报告对各地平台上开放的所有数据集的名称进行了文本分析,发现了一批高频出现 的能描述数据领域和内容的主题词,并基于这些主题词回溯到相应的数据集,梳理出各 地平台上开放的十四类常见数据集列表(见表5)。报告还基于中共中央 国务院关于 构建更加完善的要素市场化配置体制机制的意见和地方政策规章中要求重点和优先开 放的数据领域,结合各地平台上已开放的优质数据集清单,建议各地优先开放五项关键 数据集(见表6)。 028 目前,各地平台开放的常见数据集与关键数据集类型还有较大提升空间,只有14% 的地方平台开放了所有14项常见数据集,只有浙江、深圳与贵阳3个地方平台开放了 所有5项关键数据集。 表5 常见数据集列表 029 4.4 数果:利用层 4.4.1 利用促进 利用促进是指政府为了推动开放数据的社会化利用而组织的各类活动,包括综合性 的开放数据创新利用比赛与各种常态化、条线性、专业性的引导赋能活动。 与2019年同期相比,有更多地方举办了综合性的数据创新利用比赛和多种形式的 引导赋能活动。目前,已有41%的地方举办过综合性或行业性的开放数据创新利用比赛, 16%的地方组织了诸如数据供需对接、交流会、成果征集会等多种引导赋能活动。其中, 浙江省、山东省与四川省举办的大赛在地市设置了分赛区,带动了全省的开放数据利用, 上海开展了形式多样的引导赋能活动。然而,各地开展利用促进活动的持续性仍不足, 仅有12%的地方能做到连续举办活动。 表6 关键数据集列表 030 4.4.2 有效成果数量 有效成果数量是指社会利用开放数据产生的有效成果的数量。与2019年同期相比, 各地产出的有效成果总量从7个增长到了45个。其中,上海的有效成果数量相对最多, 达到9个(如图14)。 图14 各地平台开放的有效成果数量 总体上看,各地有效利用成果的数量仍然较少,且地区间差距较大,仅有13%的 地方平台展示了有效利用成果。 031 4.4.3 成果质量 成果质量是指平台展示的成果是否与本地域的开放数据或生产生活相关,是否由社 会主体开发,能否下载与使用,或成果有无标注所利用的开放数据集等方面。与2019 年同期相比,各地在清理无关成果与不可用成果方面取得了一定进展,86%的地方展示 了与本地数据相关的成果,60%的地方展示的利用成果可获取、能使用,但仍有67% 的地方展示的是政府开发的利用成果,仅有16%的地方为利用成果标注了有效数据来源。 4.4.4 利用多样性 利用多样性是指有效成果的利用主体多样性、形式多样性与主题覆盖多样性。与 2019年同期相比,各地展示的有效成果覆盖了更多主题与应用场景,涉及的领域从4 个增长到10个。其中,交通出行领域的利用成果最多,占有效成果总数的40%(如图 15)。 然而,当前数据利用主体仍较为单一,成果形式种类尚不丰富。在展示了有效成果 的地方中,仅有6%的地方吸引了两种及以上类型的利用者,各地展出的有效成果多为 服务应用与创新方案两类,数据可视化与研究成果等其他形式的成果较为少见。 图15 有效利用成果主题覆盖情况 032 033 5.1 制度供给与组织保障 在法规政策方面,建议尽快制定有利于促进和规范数据开放的地方性法规、 地方政 府规章或规范性文件,并对数据要求、开放方式、开放利用、全生命周期安全管理和保 障机制等方面作出明确规定。 在组织与实施方面,建议地方党政主要领导加大对政府数据开放的重视程度和支持 力度,增加支持政府数据开放的公开讲话,且讲话内应力求务实全面。连续制定和公开 专门针对政府数据开放的实施细则、工作方案与年度工作计划。 在标准规范制定方面,建议制定和公开有关政府数据开放的具有指导性和操作性的 标准规范和操作指南,并对数据和平台层面作出明确要求。建议尽可能出台地方标准, 以推进数据开放工作的标准化。 5.2 平台优化与持续运营 在数据发现方面,建议提供可下载的开放数据目录,按照用户使用场景或标签进行 分类导航,提供和强化可供用户在线对数据进行初步分析的数据集预览功能。 在数据获取方面,建议提供无条件开放数据集的分级获取功能,开通对于有条件开 放数据的申请功能并列明申请条件,对用户对于有条件开放数据的申请和未开放数据的 请求进行及时有效地回复并公开相关信息。 在成果提交展示方面,建议为开发者提供提交多种类型的开放数据利用成果的入口。 在互动反馈方面,建议提供数据发布者联系方式,对用户评价、意见建议和数据纠 错进行及时有效地反馈,并公开相关信息。 在用户体验方面,建议加强与其他相关政府数据开放平台的连接,针对部分具有特 殊需求的用户提供包容性无障碍功能。 五、数林建言 034 5.4 数据利用与生态培育 在利用促进方面,建议促进数据在开放之后的开发利用,连续举办综合性与行业性 的开放数据创新利用比赛,组织常态化、专业性的引导赋能活动,营造有利于政府数据 开放利用的生态体系。 在有效成果数量和质量方面,建议提高有效利用成果的数量和质量,清理与数据开 放无关的、由政府自身开发的、无法获取或无法正常使用的成果,为展示的利用成果标 明其所利用的开放数据集并提供有效链接。 在利用多样性方面,建议提高开放数据利用者类型的多样性,提升利用成果形式与 主题领域的多样性。 5.3 数量提升与质量保证 在数据数量方面,建议提升有效数据集的数量与容量,开放高容量、高需求的优质 数据集,特别是以API接口形式开放的动态的、大容量的数据集。 在数据质量方面,建议清理高缺失、碎片化、低容量的数据集,保持开放数据集的 不断增长和动态更新。 在数据规范方面,建议推进数据的分级分类开放,对数据集标注不同的开放类型和 属性,并相应配备差异化的开放授权协议。提高开放数据集可机读格式、非专属格式、 RDF格式的比例,降低申请和调用API接口的难度,为开放数据集提供丰富的元数据信 息和详细的使用指南。 在开放范围方面, 建议提高开放数据集的主题覆盖面和部门覆盖面,开放更多常见 数据集和关键数据集。 035 036 6.1 评估指标体系 开放数林指数邀请国内外政界、学术界、产业界共七十余位专家共同参与,组成“中 国开放数林指数”评估专家委员会,体现了跨界、多学科、第三方的专业视角。专家委 员会基于数据开放的基本理念和原则,借鉴国际数据开放评估指标体系的经验,立足我 国政府数据开放的政策要求与地方实践,结合专家研讨与赋值,构建起一个系统、科学、 可操作的地方政府数据开放评估指标体系,并为每项指标分配了权重(见图16)。 六、 评估方法 图16 开放数林指数评估指标体系的构建方法 037 评估指标体系共包括准备度、平台层、数据层、利用层四个维度及下属多级指标(见 图17-1、图17-2): 准备度是“数根”,是数据开放的基础,包括法规政策效力与内容、组织与实施、标 准规范制定等三个一级指标。 平台层是“数干”,是数据开放的枢纽,包括数据发现、数据获取、成果提交展示、 互动反馈、用户体验等五个一级指标。 数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数据规范、开放 范围等四个一级指标。 利用层是“数果”,是数据开放的成效,包括利用促进、有效成果数量、成果质量、 利用多样性等四个一级指标。 038 图17-1 2020中国开放数林指数评估指标体系 039 图17-2 2020中国开放数林指数评估指标体系 040 6.2 评估范围 指数出品方根据公开报道,以及使用“数据开放”“数据公开”“公共数据”“政 务数据”“政府数据”“地名数据”“地名政府数据”“地名开放数据”等 关键词进行搜索,发现了截至2020年10月我国已上线的地方政府数据开放平台,并 从中筛选出符合以下条件的平台: 1、原则上平台域名中需出现,作为确定其为政府官方认可的数据开放平台 的依据。 2、平台所代表的地方政府的行政级别为地级及以上。 3、平台形式为“集中专有式”或“集中嵌入式”。“集中专有式”是指开放数据 集中汇聚在一个专门的平台上进行开放;“集中嵌入式”是指开放数据统一汇聚为一个 栏目版块,嵌入在政府门户网站或政务服务网站上。各个条线部门建设的非集中式开放 数据的平台不在指数的评估范围内。 本次评估中,指数出品方共发现符合条件的地方平台142个,其中省级平台20个, 地级(含副省级)平台122个,将上线了这些平台的地方作为本次评估的对象。部分平 台在评估期间内无法访问或能够访问但平台的数据无法被获取,仍被纳入评估范围,但 被视作中断数据供给。具体地方、平台名称和平台域名如表7所示。 表7 评估范围(按行政层级及拼音首字母排序) 041 042 043 6.3 数据采集与分析方法 准备度评估主要对相关法律法规、政策、年度计划与工作方案、标准规范、新闻报 道等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在百度 搜索引擎以关键词检索相关法规与政策文本、标准规范、年度工作计划、有关地方党政 领导讲话支持的新闻报道以及数据开放主管部门的信息;二是在地方政府门户网站以及 政府数据开放平台上通过人工观察和关键词检索采集数据。评估范围数据采集的截止时 间为2020年11月。 数据层评估主要通过机器自动抓取各地公共数据开放平台上开放的数据,结合人工 观察采集相关信息,然后对数据进行了描述性统计分析、交叉分析、文本分析和空间分析。 数据采集截止时间为2020年11月,对“动态更新”这一指标的评测时段为2020年4 月至2020年11月。 044 各地开放数林指数 平台层评估主要采用人工观察法对各地方政府数据平台上各项功能进行观测并做描 述性统计分析,数据采集截止时间为2020年11月。同时,指数出品方还对平台的回 复情况(包括回复时间和回复质量)进行了评估,回复情况采集截止时间为2020年11月。 利用层评估主要对各地公共数据开放平台上展示的利用成果进行了人工观察和测 试,对2018年以来各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集 到的数据进行了描述性统计分析。数据采集截止时间为2020年11月。 此外,为确保数据采集准确全面,对部分指标采用报告出品方自主采集和向地方征 集相结合的方式,从各地征集到的公开资料经验证后也纳入评估数据。 6.4 指标计算方法 指数出品方基于各地在各项评估指标上的实际表现从低到高按照0-5分共6档分值 进行评分,其中5分为最高分,相应数据缺失或完全不符合标准则分值为0。对于连续 型统计数值类数据则使用极差归一法将各地统计数据结果换算为0-5分之间的数值作为 该项得分。 各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分等于每个单项 指标的分值乘以相应权重所得到的加权总和。最终,各地开放数林指数等于准备度指数、 平台层指数、数据层指数、利用层指数乘以相应权重的加权平均分。各地开放数林指数 计算公式如下: 045 附录 046 指数出品团队 报告校对组 观察员 郑磊、刘新萍、张忻璐、吕文增、华蕊、张宏、侯铖铖、韩笑、马李滨 纪昌秀、王翔、戚馨予、魏以宁、毛天慧 指数出品方 常媛媛、陈梦凡、董万怡梦、窦 寅、房海旭、冯 雷、冯 妍、付 娇、 管 莹、嵇江夏、景 宇 欣、李家瑞、李梦欣、李姗蔓、李行行、梁佳佳、 刘天洋、刘 裕、刘亭孝、门理想、莫 涛、任冉冉、王搏维、王欣宜、 王野然、魏亮亮、文 可 昕、吴海珍、项佳囡、徐丹丹、许锦添、徐小珺、 许怡婷、杨诗淼、姚 慧、易慧慧、于 丹、于锦文、曾 翔、张梦龙、 张振红、章子娟、周 彩 玲 047 评估专家委员会 048 联合发布方 合作单位 冥睿(上海)信息科技有限公司 晴禾(南京)文化有限公司 中山大学数字治理研究中心 微软(中国)有限公司 汇纳科技股份有限公司 DataMate 数据工作室 复旦发展研究院
展开阅读全文