资源描述
开放数据资产 估值白皮书 前言 中国的公共开放数据资产现状 数据资产化在中国已成为重要趋势 公共开放数据正蓬勃发展 公共开放数据资产评估运用传统估值思路的挑战 “数据势能”估值体系及实证探究 “数据势能”估值概念 “数据势能”公式 “数据势能”估值体系在实证方面的初试及探析 宏观合理性测试分析 公共开放数据资产的应用与分析 最具潜力的 5大公共开放数据排行榜 全国公共开放数据 10佳实践案例 对标与展望 结束语 参考文献 联系人 2 3 4 5 10 12 13 15 18 23 24 25 27 29 30 30 31 目录 1 开放数资产估值白皮书 前言 数据资产化是数据要素的重要趋势 , 旨在最大化释放数据的核心价值 。 在全球 数据开放的大背景下 , 我国公共数据开放的步伐在近年来进一步提速 。 公共开 放数据在数据资产生态中起到基础性的作用 , 为加快我国数字化发展 , 建设 “ 数字中国 ” 提供支撑 。 当前 , 全国已有 18个省级公共数据开放平台正式上线 , 免费为社会各方提供相关政府单位的公开数据 。 但免费并不等同于没有价值 。 公共开放数据在 “ 惠民 ” 以及 “ 智慧政务 ” 方面产生了巨大的潜在社会价值 。 目前 , 公共开放数据的应用场景正在不断丰富的过程中 , 假以时日 , 必将蓄积 巨大的潜在经济价值 , 未来可期 。 数据资产估值是未来数据资产价值释放的核心环节 。 然而 , 由于公共开放数据 自身的独特性 , 将传统估值思路应用于其估值时面临诸多挑战 。 本白皮书首次 借用物理学中的 “ 势能 ” 概念作为理论基础 , 推出 “ 数据势能 ” 新概念及其相 应的估值逻辑 , 就政府公共开放数据的估值体系进行研究和探讨 , 旨在根据公 共开发数据资产的特点 , 发掘其特有的价值驱动因素及其魅力所在 , 进一步揭 示能够撬动其估值体系的支点 。 此方法论目前仍处在尝试探索阶段 , 虽取得了初步成果 , 但仍需进一步深入研 究与论证 。 普华永道欢迎学术界 、 科研单位以及业内人士与我们开展深度交流 探讨 , 携手助推我国数据资产化发展的步伐 , 为 “ 数字中国 ” 建设尽绵薄之力 。 2开放数据 资产估值白皮书 中国的公共开放 数据资产现状 3 开放数据资产估值白皮书 数据资产化已成为重要趋势 4开放数据资产估值白皮书 在现今快速发展的数字经济新时代 , 中国作为数据生 产大国已明确表明数据在我国社会经济发展中的重要 战略意义 。 2020年 4月 9日 , 中共中央 、 国务院发布 关于构建更加完善的要素市场化配置体制机制的意 见 (简称 意见 ), 将数据确立为五大生产要素之 一 , 与土地 、 资本 、 劳动力以及技术等传统生产要素 一样 , 数据将成为可市场化配置的生产要素 。 意见 强调 , 要加快培育数据要素市场 , 具体体现在推进政 府数据开放共享 、 提升社会数据资源价值 , 以及加强 数据资源整合和安全保护 。 2021年 6月 10日 , 数据 安全法 正式表决通过 , 并将于 2021年 9月正式生效 , 该法旨在建立工作协调机制 , 加强对数据安全工作的 统筹 , 进一步完善保障政务数据安全方面的规定 。 数据安全法 是继 网络安全法 提出数据的概念 后 , 我国在数据安全立法层面的又一个重大里程碑 , 将成为中国数字经济高速发展的压舱石和中国数据资 产化稳定发展的指路明灯 。 随着数据要素市场的发展 , 数据将更加资产化 。 但从 经济和法律视角来看 , 资产具有三项核心特征:其一 , 资产应归属某主体所有或控制 , 即权属明确;其二 , 资产能够产生既有的或预期的经济利益;其三 , 资产 是一种资源 , 具有稀缺性 。 而对于当今的数字世界来 说 , 数据的无限采集 、 可复制性以及取之不竭的特性 导致其作为资产存在的特殊性 。 首先 , 数据资产主体 具有多重性 , 即权属模糊 , 例如数据从生产到流转的 过程中 , 可产生衍生数据及衍生数据主体;其次 , 数 据资产对当前经济生产经营及未来预测的经济利益需 以资产的合理估值为前提 , 但数据资产的估值当前并 不存在统一 、 普适性的估值依据;再次 , 数据作为一 种无形资产 , 与黄金 、 石油等不可再生资源的稀缺性 相比 , 数据的稀缺性是相对的动态概念 , 在特定场景 和时间节点 , 数据具有极高的稀缺性 , 从某种意义上 , 数据资产是取之不尽 、 用之不竭的 。 伴随着中国数字 经济的发展 , 数据资产化对于国家治理 、 市场配置 、 企业运营和个人权益四个领域影响深远 。 普华永道认 为 , 数据资产化已成为中国以数据驱动社会发展的重 要趋势 , 当前各利益相关方的行动也正在为这一进程 扫除障碍 , 包括以上提及的三点 。 普华永道在 2020年 11月发布的 数据资产生态白皮书 中写道 , 数据如同水与空气的数字化时代已至 。 数据 的价值迎来了悄无声息却影响深远的革新 , 数据不再 仅仅是宝藏或者石油这样直白的物质财富代表 , 而已 经发展为如同水与空气一般重要的必需品 。 首先 , 水 与空气是每个个体日常生活中无法缺失的重要资源 , 即使存在感有时无法察觉 , 而一旦失去就会导致机体 的崩溃 , 同样 , 人们对于数据也已习以为常 , 生活与 生产已经无法离开数据的支撑 。 其次 , 水与空气是自 然界无处不在的巨大资源供给 , 而数据也已经在潜移 默化间成为个人 、 企业与政府正常运作即可获得的重 要资源之一 , 如同水与空气一样影响着每一个个体 。 最后 , 水与空气看似廉价 , 却能在相关介质的配合下 催生出长久持续的能量 , 例如水电 , 数据自身虽然微 小 , 同样也能通过聚合效应驱动质变 。 图 1:全球数据量增长预测 2 4 6 8 10 14 16 20 40 50 60 70 80 100 130 175 0 20 40 60 80 100 120 140 160 180 200 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020E 2021E 2022E 2023E 2024E 2025E (单位 : ZB) 资料来源: IDC, 数据时代 2025 报告 根据世界银行的定义 , 开放数据是 “ 能被任何人出于 任何目的不受限制地进行自由利用 、 再利用和分发 , 并最大程度保持其原始出处和开放性的数据 ” 。 图 2:平衡的数据资产生态系统 数据生产者 个人 /企业 (树木) 数据资产(氧气)O2 政府管控与治理 /数据要素市场 数据确权与定价指导(阳光,光合作用) 数据消费者 小企业 (食草动物,初级消费者) 数据消费者 大企业 (食肉动物,高级消费者) 数据中介 数据银行、数据信托、数据运营商 (云,大气循环) 数据资产(水) 资料来源:普华永道分析 公共开放数据(土壤) 数据中介 (微生物,分解者) P 政策 /法律 E 经济 S 社会 T 技术 科研机构 /学术单位 公共开放数据正蓬勃发展 5 开放数据资产估值白皮书 数据资产化旨在最大化释放数据的核心价值以及流通 性 。 根据国际数据公司 ( IDC) 对全球 “ 数据圈 ” 的 研究预测 , 2025年全球数据量将达到 175ZB。 中国 2018年产生了 7.6ZB的数据 。 IDC预计 , 中国的 “ 数 据圈 ” 将会在 2018年至 2025年之间扩张 14倍左右 , 以每年 30%的平均增速快速发展 , 在 2025年达到 48.6ZB, 也就是 48.6万亿 GB1。 届时 , 中国将远超美 国 , 问鼎数据圈的 “ 金山 ” , 成为全球第一 。 坐拥如 此庞大的体量以及未来的潜力 , 社会各界谁能率先认 识到数据的重要性 、 对丰富的数据资源加以合理运用 , 谁就能迅速把握时代风口 、 抢占行业先机 , 并创造惊 人的经济利益 。 与土地 、 资本 、 技术 、 劳动力等传统资产相比 , 数据 带来的机遇与挑战也伴随左右 。 一方面 , 联通个人群 体 、 企业机构与政府部门 , 数据通过开放 、 流通 、 采 集 、 监测等不同方式释放巨大信息价值 , 重塑社会生 活方式与经济商业模式 , 产生巨大杠杆效应;另一方 面 , 如同空气和水面临污染威胁 , 数据也同样面临权 属不清 、 估值不明 、 垄断使用等社会经济难题 , 导致 这一价值潜力无限的资源难以真正实现市场化为主导 的平衡 。 除了需要政府主导下的数据确权机制之外 , 还需要学术界以及科研单位提出数据资产的科学价值 评估体系 。 普华永道作为数据资产领域的先锋和倡导 者 , 撰写本白皮书旨在响应国家推动数据要素市场化 的号召 , 为政府以及社会各界提供数据资产估值领域 的最新思考与探索 。 1 IDC, 数据时代 2025 报告 普华永道认为 , 公共开放数据正如数据资产生态系统 里的 “ 土壤 ” , 为加快我国数字化发展 , 建设 “ 数字 中国 ” 提供支撑 。 一方面 , 各级政府部门拥有大量基 础性 、 关键性的数据资源 , 掌握着社会绝大部分数据 , 包括交通 、 金融 、 电信 、 工商 、 卫生等行业 。 另一方 面 , 大小企业 、 个人 、 数据中介等社会主体也采集和 存储了大量具有公共属性和公共价值的数据 。 在保障 国家安全 、 商业机密和个人隐私的首要前提下 , 将这 些公共开放数据最大化开放 , 供全社会进行开发利用 , 有利于培育数据要素市场 , 释放公共开放数据的社会 与经济价值 。 作为开放数据的重要组成部分 , 公共开放数据是政府 向全社会提供的一种公共服务 。 数据开放始源于美国 政府在 2009年推广的开放政府数据 , 随后在全球范围 内掀起一波开放政府数据的浪潮 。 在此大背景的推动 下 , 上海率先于 2012年向社会发布上海公共数据开放 网站 , 即上海市公共数据开放平台的前身 。 上海作为 公共数据开放平台建设的标杆 , 其公共数据开放平台 于 2019年正式上线以来 , 现已覆盖 144个公共数据开 放机构 , 包括 5000多个开放数据集 , 包含近十亿条数 据 。 这类开放平台的首页几乎都展示了总数据量 、 总 应用数量等重要信息 , 以及各类应用场景 , 通常包括 交通出行 、 培训与就业 、 城市安全 、 学校教育与终身 教育 、 就医与保健 、 社会保险 、 政府办事 、 婚育 、 社 区周边生活服务等 。 开放数据的方式除了传统的 Excel之外 , 还有可以实时更新的开放 API。 上海每年 通过公共数据开放平台发布 政府网站工作年度报 表 , 其他省市也会发布类似报表 , 以展现一年来的 数据公开成果 。 图 3: 数据资产相关政策及法案颁布时间轴 6开放数据资产估值白皮书 从政策方面看 , 2013年 6月 , 法国 、 美国 、 英国 、 德 国 、 日本 、 意大利 、 加拿大和俄罗斯八国签署 开放 数据宪章 , 为各国开放数据奠定基础以及实践原则 。 从此 , 数据开放成为当今世界各国的共同趋势 。 中国 也顺应趋势 , 于 2015年首次在 促进大数据发展行动 纲要 中明确大力推动 “ 公共数据互联开放共享 ” , 而且要 “ 推进数据资源向社会开放 , 增强政府公信 力 ” 。 各省市政府开始推行公共数据的开放 , 全国政 府公共数据开放呈现爆发式增长 。 2020年 , 我国进一 步明确提出 “ 加快培育数据要素市场 ” , 将数据纳入 五大生产要素中 。 从合规的角度看 , 监管机构高度关注数据安全和隐私 保护 , 于 2020年出台草案倡议 , 旨在明确数据安全法 律责任 , 完善监管体系 , 保障国家安全 、 公民个人隐 私权益和社会安全稳定 , 其中对政务数据的安全与开 放也提出了明确的要求 。 于 2021正式发布的 “ 十四五 ” 规划中也明确提到 “ 鼓励企业开放搜索 、 电商 、 社交 等数据 , 发展第三方大数据服务产业 ” , 表明数据开 放不仅限于政府公共数据 , 也包含企业数据开放 。 截 至 2020年底 , 全国已有 18个省级政府公共数据开放平 台 , 以及 124个副省级和地级政府公共数据开放平台 。 普华永道观察到 , 国内有些省份目前将政府公共数据 开放平台安排在副省级和地市级政府层面 , 比如江苏 、 安徽和湖北等 , 因此这些地区尚未出现省级政府公共 数据开放平台 。 即便如此 , 数字中国正在蓬勃发展 。 数据开放是提高政府透明度 、 责任度和社会参与度的 重要原则之一 。 政府部门机构向内外部公开数据成为 达成这一目标的重要机制 。 图 4: 2012-2020年我国地方政府公共开放 数据平台数量增长情况 3 3 4 10 15 20 56 102 142 2012 2013 2014 2015 2016 2017 2018 2019 2020 (单位 : 个) 资料来源:复旦 DMG前瞻产业研究院整理 7 开放数据资产估值白皮书 图 5:合规关键要素 定义数据安全事件 响应和管理程序 合规关键 要素 建立并沟通关于数 据安全和隐私保护 的内部政策 定期实施培训以提 高员工的数据安全 意识程度 对新项目或者相关系统 /流程 改造开展数据安全及隐私保 护评估计划 开发和维护有效的数据 /隐私 保护治理框架 数据全生命周期的 跟踪 、 识别及保护 了解涉及处理数据的 所有第三方已充分考 虑到数据安全和隐私 保护要求 任命数据保护负责人 处理与数据安全和隐私 保护相关的事宜 从法律方面看 , 目前 , 全国已有 9个地方制定了专门 针对数据开放的政策法规 , 其中浙江 、 天津 、 哈尔滨 、 青岛和重庆在 2020年新制定了相关政策法规 。 在效力 等级上 , 浙江省制定的是地方政府规章 , 其余 4个地 方则为地方规范性文件 。 法规政策是推进政府数据开 放的法制基础和重要依据 。 数据安全法 与 网络 安全法 、 数据安全管理办法 ( 征求意见稿 ) 、 个人信息和重要数据出境安全评估办法 ( 征求意见 稿 ) 相衔接 , 由国家层面建立数据分类分级保护制 度 , 根据数据在经济社会发展中的发展程度 , 以及一 旦遭到篡改 、 破坏 、 泄露或者非法获取 、 非法利用 , 对国家安全 、 公共利益或者个人 、 组织合法权益造成 的危害程度 , 对数据实行分类分级保护 。 政务数据具 有两面性的特点 , 一方面 , 需要不断推进政务数据的 透明开放 , 提升社会治理水平;另一方面 , 因政务数 据具有特殊性 , 事关国家安全 , 一旦被滥用或非法泄 露 , 会对国家和社会产生危害 。 数据安全法 中明 确提出 “ 国家机关应当遵循公正 、 公平 、 便民的原则 , 按照规定及时 、 准确地公开政务数据 。 国家制定政务 数据开放目录 , 构建统一规范 、 互联互通 、 安全可控 的政务数据开放平台 , 推动政务数据开放利用 。 ” 同 时也明确规定国家机关委托他人建设 、 维护电子政务 系统 , 存储 、 加工政务数据 , 应当经过严格的批准程 序 , 并应当监督受托方履行相应的数据安全保护义务 。 受托方应当依照法律 、 法规的规定和合同约定履行数 据安全保护义务 , 不得擅自留存 、 使用 、 泄露或者向 他人提供政务数据 。 数据安全法 利于平衡政务数 据开放及安全之间的需求 , 并强化了对个人信息 、 隐 私在内的保护要求 , 同时也约束了第三方的数据安全 义务 。 8开放数据资产估值白皮书 资料来源:普华永道分析 从经济方面看 , 在 2014年 , 国家宣布计划公开政府层 面企业工商信息 , 三家专注于商家工商信息查询服务 平台先后成立 。 这几家公司的核心原理是通过爬虫技 术从国家工商信息网站等政府机构官方网站以及互联 网公开数据中爬取企业信息 , 进而形成商业信息报告 , 提供给 B端和 C端用户 。 这些平台免费提供基础权限 使用 , 高级权限使用需按年付费成为会员后才可访问 内容 , 包括其网站以及 APP。 相比于欧美国家从政府 公共开放数据衍生出来的多元化商业模式 , 包括使用 医疗开放数据为康复病人推荐最为合适的医疗机构 ( Aidin) 、 使用公开的土壤以及气候公开数据帮助农 民提供及时全面的农场生产力全景 ( AgSquare) 、 使用公共开放数据进行研究并且推荐如何解决社会问 题 ( Abt Associates) 等 , 中国目前公共开放数据的 商业模式显得相对单一 , 有待全面发力创造多元化商 业模式 , 未来可期 。 由于公共开放数据资产缺乏估值 标准 , 其价值难以得到公众认可 , 这也阻碍了其流通 性 。 因此 , 公共开放数据资产亟需一套合理的估值体 系来释放其核心价值以及流通性 。 从社会方面看 , 中国自 2015年开始已逐渐形成公开数 据对 “ 惠民 ” 以及 “ 智慧政务 ” 的认知 。 尽管政府部 门仍在努力推进数据公开透明程度 、 数据问责和数据 质量治理的进程中 , 社会群众对建立公共数据共享社 会作为一种理念的转变确已形成 。 对公共开放数据价 值的挖掘帮助政府更好地利用大数据来服务百姓 , 数 字政府为民办事的效率大大提升 。 经济合作与发展组 织 ( OECD) 于 2020年 10月发布 数字政府指数 ( DGI) 2019 报告 。 该报告从 6个维度衡量了 33个 国家公共部门的数字化水平 、 效率和透明度 。 该报告 的重要洞察表明 , 大多数国家在数字政府改革中缺乏 用户和利益相关者的积极参与 , 在数字化公共服务的 设计 、 实施 、 交付和监控过程中无法全面考虑到用户 的需求 、 期望和偏好 。 根据普华永道观察 , 中国面临 同样的困难 , 只有考虑到用户的需求才能更好地促进 数字化政府的变革 。 目前 , 全国各省级政府公共数据 开放平台访问量和下载量都相对较少 , 宣传推广投入 也有待提升 , 种种迹象表明我国可能需要从顶层设计 与配套实施开始重新思考用户需求 , 全面提高用户体 验 , 吸引社会各方大力挖掘开发公共开放数据的价值 。 从技术方面看 , 数据开放是在政府大数据局以及大数 据中心汇聚的数据基础上进行开放的 。 目前省级开放 平台 , 在数据跨部门的横向打通上仍然面临一些障碍 , 比如数据只能查询不能入库 , 数据的完整性 、 实时性 、 准确性也缺乏交叉检验或者核实 。 通常看到的情况是 , 数据字段非常多 , 但真正能发挥价值的不多 , 因为没 有办法去核实数据的实用性 。 目前公共开放数据尚缺 乏类似 “ 撞库 ” 或者区分度的方法论或实践 , 只有尽 快铺开去实验这些保护数据隐私计算的方式 , 才能发 掘出数据更多的价值 。 目前公共开放数据运用的基本技术包括以下两方面 : 1. 大数据处理技术:提供数据集的多版本控制 , 以及 访问权限控制 。 2. 安全防护技术:提供有效数据的同时 , 防止爬虫扫 描 , 防止恶意盗取有条件开放的数据资源 。 在此基础上 , 目前开放数据在技术上在进行以下几方 面的尝试: 1. 敏感数据自动发现:开放数据上传目前大量依靠人 工审核才能发布 。 该技术帮助相关部门在数据发布前 进行审核 , 防止敏感数据上传公开 。 2. 多层数据融合汇聚:该技术能将分层存储在各个系 统的分散数据进行汇聚 , 节省了时间和人力成本 。 3. 数据自动化发布流程:将日常政务数据发布流程标 准化 、 自动化 , 确保输出数据的一致性和及时性 。 4. 隐私计算技术:适用于有限政府数据开放环境下 , 如上海的普惠金融开放数据 。 开放平台需提供一套可 信安全计算环境 , 在数据可计算的情况下 , 保护公民 和企业的敏感信息 , 确保数据 “ 可用不可见 ” , 计算 结果按权属分发给参与方 。 5. 联邦学习技术:该技术能有效帮助多个机构在满足 用户隐私保护 、 数据安全和政府法规的要求下 , 进行 数据使用和机器学习建模 , 特别适合关系网络的跨平 台数据联合 。 9 开放数据资产估值白皮书 公共开放数据资产评估 运用传统估值思路的挑战 10开放数据资产估值白皮书 目前 , 数据资产这一相对前沿的概念 , 在全球范围内 均尚未形成较为成熟的估值体系 。 本次研究所聚焦的 公共开放数据资产 , 由于具有较强的普惠性 , 且短期 内不以商业化为目标 , 以传统的估值思路对其进行评 价 , 往往无法完全反映其包括社会价值以及经济价值 在内的潜在价值 。 估值思路 估值思路 说明 应用于 公共开放 数据估值可能 面临 的不足 传统估值思路 成本途径 成本途径是从产生数据资产所需花费的成本 进行评估的一种估值方式 。 数据资产的重置成本通常包括存储成本 、 加 工成本及运维成本 。 成本途径仅从数据开发 、 构建及维护所花费的成本 角度进行分析 。 然而考虑到 公共开放 数据的 普惠性 及 前沿性 , 传统的成本法在应用时无法完全反映公 共开放数据带来的潜在社会价值及经济价值 。 收益途径 对数据资产投入使用后的预期收益能力进行 评估的一种估值方式 。 具体为将全部收益扣除其他资产的贡献后归 属于数据资产的现金流 , 以适当折现率进行 折现得出 。 公共开放数据资产具有明显的 普惠性 ,在目前及可 预见的未来其使用方式仍为政府免费提供的公开数 据,短期内并未有效仿商业化公司对于数据的使用 收取年费的计划,也未有提供以盈利为目的的数据 定制化以及加工服务的计划,因此很难通过量化方 式估计未来收益;同时,因其 独特性 ,亦无法从市 场观测计算出合适的折现率进行测算。 市场途径 基于相同或相似数据资产的可比市场交易案 例进行评估的一种估值方式 。 在拥有市场交易价格的基础上 , 对数据资产 的性质等相关因素进行修正 , 从而估算 出 标 的数据资产的市场价值 。 考虑到公共开放数据的 普惠性 , 即数据为免费开放 让社会各方挖掘利用 , 而目前国内也没有完全围绕 政府数据进行的市场交易 , 因此并不存在一个公开 并活跃的交易市场 , 亦没有可获取的交易价格 。 创新或衍生估值思路 实物期权法 实物期权法通常用于不确定的市场环境下的 资产或权益 , 其考虑了管理决策者在投资 、 生产以及产品研发等问题决策中的选择权 , 因而能充分反映资产的选择权价值 。 实物期权法运用于数据资产估值时 , 需考虑 数据资产的价值不仅包括数据产生的收益 , 而且还包括决策者 ( 数据使用者 ) 的选择权 所带来的收益 , 即期权价值 。 因公共开放数据资产具有明显的 普惠性 , 与前述收 益途径的适用局限类似 , 无法通过量化方式估计各 选择权下的未来收益 , 同时 , 由于数据的使用场景 多样 , 且数据的价值在不同的场景下大多不同 , 基 于现有信息估计不同场景下的价值具有较大主 观性 。 模糊 综合 评价法 模糊综合评价法是一种基于模糊数学的综合 评价方法 , 通常运用层次分析法 , 请专家针 对数据的各评价指标进行打分 , 将定性评价 转化为定量指标 , 最终 得到数据资产价值 。 由于公共开放数据带来的潜在社会价值及经济价值 远高于其原始投入成本 , 如仅基于模糊 综合 评价法 估计潜在社会价值和经济价值将因缺少标尺而导致 较大的主观性 。 因此我们仅考虑在涉及调整系数 ( 如数据质量调整系数 ) 的 选用 中采用模糊 综合 评 价法 。 神经网络模型 假设成交数据资产和未成交数据资产的价值 服从同一分布 , 成交数据的价值是已知的 , 未成交数据的价值是未知的 。 然后收集公开 的数据资产交易数据 , 分析影响数据资产成 交价格的相关因素 , 然后通过神经网络模型 对成交数据价值的变动进行模拟 , 在此基础 上建立样本中输入变量 ( 即影响数据资产价 值的相关因素 ) 和输出结果 ( 数据资产价值 ) 的关系 。 随后代入未成交数据资产的因素变 量 , 就可以得到这些数据的价值 。 因公共开放数据的 普惠性 , 即数据免费开放让社会 各方挖掘利用 , 而且 目前国内也没有完全围绕政府 数据进行的市场交易 , 因此并不存在一个公开并活 跃的交易市场 , 亦没有可获取的交易价格 , 作为神 经网络模型的基础 。 基于上述分析 , 普华永道从当前我国省级政府公共数 据开放平台上所提供的公共开放数据作为切入点 , 通 过借用物理学中的 “ 重力势能 ” 概念 , 提出创新的 “ 数据势能 ” 概念以及实证探究 。 此方法论目前仍处 在尝试探索阶段 , 虽取得了初步成果 , 但还需进一步 的深入研究与论证 。 作为数据资产领域的先锋和倡导 者 , 普华永道希望通过本白皮书呼吁社会各方认识到 数据资产估值所面临的主要挑战 , 并且积极参与到数 据资产估值的探索之中 , 为提升对数据资产价值的认 可做出贡献 。 11 开放数据资产估值白皮书 图 6:估值思路简介 “数据势能” 估值体系及实证探究 12开放数据资产估值白皮书 “ 数据势能 ” 估值概念 物理学中的势能 ( Potential Energy) , 是指储存于一 个系统内的潜在能量 , 即还未释放出来的能量 。 根据 物理学能量守恒定律 , 势能可以释放或者转化为其他 形式的能量 , 这种能量就是价值 。 普华永道认为 , 公 共数据开放的价值与势能的概念极为相似 。 其一 , 公 共开放数据在数据资产生态这一系统内作为 “ 土壤 ” 存在 , 起到基础性的作用 。 其二 , 我国的公共数据开 放尚处于早期实践阶段 , 至今不到 10年的历史沉淀 。 虽然截至 2020年底 , 全国已有 142个省市级公共数据 开放平台正式上线 , 但仍有 40%的省份还未上线省级 公共数据开放平台 , 因此公共开放数据的潜在价值巨 大 , 有待挖掘开发 。 其三 , 我国数据资产价值正处于 存储积累的状态中 , 蓄势待发 。 通过此次研究观察到 , 已上线的公共数据开放平台从平台前期构建成本投入 、 上传数据的质量 、 总下载量 、 应用场景多样性等方面 在我国各省市级公共数据开放平台都参差不齐 , 可优 化空间较大 。 随着各开放平台的开放 API数量的增加 、 上传数据质量的完善 , 开放数据集以及开放数据总量 的积累 、 基于开放数据的应用程序的增多 , 我国公共 开放数据资产价值也将不断积累 、 不断提升 。 普华永道认为 , 传统的估值途径在公共开放的数据价 值分析中略显单薄 , 对于该类具有较强普惠性的资产 , 建议针对其特征搭建全新的估值体系 。 1 2 3 数据开发价值 潜在社会价值 潜在经济价值 定义 数据在尚未被公众使用时 , 其价 值仅仅为提供数据所需要的成 本 , 即数据开发价值 关键价值驱动因素 全系构建成本 数据质量综合评分体系 定义 在提供 “ 惠民 ” 以及 “ 智慧政 务 ” 的过程中 , 数据的潜在社 会价值逐步彰显 , 达到远高于 其开发价值的 “ 数据高度 ” 关键价值驱动因素 用户下载量 /点击量 人民整体生活质量及效率提升 人民幸福指数 定义 数据资产应用于医疗 、 金融 、 教 育 、 交通 、 能源等多个领域 。 随 着应用场景的增加 , 数据资产的 经济价值呈指数级扩大 关键价值驱动因素 数据经济增长率 /GDP增长率 潜在应用场景的多样化 从公共开放数据资产的特性及构成提炼关键价值 驱动因素 公共开放数据价值包含数据开发价值与数据潜在价值 。 前者由全系构建成本与公共开放数据质量调整系数组 成 。 后者则由公共开放数据的潜在社会价值以及潜在 经济价值组成 。 13 开放数据资产估值白皮书 图 7: 数据开发价值与潜在价值定义以及关键价值驱动因素 以微观角度搭建体系 , 以宏观角度进行验证 近年来 , 全国各省市纷纷启动数字经济战略行动 , 发 挥数字经济相关产业先行先试优势 , 聚集了各地政治 、 经济 、 文化 、 金融 、 交通等优质资源 , 以公共数据开 放为基础打造 “ 数字高地 ” , 拓展服务民生新渠道 , 数据 “ 惠民 ” , 形成了巨大的潜在社会价值 。 同时 , 在数据经济整体增长助力下 , 进一步赋能公共数据开 放产生潜在经济价值 。 基于此 , 公开数据的价值将远 远高于其单纯的数据开发价值 , 即其中蕴含着巨大潜 在社会价值和经济价值 。 因此 , 普华永道尝试借用物 理学中的 “ 重力势能 ” ( 具体公式为 Ep=MgH) , 首 次提出 “ 数据势能 ” 概念 , 对应的 “ 数据势能 ” 估值 模型应运而生 。 微观角度 ,从公共开发数据的特征及撬动其潜在价 值的关键因素出发,推出 “数据势能 ”公式,即 公共数据资产价值 = 公共数据开发价值 *潜在社会价 值呈现因子 *潜在经济价值呈现因子 宏观角度 ,从国民经济生产总值出 发,剖析数据经济总值占国民经济 之比例,通过成分分析层层推出公 共开放数据可能的价值区间 14开放数据资产估值白皮书 “ 数据势能 ” 公式 公共数据资产价值 = 公共数据开发价值 *潜在社会价 值呈现因子 *潜在经济价值呈现因子 下文我们逐一剖析 “ 数据势能 ” 估值体系下的关键 参数 。 公共开放数据开发价值 , 对应传统重力势能公式中的 M (质量 ), 即相对固定的因素 , 等于全系构建成本 *公 共开放数据质量调整系数 。 全系构建成本指的是构建一个数据资产所需全部投入 , 包括初始建设成本 、 期间全部运维成本及管理成本 , 具体为: 存储成本:数据存储占用的基础设施 ( 机房 、 机柜 、 存储设备等 ) 的成本按数据容量折算后的价值; 加工成本:数据加工过程中设计的物力 ( 服务器 、 软件等 ) 和人力 ( 员工成本 、 下包商费用 、 项目费 用等 ) ; 运维成本:保障数据正常可靠服务所需的动力 ( 服 务器 、 软件等 ) 和人力 ( 员工成本 ) ; 公共开放数据质量调整系数则是第三方数据资产专家 根据数据资产的特性 , 从公共开放数据的准确性 、 完 整性 、 及时性 、 时效性 , 及唯一性等五个维度逐一进 行打分评价 , 再经过加权平均后最终得出的结果 2。 准确性 衡量所采集数据的 准确程度 。 数据的 准确性越高 , 可分 析性越强 , 数据的 价值也越大 。 完整性 衡量所采集数据是 否存在缺失 , 若重 要数据存在缺失 , 可能未来将支付额 外成本进行数据 补充 。 及时性 衡量数据更新频率 的快慢 , 反应数据 世界与客观世界的 同步程度 。 数据的 及时性主要与数据 的同步和处理过程 的效率相关 。 时效性 衡量最后一次数据 更新时点与期望有 效时间之间的差距 , 对于需要持续跟踪 最新数据的用户来 说具有较大意义 。 唯一性 衡量是否存在重复 数据 , 若数据重复 性较高 , 会导致后 续分析结果失真 。 2 数据资产价值评估模型的理论研究与技术实现探讨 , 上海数 据分析网 15 开放数据资产估值白皮书 图 8: 公共开放数据质量五个维度的含义 潜在社会价值呈现因子 , 对应传统重力势能公式中的 H (高度 ) 在我国加快数字社会建设步伐的大背景下 , 秉持 “ 以 民为本 ” 的发展理念 , 且将 “ 构筑全民畅享的数字生 活 ” 。 作为近五年国家的战略规划 , “ 惠民 ” 成为公 共开放数据越来越重要的社会价值体现 。 其另一方面 的社会价值体现在 “ 提高数字政府建设水平 ” , 在公 共开放数据的基础上 , 将数字技术广泛应用于政府管 理中 , 不断提高决策科学性和服务效率 。 利用大数据 以及人工智能等数字技术洞察民生以及政府需求 , 又 将此技术用于拓展服务民生 、 服务政府等新渠道 , 在 提供 “ 惠民 ” 以及 “ 智慧政务 ” 的过程中 , 达到远高 于其开发价值的 “ 数据高度 ” 。 “ 惠民 ” 结果可直接从宏观效果观察得出 , 人民整体 生活质量以及效率的提高 、 幸福指数的增加为公开数 据社会价值的表象 。 “ 智慧政务 ” 结果也可从百姓对 政府工作的 “ 好差评 ” 评价体系中得以体现 , 以及政 府内部效率的提升为社会价值的表象 。 但由于获取此 类数据难度较大 , 且评判可能较为主观 , 因此本文在 研究过程中更多考虑使用可直接量化的的参数指标 , 即公共开放数据实际累计下载量 。 公共开放数据实际 累计下载量可以全面反映社会对数据开放平台的认知 水平和运用的活跃度 。 下载即使用 , 用户下载量是反 映公共开放数据社会价值最具代表性的指标 , 原因如 下: 其一 , 公共开放数据的下载量能反映全社会 , 包括个 人 、 企业 、 政府对于数据的主动关注程度 , 以及数据 的有效触及率; 其二 , 下载量能体现终端用户对于数据价值及数据可 利用性的认可 , 公众将其认为有参考意义的信息下载 后 , 更可能在未来加以分析 , 在更加长期的时间里开 发数据的价值; 其三 , 在当前公共数据开放的早期阶段 , 公众对于公 共开放数据的获取和了解较少 , 公共开放数据的社会 价值并未被充分开发和利用 , 仍停留在较低水平 。 随 着公众对于公共开放数据价值的认知不断提升 , 下载 量的逐渐增加 , 公共开放数据在社会中得到更为广泛 的流通及更多场景的应用 , 逐步改变社会生活方式及 经济商业模式 , 产生巨大的杠杆效应 , 公共开放数据 的价值也将加速上升 。 考 虑 社 会 价 值 后 的 数 据 资 产 价 值 数据下载量 “ 十四五 ” 以及 2035年远景期间 , 在我国加快数字社会建设步伐的 大背景下 , 数据经济迅速发展 。 中国信通院的数据显示 , 预计 2021至 2025年 , 我国数字经济 年均增速将保持在 15%左右 。 数据经济发展初期 数据经济发展稳定期 在此阶段 , 绝大部分群众对数据 平台的认识基本完善 , 数字经济 发展进入稳定期 , 新增下载对整 体社会价值的贡献率会逐渐下降 。 数据经济发展成长期 2021年前 20212035年 2035年以后 在数据经济发展早期 , 数据尚未 被公众使用时 , 其价值仅为数据 开发价值 。 随着数据经济的进一 步发展 , 在提供 “ 惠民 ” 以及 “ 智慧政务 ” 的 过程中 , 数据的 潜在社会价值逐步彰显 。 16开放数据资产估值白皮书 图 9: 潜在社会价值与数据下载量的正向非线性关系 在选定下载量为量化指标的基础上 , 我们引入了指数 介于 0.5-1之间的幂函数来量化潜在社会价值 ( H) 。 这一函数的图像如上图所示 , 反映出社会价值的增长 与数据下载量的正向非线性关系 , 即价值的增长随着 下载量的增加逐渐降低 , 符合边际递减规律 , 正如图 中曲线的斜率会从陡峭变得平缓 。 在公共数据开放平 台发展初期 , 下载量基数较小 , 群众对公共数据开放 平台的认知以及开发利用逐渐形成 , 新增单位下载量 带来的社会价值贡献度较高;到了成长期 , 群众对数 据平台的认识逐渐提高 , 新增下载对整体社会价值的 贡献率会持续上升 , 但不如发展初期迅猛;到了稳定 期 , 对公共数据的开发利用基本饱和的情况下 , 公共 开放数据带来的社会价值将逐渐平缓 , 趋向最大化 。 潜在经济价值呈现因子 , 对应传统重力势能公式的 g ( 重力加速度 ) , 在此我们将其定义为转换率 。 有别于传统的势能公式 , 在 “ 数据势能 ” 中 , 该因子 为非恒定因素 , 公式 =( 1+g) x, 其中 g为数字经济名 义增长率 , x为第三方数据资产专家对公共开放数据 应用场景多样性评分所对应的数值 。 根据现阶段的观 察研究 , 潜在经济价值是在潜在社会价值的基础上实 现的潜在经济价值的转换 。 2016年 G20杭州峰会发布的 二十国集团数字经济发 展与合作倡议 指出 , 数字经济是指以使用数字化的 知识和信息作为关键生产要素 、 以现代信息网络作为
展开阅读全文