资源描述
开放数据资产估值白皮书前言中国的公共开放数据资产现状数据资产化在中国已成为重要趋势公共开放数据正蓬勃发展公共开放数据资产评估运用传统估值思路的挑战“数据势能”估值体系及实证探究“数据势能”估值概念“数据势能”公式“数据势能”估值体系在实证方面的初试及探析宏观合理性测试分析公共开放数据资产的应用与分析最具潜力的 5大公共开放数据排行榜全国公共开放数据 10佳实践案例对标与展望结束语参考文献联系人234510121315182324252729303031目录1 开放数资产估值白皮书前言数据资产化是数据要素的重要趋势 , 旨在最大化释放数据的核心价值 。 在全球数据开放的大背景下 , 我国公共数据开放的步伐在近年来进一步提速 。 公共开放数据在数据资产生态中起到基础性的作用 , 为加快我国数字化发展 , 建设“ 数字中国 ” 提供支撑 。 当前 , 全国已有 18个省级公共数据开放平台正式上线 ,免费为社会各方提供相关政府单位的公开数据 。 但免费并不等同于没有价值 。公共开放数据在 “ 惠民 ” 以及 “ 智慧政务 ” 方面产生了巨大的潜在社会价值 。目前 , 公共开放数据的应用场景正在不断丰富的过程中 , 假以时日 , 必将蓄积巨大的潜在经济价值 , 未来可期 。数据资产估值是未来数据资产价值释放的核心环节 。 然而 , 由于公共开放数据自身的独特性 , 将传统估值思路应用于其估值时面临诸多挑战 。 本白皮书首次借用物理学中的 “ 势能 ” 概念作为理论基础 , 推出 “ 数据势能 ” 新概念及其相应的估值逻辑 , 就政府公共开放数据的估值体系进行研究和探讨 , 旨在根据公共开发数据资产的特点 , 发掘其特有的价值驱动因素及其魅力所在 , 进一步揭示能够撬动其估值体系的支点 。此方法论目前仍处在尝试探索阶段 , 虽取得了初步成果 , 但仍需进一步深入研究与论证 。 普华永道欢迎学术界 、 科研单位以及业内人士与我们开展深度交流探讨 , 携手助推我国数据资产化发展的步伐 , 为 “ 数字中国 ” 建设尽绵薄之力 。2开放数据 资产估值白皮书中国的公共开放数据资产现状3 开放数据资产估值白皮书数据资产化已成为重要趋势4开放数据资产估值白皮书在现今快速发展的数字经济新时代 , 中国作为数据生产大国已明确表明数据在我国社会经济发展中的重要战略意义 。 2020年 4月 9日 , 中共中央 、 国务院发布 关于构建更加完善的要素市场化配置体制机制的意见 (简称 意见 ), 将数据确立为五大生产要素之一 , 与土地 、 资本 、 劳动力以及技术等传统生产要素一样 , 数据将成为可市场化配置的生产要素 。 意见 强调 , 要加快培育数据要素市场 , 具体体现在推进政府数据开放共享 、 提升社会数据资源价值 , 以及加强数据资源整合和安全保护 。 2021年 6月 10日 , 数据安全法 正式表决通过 , 并将于 2021年 9月正式生效 ,该法旨在建立工作协调机制 , 加强对数据安全工作的统筹 , 进一步完善保障政务数据安全方面的规定 。 数据安全法 是继 网络安全法 提出数据的概念后 , 我国在数据安全立法层面的又一个重大里程碑 ,将成为中国数字经济高速发展的压舱石和中国数据资产化稳定发展的指路明灯 。随着数据要素市场的发展 , 数据将更加资产化 。 但从经济和法律视角来看 , 资产具有三项核心特征:其一 ,资产应归属某主体所有或控制 , 即权属明确;其二 ,资产能够产生既有的或预期的经济利益;其三 , 资产是一种资源 , 具有稀缺性 。 而对于当今的数字世界来说 , 数据的无限采集 、 可复制性以及取之不竭的特性导致其作为资产存在的特殊性 。 首先 , 数据资产主体具有多重性 , 即权属模糊 , 例如数据从生产到流转的过程中 , 可产生衍生数据及衍生数据主体;其次 , 数据资产对当前经济生产经营及未来预测的经济利益需以资产的合理估值为前提 , 但数据资产的估值当前并不存在统一 、 普适性的估值依据;再次 , 数据作为一种无形资产 , 与黄金 、 石油等不可再生资源的稀缺性相比 , 数据的稀缺性是相对的动态概念 , 在特定场景和时间节点 , 数据具有极高的稀缺性 , 从某种意义上 ,数据资产是取之不尽 、 用之不竭的 。 伴随着中国数字经济的发展 , 数据资产化对于国家治理 、 市场配置 、企业运营和个人权益四个领域影响深远 。 普华永道认为 , 数据资产化已成为中国以数据驱动社会发展的重要趋势 , 当前各利益相关方的行动也正在为这一进程扫除障碍 , 包括以上提及的三点 。普华永道在 2020年 11月发布的 数据资产生态白皮书 中写道 , 数据如同水与空气的数字化时代已至 。 数据的价值迎来了悄无声息却影响深远的革新 , 数据不再仅仅是宝藏或者石油这样直白的物质财富代表 , 而已经发展为如同水与空气一般重要的必需品 。 首先 , 水与空气是每个个体日常生活中无法缺失的重要资源 ,即使存在感有时无法察觉 , 而一旦失去就会导致机体的崩溃 , 同样 , 人们对于数据也已习以为常 , 生活与生产已经无法离开数据的支撑 。 其次 , 水与空气是自然界无处不在的巨大资源供给 , 而数据也已经在潜移默化间成为个人 、 企业与政府正常运作即可获得的重要资源之一 , 如同水与空气一样影响着每一个个体 。最后 , 水与空气看似廉价 , 却能在相关介质的配合下催生出长久持续的能量 , 例如水电 , 数据自身虽然微小 , 同样也能通过聚合效应驱动质变 。图 1:全球数据量增长预测2 4 6 8 10 1416 2040 5060 70801001301750204060801001201401601802002010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020E 2021E 2022E 2023E 2024E 2025E(单位 : ZB)资料来源: IDC, 数据时代 2025 报告根据世界银行的定义 , 开放数据是 “ 能被任何人出于任何目的不受限制地进行自由利用 、 再利用和分发 ,并最大程度保持其原始出处和开放性的数据 ” 。图 2:平衡的数据资产生态系统数据生产者 个人 /企业(树木)数据资产(氧气)O2政府管控与治理 /数据要素市场数据确权与定价指导(阳光,光合作用)数据消费者 小企业(食草动物,初级消费者)数据消费者 大企业(食肉动物,高级消费者)数据中介 数据银行、数据信托、数据运营商(云,大气循环)数据资产(水)资料来源:普华永道分析公共开放数据(土壤)数据中介(微生物,分解者)P 政策 /法律 E 经济 S 社会 T 技术科研机构 /学术单位公共开放数据正蓬勃发展5 开放数据资产估值白皮书数据资产化旨在最大化释放数据的核心价值以及流通性 。 根据国际数据公司 ( IDC) 对全球 “ 数据圈 ” 的研究预测 , 2025年全球数据量将达到 175ZB。 中国2018年产生了 7.6ZB的数据 。 IDC预计 , 中国的 “ 数据圈 ” 将会在 2018年至 2025年之间扩张 14倍左右 ,以每年 30%的平均增速快速发展 , 在 2025年达到48.6ZB, 也就是 48.6万亿 GB1。 届时 , 中国将远超美国 , 问鼎数据圈的 “ 金山 ” , 成为全球第一 。 坐拥如此庞大的体量以及未来的潜力 , 社会各界谁能率先认识到数据的重要性 、 对丰富的数据资源加以合理运用 ,谁就能迅速把握时代风口 、 抢占行业先机 , 并创造惊人的经济利益 。与土地 、 资本 、 技术 、 劳动力等传统资产相比 , 数据带来的机遇与挑战也伴随左右 。 一方面 , 联通个人群体 、 企业机构与政府部门 , 数据通过开放 、 流通 、 采集 、 监测等不同方式释放巨大信息价值 , 重塑社会生活方式与经济商业模式 , 产生巨大杠杆效应;另一方面 , 如同空气和水面临污染威胁 , 数据也同样面临权属不清 、 估值不明 、 垄断使用等社会经济难题 , 导致这一价值潜力无限的资源难以真正实现市场化为主导的平衡 。 除了需要政府主导下的数据确权机制之外 ,还需要学术界以及科研单位提出数据资产的科学价值评估体系 。 普华永道作为数据资产领域的先锋和倡导者 , 撰写本白皮书旨在响应国家推动数据要素市场化的号召 , 为政府以及社会各界提供数据资产估值领域的最新思考与探索 。1 IDC, 数据时代 2025 报告普华永道认为 , 公共开放数据正如数据资产生态系统里的 “ 土壤 ” , 为加快我国数字化发展 , 建设 “ 数字中国 ” 提供支撑 。 一方面 , 各级政府部门拥有大量基础性 、 关键性的数据资源 , 掌握着社会绝大部分数据 ,包括交通 、 金融 、 电信 、 工商 、 卫生等行业 。 另一方面 , 大小企业 、 个人 、 数据中介等社会主体也采集和存储了大量具有公共属性和公共价值的数据 。 在保障国家安全 、 商业机密和个人隐私的首要前提下 , 将这些公共开放数据最大化开放 , 供全社会进行开发利用 ,有利于培育数据要素市场 , 释放公共开放数据的社会与经济价值 。作为开放数据的重要组成部分 , 公共开放数据是政府向全社会提供的一种公共服务 。 数据开放始源于美国政府在 2009年推广的开放政府数据 , 随后在全球范围内掀起一波开放政府数据的浪潮 。 在此大背景的推动下 , 上海率先于 2012年向社会发布上海公共数据开放网站 , 即上海市公共数据开放平台的前身 。 上海作为公共数据开放平台建设的标杆 , 其公共数据开放平台于 2019年正式上线以来 , 现已覆盖 144个公共数据开放机构 , 包括 5000多个开放数据集 , 包含近十亿条数据 。 这类开放平台的首页几乎都展示了总数据量 、 总应用数量等重要信息 , 以及各类应用场景 , 通常包括交通出行 、 培训与就业 、 城市安全 、 学校教育与终身教育 、 就医与保健 、 社会保险 、 政府办事 、 婚育 、 社区周边生活服务等 。 开放数据的方式除了传统的Excel之外 , 还有可以实时更新的开放 API。 上海每年通过公共数据开放平台发布 政府网站工作年度报表 , 其他省市也会发布类似报表 , 以展现一年来的数据公开成果 。图 3: 数据资产相关政策及法案颁布时间轴6开放数据资产估值白皮书从政策方面看 , 2013年 6月 , 法国 、 美国 、 英国 、 德国 、 日本 、 意大利 、 加拿大和俄罗斯八国签署 开放数据宪章 , 为各国开放数据奠定基础以及实践原则 。从此 , 数据开放成为当今世界各国的共同趋势 。 中国也顺应趋势 , 于 2015年首次在 促进大数据发展行动纲要 中明确大力推动 “ 公共数据互联开放共享 ” ,而且要 “ 推进数据资源向社会开放 , 增强政府公信力 ” 。 各省市政府开始推行公共数据的开放 , 全国政府公共数据开放呈现爆发式增长 。 2020年 , 我国进一步明确提出 “ 加快培育数据要素市场 ” , 将数据纳入五大生产要素中 。从合规的角度看 , 监管机构高度关注数据安全和隐私保护 , 于 2020年出台草案倡议 , 旨在明确数据安全法律责任 , 完善监管体系 , 保障国家安全 、 公民个人隐私权益和社会安全稳定 , 其中对政务数据的安全与开放也提出了明确的要求 。 于 2021正式发布的 “ 十四五 ”规划中也明确提到 “ 鼓励企业开放搜索 、 电商 、 社交等数据 , 发展第三方大数据服务产业 ” , 表明数据开放不仅限于政府公共数据 , 也包含企业数据开放 。 截至 2020年底 , 全国已有 18个省级政府公共数据开放平台 , 以及 124个副省级和地级政府公共数据开放平台 。普华永道观察到 , 国内有些省份目前将政府公共数据开放平台安排在副省级和地市级政府层面 , 比如江苏 、安徽和湖北等 , 因此这些地区尚未出现省级政府公共数据开放平台 。 即便如此 , 数字中国正在蓬勃发展 。数据开放是提高政府透明度 、 责任度和社会参与度的重要原则之一 。 政府部门机构向内外部公开数据成为达成这一目标的重要机制 。图 4: 2012-2020年我国地方政府公共开放数据平台数量增长情况3 3 4 1015 20561021422012 2013 2014 2015 2016 2017 2018 2019 2020(单位 : 个)资料来源:复旦 DMG前瞻产业研究院整理7 开放数据资产估值白皮书图 5:合规关键要素定义数据安全事件响应和管理程序合规关键要素建立并沟通关于数据安全和隐私保护的内部政策定期实施培训以提高员工的数据安全意识程度对新项目或者相关系统 /流程改造开展数据安全及隐私保护评估计划开发和维护有效的数据 /隐私保护治理框架数据全生命周期的跟踪 、 识别及保护了解涉及处理数据的所有第三方已充分考虑到数据安全和隐私保护要求任命数据保护负责人处理与数据安全和隐私保护相关的事宜从法律方面看 , 目前 , 全国已有 9个地方制定了专门针对数据开放的政策法规 , 其中浙江 、 天津 、 哈尔滨 、青岛和重庆在 2020年新制定了相关政策法规 。 在效力等级上 , 浙江省制定的是地方政府规章 , 其余 4个地方则为地方规范性文件 。 法规政策是推进政府数据开放的法制基础和重要依据 。 数据安全法 与 网络安全法 、 数据安全管理办法 ( 征求意见稿 ) 、 个人信息和重要数据出境安全评估办法 ( 征求意见稿 ) 相衔接 , 由国家层面建立数据分类分级保护制度 , 根据数据在经济社会发展中的发展程度 , 以及一旦遭到篡改 、 破坏 、 泄露或者非法获取 、 非法利用 ,对国家安全 、 公共利益或者个人 、 组织合法权益造成的危害程度 , 对数据实行分类分级保护 。 政务数据具有两面性的特点 , 一方面 , 需要不断推进政务数据的透明开放 , 提升社会治理水平;另一方面 , 因政务数据具有特殊性 , 事关国家安全 , 一旦被滥用或非法泄露 , 会对国家和社会产生危害 。 数据安全法 中明确提出 “ 国家机关应当遵循公正 、 公平 、 便民的原则 ,按照规定及时 、 准确地公开政务数据 。 国家制定政务数据开放目录 , 构建统一规范 、 互联互通 、 安全可控的政务数据开放平台 , 推动政务数据开放利用 。 ” 同时也明确规定国家机关委托他人建设 、 维护电子政务系统 , 存储 、 加工政务数据 , 应当经过严格的批准程序 , 并应当监督受托方履行相应的数据安全保护义务 。受托方应当依照法律 、 法规的规定和合同约定履行数据安全保护义务 , 不得擅自留存 、 使用 、 泄露或者向他人提供政务数据 。 数据安全法 利于平衡政务数据开放及安全之间的需求 , 并强化了对个人信息 、 隐私在内的保护要求 , 同时也约束了第三方的数据安全义务 。8开放数据资产估值白皮书资料来源:普华永道分析从经济方面看 , 在 2014年 , 国家宣布计划公开政府层面企业工商信息 , 三家专注于商家工商信息查询服务平台先后成立 。 这几家公司的核心原理是通过爬虫技术从国家工商信息网站等政府机构官方网站以及互联网公开数据中爬取企业信息 , 进而形成商业信息报告 ,提供给 B端和 C端用户 。 这些平台免费提供基础权限使用 , 高级权限使用需按年付费成为会员后才可访问内容 , 包括其网站以及 APP。 相比于欧美国家从政府公共开放数据衍生出来的多元化商业模式 , 包括使用医疗开放数据为康复病人推荐最为合适的医疗机构( Aidin) 、 使用公开的土壤以及气候公开数据帮助农民提供及时全面的农场生产力全景 ( AgSquare) 、使用公共开放数据进行研究并且推荐如何解决社会问题 ( Abt Associates) 等 , 中国目前公共开放数据的商业模式显得相对单一 , 有待全面发力创造多元化商业模式 , 未来可期 。 由于公共开放数据资产缺乏估值标准 , 其价值难以得到公众认可 , 这也阻碍了其流通性 。 因此 , 公共开放数据资产亟需一套合理的估值体系来释放其核心价值以及流通性 。从社会方面看 , 中国自 2015年开始已逐渐形成公开数据对 “ 惠民 ” 以及 “ 智慧政务 ” 的认知 。 尽管政府部门仍在努力推进数据公开透明程度 、 数据问责和数据质量治理的进程中 , 社会群众对建立公共数据共享社会作为一种理念的转变确已形成 。 对公共开放数据价值的挖掘帮助政府更好地利用大数据来服务百姓 , 数字政府为民办事的效率大大提升 。 经济合作与发展组织 ( OECD) 于 2020年 10月发布 数字政府指数( DGI) 2019 报告 。 该报告从 6个维度衡量了 33个国家公共部门的数字化水平 、 效率和透明度 。 该报告的重要洞察表明 , 大多数国家在数字政府改革中缺乏用户和利益相关者的积极参与 , 在数字化公共服务的设计 、 实施 、 交付和监控过程中无法全面考虑到用户的需求 、 期望和偏好 。 根据普华永道观察 , 中国面临同样的困难 , 只有考虑到用户的需求才能更好地促进数字化政府的变革 。 目前 , 全国各省级政府公共数据开放平台访问量和下载量都相对较少 , 宣传推广投入也有待提升 , 种种迹象表明我国可能需要从顶层设计与配套实施开始重新思考用户需求 , 全面提高用户体验 , 吸引社会各方大力挖掘开发公共开放数据的价值 。从技术方面看 , 数据开放是在政府大数据局以及大数据中心汇聚的数据基础上进行开放的 。 目前省级开放平台 , 在数据跨部门的横向打通上仍然面临一些障碍 ,比如数据只能查询不能入库 , 数据的完整性 、 实时性 、准确性也缺乏交叉检验或者核实 。 通常看到的情况是 ,数据字段非常多 , 但真正能发挥价值的不多 , 因为没有办法去核实数据的实用性 。 目前公共开放数据尚缺乏类似 “ 撞库 ” 或者区分度的方法论或实践 , 只有尽快铺开去实验这些保护数据隐私计算的方式 , 才能发掘出数据更多的价值 。目前公共开放数据运用的基本技术包括以下两方面 :1. 大数据处理技术:提供数据集的多版本控制 , 以及访问权限控制 。2. 安全防护技术:提供有效数据的同时 , 防止爬虫扫描 , 防止恶意盗取有条件开放的数据资源 。在此基础上 , 目前开放数据在技术上在进行以下几方面的尝试:1. 敏感数据自动发现:开放数据上传目前大量依靠人工审核才能发布 。 该技术帮助相关部门在数据发布前进行审核 , 防止敏感数据上传公开 。2. 多层数据融合汇聚:该技术能将分层存储在各个系统的分散数据进行汇聚 , 节省了时间和人力成本 。3. 数据自动化发布流程:将日常政务数据发布流程标准化 、 自动化 , 确保输出数据的一致性和及时性 。4. 隐私计算技术:适用于有限政府数据开放环境下 ,如上海的普惠金融开放数据 。 开放平台需提供一套可信安全计算环境 , 在数据可计算的情况下 , 保护公民和企业的敏感信息 , 确保数据 “ 可用不可见 ” , 计算结果按权属分发给参与方 。5. 联邦学习技术:该技术能有效帮助多个机构在满足用户隐私保护 、 数据安全和政府法规的要求下 , 进行数据使用和机器学习建模 , 特别适合关系网络的跨平台数据联合 。9 开放数据资产估值白皮书公共开放数据资产评估运用传统估值思路的挑战10开放数据资产估值白皮书目前 , 数据资产这一相对前沿的概念 , 在全球范围内均尚未形成较为成熟的估值体系 。 本次研究所聚焦的公共开放数据资产 , 由于具有较强的普惠性 , 且短期内不以商业化为目标 , 以传统的估值思路对其进行评价 , 往往无法完全反映其包括社会价值以及经济价值在内的潜在价值 。估值思路 估值思路 说明 应用于 公共开放 数据估值可能 面临 的不足传统估值思路成本途径成本途径是从产生数据资产所需花费的成本进行评估的一种估值方式 。数据资产的重置成本通常包括存储成本 、 加工成本及运维成本 。成本途径仅从数据开发 、 构建及维护所花费的成本角度进行分析 。 然而考虑到 公共开放 数据的 普惠性及 前沿性 , 传统的成本法在应用时无法完全反映公共开放数据带来的潜在社会价值及经济价值 。收益途径对数据资产投入使用后的预期收益能力进行评估的一种估值方式 。具体为将全部收益扣除其他资产的贡献后归属于数据资产的现金流 , 以适当折现率进行折现得出 。公共开放数据资产具有明显的 普惠性 ,在目前及可预见的未来其使用方式仍为政府免费提供的公开数据,短期内并未有效仿商业化公司对于数据的使用收取年费的计划,也未有提供以盈利为目的的数据定制化以及加工服务的计划,因此很难通过量化方式估计未来收益;同时,因其 独特性 ,亦无法从市场观测计算出合适的折现率进行测算。市场途径基于相同或相似数据资产的可比市场交易案例进行评估的一种估值方式 。在拥有市场交易价格的基础上 , 对数据资产的性质等相关因素进行修正 , 从而估算 出 标的数据资产的市场价值 。考虑到公共开放数据的 普惠性 , 即数据为免费开放让社会各方挖掘利用 , 而目前国内也没有完全围绕政府数据进行的市场交易 , 因此并不存在一个公开并活跃的交易市场 , 亦没有可获取的交易价格 。创新或衍生估值思路实物期权法实物期权法通常用于不确定的市场环境下的资产或权益 , 其考虑了管理决策者在投资 、生产以及产品研发等问题决策中的选择权 ,因而能充分反映资产的选择权价值 。实物期权法运用于数据资产估值时 , 需考虑数据资产的价值不仅包括数据产生的收益 ,而且还包括决策者 ( 数据使用者 ) 的选择权所带来的收益 , 即期权价值 。因公共开放数据资产具有明显的 普惠性 , 与前述收益途径的适用局限类似 , 无法通过量化方式估计各选择权下的未来收益 , 同时 , 由于数据的使用场景多样 , 且数据的价值在不同的场景下大多不同 , 基于现有信息估计不同场景下的价值具有较大主观性 。模糊 综合 评价法模糊综合评价法是一种基于模糊数学的综合评价方法 , 通常运用层次分析法 , 请专家针对数据的各评价指标进行打分 , 将定性评价转化为定量指标 , 最终 得到数据资产价值 。由于公共开放数据带来的潜在社会价值及经济价值远高于其原始投入成本 , 如仅基于模糊 综合 评价法估计潜在社会价值和经济价值将因缺少标尺而导致较大的主观性 。 因此我们仅考虑在涉及调整系数( 如数据质量调整系数 ) 的 选用 中采用模糊 综合 评价法 。神经网络模型假设成交数据资产和未成交数据资产的价值服从同一分布 , 成交数据的价值是已知的 ,未成交数据的价值是未知的 。 然后收集公开的数据资产交易数据 , 分析影响数据资产成交价格的相关因素 , 然后通过神经网络模型对成交数据价值的变动进行模拟 , 在此基础上建立样本中输入变量 ( 即影响数据资产价值的相关因素 ) 和输出结果 ( 数据资产价值 )的关系 。 随后代入未成交数据资产的因素变量 , 就可以得到这些数据的价值 。因公共开放数据的 普惠性 , 即数据免费开放让社会各方挖掘利用 , 而且 目前国内也没有完全围绕政府数据进行的市场交易 , 因此并不存在一个公开并活跃的交易市场 , 亦没有可获取的交易价格 , 作为神经网络模型的基础 。基于上述分析 , 普华永道从当前我国省级政府公共数据开放平台上所提供的公共开放数据作为切入点 , 通过借用物理学中的 “ 重力势能 ” 概念 , 提出创新的“ 数据势能 ” 概念以及实证探究 。 此方法论目前仍处在尝试探索阶段 , 虽取得了初步成果 , 但还需进一步的深入研究与论证 。 作为数据资产领域的先锋和倡导者 , 普华永道希望通过本白皮书呼吁社会各方认识到数据资产估值所面临的主要挑战 , 并且积极参与到数据资产估值的探索之中 , 为提升对数据资产价值的认可做出贡献 。11 开放数据资产估值白皮书图 6:估值思路简介“数据势能”估值体系及实证探究12开放数据资产估值白皮书“ 数据势能 ” 估值概念物理学中的势能 ( Potential Energy) , 是指储存于一个系统内的潜在能量 , 即还未释放出来的能量 。 根据物理学能量守恒定律 , 势能可以释放或者转化为其他形式的能量 , 这种能量就是价值 。 普华永道认为 , 公共数据开放的价值与势能的概念极为相似 。 其一 , 公共开放数据在数据资产生态这一系统内作为 “ 土壤 ”存在 , 起到基础性的作用 。 其二 , 我国的公共数据开放尚处于早期实践阶段 , 至今不到 10年的历史沉淀 。虽然截至 2020年底 , 全国已有 142个省市级公共数据开放平台正式上线 , 但仍有 40%的省份还未上线省级公共数据开放平台 , 因此公共开放数据的潜在价值巨大 , 有待挖掘开发 。 其三 , 我国数据资产价值正处于存储积累的状态中 , 蓄势待发 。 通过此次研究观察到 ,已上线的公共数据开放平台从平台前期构建成本投入 、上传数据的质量 、 总下载量 、 应用场景多样性等方面在我国各省市级公共数据开放平台都参差不齐 , 可优化空间较大 。 随着各开放平台的开放 API数量的增加 、上传数据质量的完善 , 开放数据集以及开放数据总量的积累 、 基于开放数据的应用程序的增多 , 我国公共开放数据资产价值也将不断积累 、 不断提升 。普华永道认为 , 传统的估值途径在公共开放的数据价值分析中略显单薄 , 对于该类具有较强普惠性的资产 ,建议针对其特征搭建全新的估值体系 。1 2 3数据开发价值潜在社会价值潜在经济价值定义数据在尚未被公众使用时 , 其价值仅仅为提供数据所需要的成本 , 即数据开发价值关键价值驱动因素 全系构建成本 数据质量综合评分体系定义在提供 “ 惠民 ” 以及 “ 智慧政务 ” 的过程中 , 数据的潜在社会价值逐步彰显 , 达到远高于其开发价值的 “ 数据高度 ”关键价值驱动因素 用户下载量 /点击量 人民整体生活质量及效率提升 人民幸福指数定义数据资产应用于医疗 、 金融 、 教育 、 交通 、 能源等多个领域 。 随着应用场景的增加 , 数据资产的经济价值呈指数级扩大关键价值驱动因素 数据经济增长率 /GDP增长率 潜在应用场景的多样化从公共开放数据资产的特性及构成提炼关键价值驱动因素公共开放数据价值包含数据开发价值与数据潜在价值 。前者由全系构建成本与公共开放数据质量调整系数组成 。 后者则由公共开放数据的潜在社会价值以及潜在经济价值组成 。13 开放数据资产估值白皮书图 7: 数据开发价值与潜在价值定义以及关键价值驱动因素以微观角度搭建体系 , 以宏观角度进行验证近年来 , 全国各省市纷纷启动数字经济战略行动 , 发挥数字经济相关产业先行先试优势 , 聚集了各地政治 、经济 、 文化 、 金融 、 交通等优质资源 , 以公共数据开放为基础打造 “ 数字高地 ” , 拓展服务民生新渠道 ,数据 “ 惠民 ” , 形成了巨大的潜在社会价值 。 同时 ,在数据经济整体增长助力下 , 进一步赋能公共数据开放产生潜在经济价值 。 基于此 , 公开数据的价值将远远高于其单纯的数据开发价值 , 即其中蕴含着巨大潜在社会价值和经济价值 。 因此 , 普华永道尝试借用物理学中的 “ 重力势能 ” ( 具体公式为 Ep=MgH) , 首次提出 “ 数据势能 ” 概念 , 对应的 “ 数据势能 ” 估值模型应运而生 。微观角度 ,从公共开发数据的特征及撬动其潜在价值的关键因素出发,推出 “数据势能 ”公式,即公共数据资产价值 = 公共数据开发价值 *潜在社会价值呈现因子 *潜在经济价值呈现因子宏观角度 ,从国民经济生产总值出发,剖析数据经济总值占国民经济之比例,通过成分分析层层推出公共开放数据可能的价值区间14开放数据资产估值白皮书“ 数据势能 ” 公式公共数据资产价值 = 公共数据开发价值 *潜在社会价值呈现因子 *潜在经济价值呈现因子下文我们逐一剖析 “ 数据势能 ” 估值体系下的关键参数 。公共开放数据开发价值 , 对应传统重力势能公式中的M (质量 ), 即相对固定的因素 , 等于全系构建成本 *公共开放数据质量调整系数 。全系构建成本指的是构建一个数据资产所需全部投入 ,包括初始建设成本 、 期间全部运维成本及管理成本 ,具体为: 存储成本:数据存储占用的基础设施 ( 机房 、 机柜 、存储设备等 ) 的成本按数据容量折算后的价值; 加工成本:数据加工过程中设计的物力 ( 服务器 、软件等 ) 和人力 ( 员工成本 、 下包商费用 、 项目费用等 ) ; 运维成本:保障数据正常可靠服务所需的动力 ( 服务器 、 软件等 ) 和人力 ( 员工成本 ) ;公共开放数据质量调整系数则是第三方数据资产专家根据数据资产的特性 , 从公共开放数据的准确性 、 完整性 、 及时性 、 时效性 , 及唯一性等五个维度逐一进行打分评价 , 再经过加权平均后最终得出的结果 2。准确性衡量所采集数据的准确程度 。 数据的准确性越高 , 可分析性越强 , 数据的价值也越大 。完整性衡量所采集数据是否存在缺失 , 若重要数据存在缺失 ,可能未来将支付额外成本进行数据补充 。及时性衡量数据更新频率的快慢 , 反应数据世界与客观世界的同步程度 。 数据的及时性主要与数据的同步和处理过程的效率相关 。时效性衡量最后一次数据更新时点与期望有效时间之间的差距 ,对于需要持续跟踪最新数据的用户来说具有较大意义 。唯一性衡量是否存在重复数据 , 若数据重复性较高 , 会导致后续分析结果失真 。2 数据资产价值评估模型的理论研究与技术实现探讨 , 上海数据分析网15 开放数据资产估值白皮书图 8: 公共开放数据质量五个维度的含义潜在社会价值呈现因子 , 对应传统重力势能公式中的H (高度 )在我国加快数字社会建设步伐的大背景下 , 秉持 “ 以民为本 ” 的发展理念 , 且将 “ 构筑全民畅享的数字生活 ” 。 作为近五年国家的战略规划 , “ 惠民 ” 成为公共开放数据越来越重要的社会价值体现 。 其另一方面的社会价值体现在 “ 提高数字政府建设水平 ” , 在公共开放数据的基础上 , 将数字技术广泛应用于政府管理中 , 不断提高决策科学性和服务效率 。 利用大数据以及人工智能等数字技术洞察民生以及政府需求 , 又将此技术用于拓展服务民生 、 服务政府等新渠道 , 在提供 “ 惠民 ” 以及 “ 智慧政务 ” 的过程中 , 达到远高于其开发价值的 “ 数据高度 ” 。“ 惠民 ” 结果可直接从宏观效果观察得出 , 人民整体生活质量以及效率的提高 、 幸福指数的增加为公开数据社会价值的表象 。 “ 智慧政务 ” 结果也可从百姓对政府工作的 “ 好差评 ” 评价体系中得以体现 , 以及政府内部效率的提升为社会价值的表象 。 但由于获取此类数据难度较大 , 且评判可能较为主观 , 因此本文在研究过程中更多考虑使用可直接量化的的参数指标 ,即公共开放数据实际累计下载量 。 公共开放数据实际累计下载量可以全面反映社会对数据开放平台的认知水平和运用的活跃度 。 下载即使用 , 用户下载量是反映公共开放数据社会价值最具代表性的指标 , 原因如下:其一 , 公共开放数据的下载量能反映全社会 , 包括个人 、 企业 、 政府对于数据的主动关注程度 , 以及数据的有效触及率;其二 , 下载量能体现终端用户对于数据价值及数据可利用性的认可 , 公众将其认为有参考意义的信息下载后 , 更可能在未来加以分析 , 在更加长期的时间里开发数据的价值;其三 , 在当前公共数据开放的早期阶段 , 公众对于公共开放数据的获取和了解较少 , 公共开放数据的社会价值并未被充分开发和利用 , 仍停留在较低水平 。 随着公众对于公共开放数据价值的认知不断提升 , 下载量的逐渐增加 , 公共开放数据在社会中得到更为广泛的流通及更多场景的应用 , 逐步改变社会生活方式及经济商业模式 , 产生巨大的杠杆效应 , 公共开放数据的价值也将加速上升 。考虑社会价值后的数据资产价值数据下载量“ 十四五 ” 以及 2035年远景期间 ,在我国加快数字社会建设步伐的大背景下 , 数据经济迅速发展 。中国信通院的数据显示 , 预计2021至 2025年 , 我国数字经济年均增速将保持在 15%左右 。数据经济发展初期 数据经济发展稳定期在此阶段 , 绝大部分群众对数据平台的认识基本完善 , 数字经济发展进入稳定期 , 新增下载对整体社会价值的贡献率会逐渐下降 。数据经济发展成长期2021年前 20212035年 2035年以后在数据经济发展早期 , 数据尚未被公众使用时 , 其价值仅为数据开发价值 。 随着数据经济的进一步发展 , 在提供 “ 惠民 ” 以及“ 智慧政务 ” 的 过程中 , 数据的潜在社会价值逐步彰显 。16开放数据资产估值白皮书图 9: 潜在社会价值与数据下载量的正向非线性关系在选定下载量为量化指标的基础上 , 我们引入了指数介于 0.5-1之间的幂函数来量化潜在社会价值 ( H) 。这一函数的图像如上图所示 , 反映出社会价值的增长与数据下载量的正向非线性关系 , 即价值的增长随着下载量的增加逐渐降低 , 符合边际递减规律 , 正如图中曲线的斜率会从陡峭变得平缓 。 在公共数据开放平台发展初期 , 下载量基数较小 , 群众对公共数据开放平台的认知以及开发利用逐渐形成 , 新增单位下载量带来的社会价值贡献度较高;到了成长期 , 群众对数据平台的认识逐渐提高 , 新增下载对整体社会价值的贡献率会持续上升 , 但不如发展初期迅猛;到了稳定期 , 对公共数据的开发利用基本饱和的情况下 , 公共开放数据带来的社会价值将逐渐平缓 , 趋向最大化 。潜在经济价值呈现因子 , 对应传统重力势能公式的 g( 重力加速度 ) , 在此我们将其定义为转换率 。有别于传统的势能公式 , 在 “ 数据势能 ” 中 , 该因子为非恒定因素 , 公式 =( 1+g) x, 其中 g为数字经济名义增长率 , x为第三方数据资产专家对公共开放数据应用场景多样性评分所对应的数值 。 根据现阶段的观察研究 , 潜在经济价值是在潜在社会价值的基础上实现的潜在经济价值的转换 。2016年 G20杭州峰会发布的 二十国集团数字经济发展与合作倡议 指出 , 数字经济是指以使用数字化的知识和信息作为关键生产要素 、 以现代信息网络作为重要载体 、 以信息通信技术的有效使用作为效率提升和经济结构优化的重要推动力的一系列经济活动 。 根据中国信通院发布的 中国数字经济发展白皮书 ,数字经济具体包括数字产业化 、 产业数字化 、 数字化治理 、 以及数据价值化四大部分 。 数据是数字经济的血液 , 公共开放数据资产有助于驱动创新 、 优化资源配置 、 为企业和社会赋能 , 是数字经济价值的重要体现 。 由于数据资产价值与数字经济的呈显著正相关性 ,因此 , 我们引入各省数字经济的名义增长率作为计算潜在经济价值的关键参数之一 。在此基础上 , 我们根据第三方数据资产专家的公共开放数据应用场景多样性进行评分 , 确定了各省对应的指数函数的另一变量 x。 数据如果能在一个国家内部流动起来 , 就能创造价值 。 公共开放数据在 “ 惠民 ”和 “ 智慧政务 ” 过程中不断流动 , 运用于不同的应用场景 , 使得数据资产的经济价值呈指数级扩大 。 考虑到公共开放数据资产本身具有强公信权威和广覆盖领域的特点 , 有政府背书的数据资产跨越了医疗 、 金融 、教育 、 交通 、 能源 、 农业 、 制造等多个领域 。 各领域政府数据在不同场景下的开放 , 有望助力不同行业企业提升服务效率及服务精准度 , 从而加速驱动地方传统企业转型升级 , 推动数字经济的发展 。 因而 , 数据资产本身的潜在经济价值将随着应用场景的不断拓展而得到提升 。17 开放数据资产估值白皮书“数据势能”估值体系在实证方面的初试及探析基于前述 “ 数据势能 ” 概念 、 估值模型及关键参数 ,普华永道根据采集到的 18个已开放省级公共数据开放平台 ( 包括北京市 、 天津市 、 上海市
展开阅读全文