资源描述
1数据资产生态白皮书构建可持续的数字经济新时代前言数据的价值迎来了悄无声息却影响深远的革新 , 数据不再仅仅是宝藏或者石油这样直白的物质财富代表 , 而已经发展为如同水与空气一般重要的必需品 。与此同时 , 数据带来的机遇与挑战也伴随左右 。 一方面 ,数据联通个人 、 企业与政府端 , 通过开放 、 流通等不同方式释放出巨大价值 , 重塑个人生活方式与商业模式 , 产生了巨大的杠杆效应;另一方面 , 如同水与空气面临污染的威胁 , 数据也同样面临着权属不清 、 定价不明 、 使用不公等社会经济难题 , 以至于这一价值无可限量的资源难以真正触达需求 。作为数字经济时代的长期践行者 , 普华永道希望通过本白皮书呼吁各方认知数据时代下的主要问题 , 倡导建立一个更加健康 、 有序且平衡的数据资产生态 。 唯有在社会 、 经济 、 政策及技术层面全面支撑资产化生态的运作 , 才能全面释放数据的核心价值 , 拥抱更为美好的未来 。目录前言数据如同水与空气的数字化时代已至数据生态在慢慢失衡数据产权模糊数据隐私与安全问题突出数据定价与估值困难数据开放与流通困难建立平衡的数据资产生态何谓平衡的数据资产生态政策与法律方面: 确立数据权机制与定价指导意见 数据确权 数据定价经济方面:探索数据资产商业模式社会方面:避免数据歧视,实现数据普惠 数据使用容忍 数据歧视 数据普惠技术方面:搭建数据资产管理和应用的技术体系 数据安全共享 链上与链下结合 数据可信计算 多方安全计算与可信计算 数据资产生态技术体系平衡的数据资产生态展望与价值推动可持续的数字经济发展提高国家社会治理水平达成市场资源最优配置赋能企业数字化转型实现个人隐私与数字化便利的统一结束语联系人24252222232302050607070708191014081622231在过去的十几年里 , 数据借助移动互联网的发展形成指数级的积累 , 反垄断监管者也开始着手限制那些有能力控制数据的群体和机构 。 数据成为数字时代的 “ 石油 ” , 已是广泛共识 。但在快速更迭的数字时代 , 数据的价值迎来了悄无声息却影响深远的革新 。 在十年前 , 大众对数据的价值描绘得头头是道 , 如同发掘到金矿的淘金客一般 , 而如今 , 围绕数据的话题逐渐回归理性 。 在某种意义上 , 数据的价值正在向更深层次演进 , 和石油相比 , 数据更像与我们日常生活息息相关的水和空气 。回顾水和空气的特质 , 与数据之于当今社会生态十分类似 。 首先 ,水与空气是每个个体日常生活中无法缺失的重要资源 , 即使存在感有时无法察觉 , 而一旦失去就会导致机体的崩溃 。 在数字化时代中 , 个人 、 企业与政府也应意识到 , 习以为常的生活与生产已经无法离开各类数据的支撑 。试想一个普通工薪阶层日常的一天:在早起通勤的路上就会收到由个人喜好数据筛选出的数十条信息流新闻与广告;工作打卡后个人信息与时间数据快速与企业管理系统进行对接;午餐时 , 习惯打开大众点评浏览数十条餐饮门店数据并快速决策;而晚餐则在外卖平台推荐在大量菜肴中寻找合适的美食;即使是入睡前 , 也可能通过各类健康或信息应用回顾一天的运动与休闲数据 。 可以说数据已成为每日生活秩序的有效保障 。对于企业而言 , 缺少数据支持将变得寸步难行 。 当今全球市值最高的五大科技巨头 ( 谷歌 、 亚马逊 、 苹果 、 Facebook和微软 ) 似乎都势不可挡 , 数据不仅是利润增长驱动引擎 , 更是它们的护城河 谷歌知晓当下的搜索热点 , Facebook了解被分享的内容 , 亚马逊知晓人们购买的货物 收集到的消费者数据促使它们提升服务质量 , 从而不断加高进入壁垒 。 而中小型企业则积极通过云等技术在聚焦的领域消化数据 , 为业务提供指引 , 真正意义上以数据哺育业务发展 。数据如同水与空气的数字化时代已至2政府的运作同样离不开数据 , 否则大量运行与组织工作将举步维艰 。得益于极强的组织与服务能力 , 中国大量城市已开始试点甚至部分实现网格化管理 , 在感知数据的帮助下迅速响应以社区为单位的群众需求 , 涵盖从安防到养老 、 从记录到执行的全政府服务环节 。 一旦失去对社区人与物的数据联系 , 政府的作业与大众的实际情况将产生以天为单位的割裂 , 服务型政府将如纸上谈兵 。其次 , 水与空气是自然界无处不在的巨大资源供给 , 而数据也已经在潜移默化间成为个人 、 企业与政府正常运作即可获取的重要资源之一 , 如同水与空气一样影响着每一个个体 。 如此充满活力的数字化社会 , 也反向催生了中国乃至全球数据体量的繁荣 。从数据数量上看 , 中国是数据生产大国 。 根据国际数据公司 IDC对全球“ 数据圈 ” 进行的研究显示 , 中国在 2018年产生了 7.6ZB的数据 。 该机构预计 , 中国的 “ 数据圈 ” 将会在 2018年至 2025年之间扩张 14倍左右 , 以每年 30%的平均增速快速发展 。 中国的数据量将在 2025年达到48.6ZB, 也就是 48.6万亿 GB。 届时 , 中国将问鼎数据圈的 “ 金山 ” ,成为全球第一 。 而美国在 2025年将会产生 30.6ZB的数据 , 折合 30.6万亿 GB, 相比中国少 18万亿 GB。根据 IDC的预测 , 2025年全球数据量将达到 175ZB( 见图 1) , 有几个形象的比喻可以帮助大家理解 175ZB究竟是何等庞大的数据量级:假如将 175ZB的数据刻录在单盘容量为 4.7G的普通 DVD光盘中 , 则这些光盘叠加的高度是月球至地球距离的 23倍 , 亦或环地球赤道 222圈;以当前美国平均网速 25Mb/s而言 , 下载完 175ZB数据需要 18亿年 。30%中国“数据圈”2018-2025扩张 14倍左右平均增速快速发展图 1:全球数据量增长预测( 单位: ZB)资料来源: IDC, 数据时代 2025 报告2 4 6 8 1014 16 2040506070801001301750204060801001201401601802003最后 , 水与空气看似廉价 , 却能在相关介质的配合下催生出长久持续的能量 , 例如水电 。 数据自身虽然微小 , 同样也能通过聚合效应驱动质变 。 回顾数据的质量效应 , 全球和中国数据的融合与增长催生出各类新兴应用 ( 见表 1) , 产生了数据积聚的强大枢纽效应 。数据体量与质量的飞速增长 , 正驱动各行各业对 “ 数据 ” 概念进行重新认知与战略解读 , 数据作为社会经济生态中的空气与水 , 具有取之不尽 、 用之不竭的压倒性优势 。 在大数据时代 , 谁能率先认识到数据的重要性 、 对丰富的数据资源加以合理运用 , 谁就能迅速把握时代风口 、 抢占行业先机 , 并创造惊人的经济利益 。由于数字化带来的连接效应 , 数据的累积将不断加速 , 数据涵盖的领域将不断延伸 , 数据资源的储量也将更加丰富 , 因而如何将数据从资源转化为资产 , 当是每个具备战略眼光 、 考虑长远发展的企业 、 政府乃至整个社会所必须正视的重大课题 。表 1:数据融合增长催生的新兴互联网应用交通工具摩拜单车 每天可产生 2,500万订单量联网汽车 每运行 8小时可产生 4TB数据社交媒体微信 每天有 10亿用户登录、发送 45亿条消息、拨打 4,100万次语音电话Twitter 每天可发布 5,000万条消息YouTube 每分钟上传视频时长可超过 400小时Facebook 每天可生成 4PB数据,包含 100亿条消息、 3.5亿张照片和 1亿小时视频浏览电子邮件 每天可收发 3,000亿封电子邮件搜索引擎谷歌 每秒需处理超过 40,000次搜索消费购物淘宝 每天可产生 20TB数据资料来源:普华永道搜集整理42正如自然界的生态系统失衡 , 例如乱砍滥伐 、 毁林开荒或采伐速度大大超过其再生能力 , 造成资源衰竭 、 水土流失和气候变化 , 引发生态系统出现诸多问题 , 同时影响生态中的各个物种 。 而数据生态的失衡也会导致很多问题出现 , 如 “ 数字霸权 ” 的产生 企业在掌握了海量数据控制权的同时 , 也掌握了前所未有的权力 。一方面 , 数据的产生 、 流转 、 应用与管理依赖于完善的生态 , 其中包含政府 、 企业 、 个人等多方参与者在公开 、 透明的机制下形成有效分工 。 但当前中国数据生态的主要管理与应用模式侧重于企业为中心组织 、 管理 、 控制和使用个人数据 , 未能发挥生态体系中各方的最大化价值 。 同时 , 个人数据集中在部分电商 、 社交媒体领域巨头 , 个人数据的聚集效应越来越明显 , 不可避免会出现数据歧视 、信息茧房 、 大数据杀熟乃至隐私侵犯等诸多问题 。 从不掌握个人数据的企业视角 , 会造成数据资源被垄断带来的发展与竞争壁垒;从个人视角 , 较为分散的数据资产分布与管理模式将导致维权困难;而从政府视角 , 市场资源配置的公平性与市场经济的稳定性则难以把控 。 在互联网行业 “ 头部固化 ” 的情况下 , 少数大型互联网企业能够通过无数使用方便且服务全面的 App收集并分析数据 , 了解用户喜好与习惯 。 在这种情况下 , 它们可以利用自身优势 , 将想法和目的潜移默化地灌输给消费者 。 更现实的情况是 , 在当前数字时代 , 人们不可能完全脱离这些大公司提供的服务 。 然而 , 普通个人对大数据运作的过程一无所知 , 人们被限制在 “ 信息茧 ” 中 , 被精准投放的广告驱使着做决定 。 其他中小型企业也无力与这些庞大企业抗衡 , 造成少数企业垄断市场的局面 。 另外 , 在社会公共事业端 , 政府应用个人数据的边界成为挑战 , 例如数据产权模糊 , 财富分配自然也不清晰 。 越来越多数据集中在少数企业手里 , 这对个人的隐私安全甚至国家安全都会造成影响 。数据生态在慢慢失衡5数据生态在慢慢失衡 ( 图 2) , 引发诸多问题和挑战 。图 2:政府视角下,个人与企业数据的应用平衡个人端数据特性导致价值真空 主体过于分散 权属复杂 数据价值参差 应用难以追溯 个人意识薄弱企业端面向个人数据陷入两难 超大型企业数据马太效应 商业化驱动的信息茧房 数据记录与边界 数据应用与分润政府面向 B端与 C端的抉择 个人数据信息使用边界 企业数据行为管控 政府数据开放与流通 商业繁荣与个人保护个人端政府端企业端政府端个人端个人数据开放与应用企业端企业数据应用管理另一方面 , 社会逐步把数据视为资产 。 从当前的经济和法律视角 , 资产具有三项核心特征:其一 , 资产应归属某主体所有或控制 , 即权属明确;其二 , 资产能够产生既有的或预期的经济利益;其三 , 资产是一种资源 , 具有稀缺性 。 而数据的无形性 、 可复制性以及取之不竭的特性 , 导致数据资产存在特殊性:其一 , 数据资产主体具有多重性 , 权属模糊 ,例如数据从生产到流转的过程中 , 可以产生衍生数据以及衍生数据的主体;其二 , 数据资产能够产生经济利益 , 要以数据资产的合理定价为前提 , 但数据资产的定价取决于特定场景 , 并不存在统一 、 普适性的定价依据 , 需要因场景而变;其三 , 数据资产是一种人为创设的资源 , 与石油等不可再生资源的稀缺性相比 , 数据的稀缺性是相对的动态概念 , 在某种意义上 , 数据资产是取之不尽用之不竭的 。数据产权模糊一方面 , 数据越来越像商品 , 可以被买卖 、 转让和使用 。 但是随着云计算和大数据技术越来越完善 , 暴露出来的问题也越来越多 。 比如某个内容创业公司 , 当把内容发布到网络上时 , 内容可以被转载和复制 , 无法查到究竟谁才是内容始创者 , 部分利益会被抄袭者窃取 。 所以数据的确权越来越重要 , 目前行业潜规则是 “ 谁采集 , 谁拥有 ” , 出售和利用个人数据获利 , 侵犯用户数据产权 、 知情权 、 隐私权和收益权的现象时有发生 。 对个人数据的不当采集 、 处理和使用暗藏在企业商业秘密之中 。另一方面 , 当前北京大数据交易服务平台 、 贵阳大数据交易所 、 长江大数据交易所 、 上海数据交易中心等数据流通平台不断涌现 , 数据堂 、 美林数据 、 爱数据等数据资源企业也渐具规模 。 然而 , 由于专门立法的欠缺和既有制度的模糊 , 出于对交易风险及个人数据合规风险的忧虑 , 我国数据流通在 “ 质 ” 和 “ 量 ” 上都不尽如人意 , 难以满足数字经济发展的需要 。 数据流通的症结进一步还原到数据确权上 。资料来源:普华永道分析6数据隐私与安全问题突出无论从数据普惠 , 尊重个人隐私及数据主体权利 , 或者愈加强化的法律法规及监管要求 , 数据安全与合规已经成为数据资产化过程的必要条件和基础 。 近几年来 , 社会和企业对于数据安全及合规已具备相关认知并在推进相应的能力建设 。 但是海量数据下的安全合规治理 、 管控体系建设 , 以及技术解决方案实施等方面 , 依然存在新的挑战和风险 。 在社会和多数行业层面 , 缺乏数据的共享 、 流通和交易的规范;在企业层面 , 普遍缺失数据环境下的数据确权原则 , 缺乏结合法务 、业务 、 安全合规及 IT的整合合规组织 , 以及跨业务板块的管控机制 。 在管理层面 , 缺乏数据全生命周期管控 、 符合结构化数据和大数据特点的风险管理方法 、 以及细粒度的分级访问控制 。 而技术层面 , 针对数据的防御 、 感知 、 响应的技术和工具都存在缺失 。数据定价与估值困难数据资产不完全符合会计准则中对无形资产的定义 , 尚无法体现在企业的财务报表中 , 但从数据资产的确认和计量上 , 应认可数据的价值及其对企业价值创造的贡献 。 当前对于数据资产价值评估的研究还处于早期阶段 , 评估方法尚不成熟 , 且鉴于各类条件和数据本身的特性 , 数据资产估值仍然面对较多难点和挑战:1. 数据价值的变动性 。 数据的价值根据其相关性的不同而各不相同 , 而数据相关性又因数据使用者而异 。 相同的数据对于不同需求的使用者来说 , 价值是不同的 。 同时 , 数据周转速度的提高意味着数据过时的速度也相应加快 , 随着新数据的出现 , 旧数据的价值可能会贬值 。2. 数据价值的不确定性 。 例如监管 、 全球治理和隐私权等问题 , 可能对数据的经济价值以及公司对数据的投资力度产生实质性的影响 。3. 数据资源的无限性 。 数据资源可以无限使用 , 而这个特性也使数据资产的价值难以计量 。4. 数据资产权属的复杂性 。 所谓权属即是所有权的归属 。 由于数据资产属于无形资产 , 其权属属性与实物资产不同 , 需要关注的因素更多 , 更为复杂 。数据开放与流通困难对政府部门和企业而言 , 由于个人数据采集和管理的分散 , 影响了个人数据的流通 、 分享使用和依法监管 , 汇聚线上和线下等多维度的个人数据将非常困难 , 导致个人征信 、 互联网金融服务 、 产品精准营销等新的增值服务难以实现 , 个人数据的经济价值和社会价值也难以发挥 。 当前数据价值的实现 , 基本依靠传统数据价值增值模式 , 而充分发挥数据的价值 , 需要的不仅仅是更好的算法 、 更快的计算速度 , 还需要有创新的数据使用和流通模式 。 目前 , 中国经济进入 “ 新常态 ” , 数据作为经济增长的新动力 , 迫切需要探索一种新的个人数据采集 、 管理和使用模式 , 规范个人数据的增值服务和交易行为 , 保护用户的隐私和数据安全 , 保障用户数据的合法权益 , 不断推动个人数据领域相关技术和应用的发展 。7何谓平衡的数据资产生态在自然界 , 生态平衡是指在一定时间内生态系统中的生物和环境之间 、 生物各个种群之间 , 通过能量流动 、 物质循环和信息传递 , 使它们相互之间达到高度适应 、 协调和统一的状态 。 当生态系统处于平衡状态时 , 系统内各组成成分保持一定的比例关系 , 能量 、 物质的输入与输出在较长时间内趋于相等 , 结构和功能处于相对稳定状态 , 在受到外来干扰时 , 能通过自我调节恢复到初始的稳定状态 。 在生态系统内部 , 生产者 、 消费者 、 分解者 , 在一定时间内保持能量与物质输入 、 输出动态的相对稳定状态 。在数字世界 , 从长远来看 , 围绕数据资产构建平衡的数据资产生态 , 是实现数字经济可持续发展的必由之路 。 普华永道认为 , 在平衡的数据资产生态中 , 应包含以下几类角色:数据生产者:个人 /企业 树木: 个人和企业作为主要的数据生产者 , 犹如雨林中的树木 , 虽然在单体体量与声量上有限 , 却能在团体中产生巨大的影响力 。 因此 , 团结 、 高效 、 一致的 “ 雨林 ” , 是数据生态中的主要贡献者 。政府指导的数据确权与定价引导机制 太阳的光合作用: 个人产生的数据并不能直接被外界所应用 , 有如雨林只有在光合作用与大气循环下才能产生珍贵的氧气和水滴 。 因此 , 政府管控下的确权与定价指导是生态系统里面的太阳 , 发挥光合作用 , 而科研机构与学术单位也扮演着重要角色 。数据消费者:企业 /个人 动物: 企业在生态中如同各类动物 , 与雨林伴生形成生态系统 , 通过雨林的产出产生更大能级的价值 , 符合食物链逐步放大的自然效应 。 但同样 , 若缺乏政府如阳光般的管控辐射 , 动物对雨林的过度伤害最终只会导致生态系统的崩溃 。公共数据 土壤: 融合开放的公共数据如同土壤 。 无论是动物还是雨林 , 在阳光下通过分解者逐步形成土壤中的有机物 , 这一有机物反过来成为雨林生长不可或缺的根基 。数据中介 微生物: 微生物是分解者 , 可以将生态系统中的各种无生命的复杂有机质分解成水 、 二氧化碳等可以被生产者重新利用的物质 。 在数据资产生态中 , 众多数据科技公司就扮演着类似微生物的角色 。建立平衡的数据资产生态38
展开阅读全文