基于MPC的隐私计算:开启数字经济时代数据共享新商业模式.pdf

返回 相关 举报
基于MPC的隐私计算:开启数字经济时代数据共享新商业模式.pdf_第1页
第1页 / 共33页
基于MPC的隐私计算:开启数字经济时代数据共享新商业模式.pdf_第2页
第2页 / 共33页
基于MPC的隐私计算:开启数字经济时代数据共享新商业模式.pdf_第3页
第3页 / 共33页
基于MPC的隐私计算:开启数字经济时代数据共享新商业模式.pdf_第4页
第4页 / 共33页
基于MPC的隐私计算:开启数字经济时代数据共享新商业模式.pdf_第5页
第5页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
基于MPC的隐私计算: 开启数字经济时代数据共享新商业模式 基于MPC的隐私计算: 开启数字经济时代数据共享新商业模式 编写委员会 (排名不分先后) 主 编:肖 风 孙立林 燕 丽 执行主编:赵建民 编写成员:吴 佩 王 杰 梁文辉 学术顾问:郁 昱(上海交通大学 教 授) 何德彪(武汉大学 教 授) 美 编:李兴鑫 主编机构:算力智库研究院 内容摘要 数字经济时代,数据业已成为企业和国家具有战略价值的核心资产,数据共享和流通将成为刚性业务需求,但隐私保护和数据高效流动之间的矛盾日益凸显。 “隐私安全”和“隐私计算”这两个概念正是为解决这一矛盾而诞生的,它们致力于打破数据在行业、企业间的流动壁垒,有望开启数字经济时代数据利用新商业模式。 首先,本报告结合学术界和产业界的最新研究成果,对隐私安全和隐私计算概念进行了严格界定,并梳理了以安全多方计算为代表的隐私计算理论和工程发展情况。 第二,本报告详细介绍了以数据脱敏、匿名算法、差分隐私为代表的传统隐私安全技术,并指出其在数字经济时代面临的新挑战。同时,本报告也对以安全多方计算、代理重加密、同态加密、零知识证明等为代表的基于密码学算法的新型隐私安全技术作了一一介绍。 第三,本报告从金融、医疗健康、交通三个细分行业分析了隐私计算在各自领域的应用价值。 第四,隐私计算主要存在两种技术路径。本报告选取了MPC技术路径的典型企业代表矩阵元和TEE技术路径的典型企业代表Oasis Labs分别进行详细介绍。在经过实地调研之后,我们遴选出矩阵元在证券征信、医疗&保险两大应用场景作了详细的案例分析。 最后,本报告对隐私计算未来发展趋势作了展望。纵观隐私计算所有业务环节,隐私信息共享和流通问题处于中后期环节。事实上,仍有诸多比如数据质量问题、数据定价问题以及隐私立法问题等前期环节同样亟待解决。我们认为,为了全面实现数据在各个行业中的流动,彻底解决好数字经济时代的隐私保护问题,既离不开监管层的政策指引,也离不开学术界对安全多方计算、同态加密、零知识证明等隐私保护算法的持续性理论研究,当然也离不开企业界在工程方面的积极探索。 术语表 术语 缩略语 定义/解释 匿名 (Anonymization Algorithm) AA 指的是不署名或不署真实姓名,也即隐瞒身份、个人特征,常指数据挖掘中隐私保护的一种算法。 布尔电路 (Boolean Circuit) BC 一种通用的计算表现形式,由不同的门组成,由逻辑门构成的则为布尔电路。 脱敏 (Data Desensitization) DD 指的是对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。 差分隐私 (Differential Privacy) DP 指的是通过对原始数据进行转换或者是对统计结果添加噪音来实现隐私保护。 加密电路 (Garbled Circuit) GC 最早由姚期智先生提出的对电路进行加密的方法,是安全多方计算中最常用的工具之一。 同态加密 (Homomorphic Encryption) HE 指的是将数据加密后仍然可以对数据进行操作的加密技术。 安全多方计算 (Secure Multi-Party Computation) MPC 是在无中心条件下,多个参与方协同完成对各自数据的计算,并且保证各自输入信息的隐私(包括两方安全计算和多方安全计算)。 非交互零知识证明 (Non-interactive Zero-Knowledge Proof) NIZK Prover不需要同Verifier交互,可以直接生成证明,并由Verfier验证。 不经意传输 (Oblivious Transfer) OT 是一种安全传输协议,允许两方对按照输入比特安全选取标签,是安全多方计算中常用工具之一。 隐私计算 (Privacy-Preserving Computing) PPC 是通过技术手段实现在保护数据隐私的前提下,完成对数据的安全处理。从密码学角度来看,隐私计算指的是采用以安全多方计算和同态加密等为代表的现代密码学技术,在保证原始数据安全隐私性的同时,实现对数据的分析计算。 代理重加密 (Proxy Re-encryption) PRE 指的是委托可信第三方或是半诚实代理商将自己公钥加密的密文转化为可用另一方私钥解开的密文从而实现密码共享。 隐私安全 (Security of Privacy) SP 利用去标识化、匿名化、密文计算等技术保障个人数据在平台上处理、流转过程中不泄露个人隐私或个人不愿被外界知道。 秘密共享 (Secret Sharing) SS 一种将秘密值分享成多个碎片的技术,并且从碎片回复秘密值的过程是具有一定的容错性的。 零知识证明 (Zero-Knowledge Proof) ZKP 指证明者向验证者证明事件的合法性,而无需透露该事件的额外信息。 目录 前言 . 1 一、 隐私安全:开启数字经济时代数据共享新商业模式 . 1 (一)隐私安全诞生背景专为解决隐私保护和数据流动矛盾 . 1 1、数据是数据经济时代企业的核心资产 . 1 2、数据流动是数字经济时代企业的刚性需求 . 2 3、数字经济时代隐私保护立法严重滞后 . 2 4、隐私保护和数据流动之间的矛盾日益凸显 . 3 (二)隐私安全内涵数据安全之上更深层次的隐私保护要求 . 3 二、隐私计算:面向隐私信息全生命周期保护的计算理论和方法 . 5 三、传统隐私安全技术 . 6 (一)数据脱敏 . 7 (二)匿名算法 . 7 (三)差分隐私 . 7 (四)传统隐私安全技术在数字经济时代面临的新挑战 . 8 1、传统隐私保护技术因大数据超强分析能力可能失效 . 8 2、传统隐私保护技术难以适用主流的非关系型数据库 . 8 四、新型隐私安全技术:基于密码学算法 . 8 (一)安全多方计算 . 9 (二)代理重加密 . 9 (三)同态加密 . 9 (四)零知识证明 . 10 (五)基于密码学的新型隐私安全技术面临的挑战 . 10 五、隐私计算在垂直产业的应用 . 11 (一)金融行业 . 11 (二)医疗健康 . 12 (三)交通行业 . 13 六、隐私计算领域典型企业 . 14 (一)矩 阵 元基于安全多方计算的下一代分布式计算架构 . 15 (二)Oasis Labs区块链平台上的隐私云计算平台 . 16 七、 隐私计算在垂直产业应用的典型案例 . 18 (一)证券征信应用场景 . 18 (二)医疗&保险应用场景 . 20 八、展望 . 21 (一)提高原始数据质量,完善数据治理机制是当务之急 . 21 (二)针对同一数据产品进行差异化定价需要持续探索 . 21 (三)亟待建立专注于隐私信息共享和流通的法律法规体系 . 22 参考文献 . 23 附一:打造国内首个专注隐私计算领域专业联盟平台振金社 . 24 附二:算力智库研究院 . 25 免责声明 . 26 前言 在当下的数字经济时代,国内外隐私泄露事件层出不穷,隐私保护问题日益突出。根据Gemalto发布的2017数据泄露水平指数报告数据显示,全球范围内,仅2017年上半年的数据泄露总量就高达19亿条,超过2016年全年总量。 2018年9月,Facebook宣布,由于安全系统漏洞导致公司网站受到黑客攻击,可能导致近5000万用户信息泄露。Facebook数据门背后主角便是臭名昭著的政治数据分析公司剑桥分析(Cambridge Analytica)。据纽约时报披露,剑桥分析在2016 年美国总统大选期间在未经允许的情况下从5000 万Facebook用户那里收集数据并将它们用到政治广告中。据悉,该公司曾受雇于特朗普竞选团队,也曾为英国脱欧推波助澜,一时引起社会哗然。 2018年8月,华住旗下酒店涉及1.3亿用户的个人身份信息及隐私开房记录等客户数据被泄露。同日,快递行业巨头顺丰也被爆有超过3亿条数据疑似流出。 感慨之余,我们更加应该思考的是隐私安全的解决之道。因为只有彻底解决隐私安全问题,数据隐私保护和数据高效流动之间的矛盾才能消解,数据孤岛问题才能得到根本解决。隐私安全有望开启数字经济时代数据利用新商业模式。 1一、隐私安全:开启数字经济时代数据共享新商业模式 (一)隐私安全诞生背景专为解决隐私保护和数据流动矛盾 1、数据是数据经济时代企业的核心资产 随着大数据、人工智能等数字经济时代新兴技术日益成熟,在日常生活中已经得到广泛应用,各行各业沉淀下来的数据背后所蕴含的潜在价值越来越受到大家的高度重视,数据业已成为企业和国家具有战略价值的核心资产。在不远的将来,基于大数据、人工智能等技术的智能决策将会推动经济运行、社会生活、国家治理真正迈向数字化、智能化时代。 根据中国信息通信研究院调研数据显示,2017年我国大数据产业规模为4700亿元人民币,同比增长30.56%。未来三年,大数据产值预计将从2018年的6200亿增长到2020年的超过1万亿,年复合增长率(CAGR)为17.66%,处于快速增长阶段。 中国大数据市场规模(单位:亿元) 数据来源:大数据白皮书(2018),中国信息通信研究院。 28036047062080102015年2016年2017年2018年2019年20年22、数据流动是数字经济时代企业的刚性需求 在现实世界中,任何单一机构,即便强大如当下互联网巨头,也都只能掌握一部分数据,都不足以全面、精准地勾画出目标对象的全部特性。 数字经济时代,越来越多的企业或组织需要与产业链上下游业务伙伴在数据流通和交易领域进行深度合作。因为只有通过各方数据协同计算,才能更好地释放数据更大的价值,提升生产效率,推进产业创新。数据共享和流通将成为刚性业务需求。 3、数字经济时代隐私保护立法严重滞后 令人遗憾的是,世界各国在隐私保护立法方面都严重滞后于社会现实需求。直到今年5月25日,随着一般数据保护条例(General Data Protection Regulation,缩写为GDPR)的正式实施,全球范围内第一部真正意义上的隐私保护立法落地,可谓弥补了数字化时代的隐私保护法律空白。值得欣喜的是,美国共和党参议员杰里莫兰(Jerry Moran)近期透露,该国有望将于2019年起草隐私法案。 为了实现从“数据大国”向“数据强国”的转变,我国也在加紧探讨数据所有权、隐私权等法律法规以及配套规范。 无论是欧盟的一般数据保护条例(GDPR),抑或是美国的隐私法案,其立足点都是一种“静态”的隐私数据保护策略,并不涉及隐私数据在处理、流转过程中的“动态”保护策略。 34、隐私保护和数据流动之间的矛盾日益凸显 保证个人信息、商业机密或独有数据资源等隐私信息在数据处理、流转过程中不会泄露,是企业或组织参与数据共享和流通合作的前提条件。 但出于数据权属、数据泄露及自身商业利益等诸多因素考虑,各手握大量数据的企业或组织对于开放自己的内部数据尤其是核心数据持及其谨慎的态度,导致数据隐私保护和数据高效流动之间的矛盾日益凸显。 “隐私安全”和“隐私计算”这两个概念正是为解决这一矛盾而诞生的,它们致力于打破数据在行业、企业间的流动壁垒,有望开启数字经济时代数据利用新商业模式。 (二)隐私安全内涵数据安全之上更深层次的隐私保护要求 在中国信息通信研究院今年发布的大数据安全白皮书(2018)中明确提出了大数据安全总体框架,其中对隐私安全这一概念的内涵作出了明确的界定。
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642