资源描述
I 2019中国声纹识别产业 发展 研究报告 I 目 录 1. 声纹识别发展背景和环境分析 .1 1.1. 移动万物互联,生物特征识别迅速抢占市场 . 1 1.2. 人脸指纹漏洞频发,个人隐私泄露风险加剧 . 2 1.3. 系列政策法规出台,国家加快 AI 产业引导 . 3 1.4. 生物识别从生理特征走向行为特征 . 4 1.5. 语音交互从千人一面向个性化进阶 . 5 2. 声纹识别技术发展现状 .6 2.1. 声纹是一种特殊的行为特征 . 6 2.2. 声纹识别技术的分类逻辑 . 7 2.3. 声纹识别技术进入商用 . 9 2.4. 行业专利申请量激增 . 11 3. 声纹识别产业发展现状 . 13 3.1. 市场规模:想象空间巨大,规模将超千亿 . 13 3.2. 竞争格局:赛道选手增加,专业厂商领跑 . 13 3.3. 市场份额:外企入华分羹,中企绝对占优 . 13 3.4. 技术来源:技术门槛高企,来源高度集中 . 14 3.5. 资本现状:融资进度提速,行业风口可期 . 15 3.6. 公司案例:得意音通 . 16 4. 主要应用领域及场景 . 17 4.1. 国家公共安全 . 17 4.2. 泛金融 . 18 4.3. 社会保险 . 18 4.4. 智能安防及个性化语音交互 . 19 4.5. 典型应用案例:金融领域 . 19 4.5.1. 中国建设银行 .19 4.5.2. 贵阳银行 .24 4.5.3. 西安银行 .25 II 4.5.4. 浦东发展银行 .25 5. 标准化建设 . 27 5.1. 技术基础标准化 . 27 5.2. 金融应用标准化 . 29 5.3. 正在进行的标准化 . 30 6. 技术挑战与发展趋势 . 32 6.1. 技术挑战 . 32 6.2. 发展趋势 . 35 附一:图表索引 . 37 附二:参考文献 . 38 1 1. 声纹识别发展背景和环境分析 1.1. 移动万物互联,生物特征识别迅速抢占市场 据 2019 年中国互联网络信息中心发布的中国互联网络发展状况统计报告 显示, 截至 2018 年 12 月,中国网民的规模达到了 8.29 亿,全年新增网民的数 量是 5653 万,互联网的普及率是 59.6%,较前年底提升了 3.8 个百分点;中国手 机网民的规模达到了 8.17 亿,全年新增手机网民的数量是 6433 万。截止去年 12 月,我国即时通信用户规模达 7.92 亿,网络新闻用户规模达 6.75 亿,网络购物 用户规模达 6.10 亿,网上外卖用户规模达 4.06 亿,网络支付用户规模达 6.00 亿, 网络视频用户规模达 6.12 亿,短视频用户规模达 6.48 亿。 以手机为中心的智能设备,成为 “万物互联 ”的基础。移动支付、车联网、智能家居、智能安防等智能化应用场景多方位促进国人 “衣食住行 ”体验升级。移动互联网服务场景不断丰富,应用场景日趋复杂,网络身份认证作为防护网络资产的第一道关口,在万物联网时代有着举足轻重的作用。 生物识别技术作为新一代人工智能的重要领域,借助人体生理特征或行为特征进行身份识别。近年来得益于云计算、大数据、物联网、深度学习等信息技术的快速发展,生物识别技术在基础理论、算法模型、创新应用、软件支持等方面不断取得突破。 根据前瞻产业研究院发布的 2018 2023 年中国生物识别技术行业市场调研与投资预测分析报告显示, 2013 年全球生物识别市场的规模达到 98 亿美元。 2016 年生物识别技术行业的市场规模在 150 亿美元左右,到 2021 年这一数值将 增加至 305 亿美元。 2002 至 2015 年,国内生物识别市场的年复合增长率达到 50%, 2016 年生物识别市场规模达到 120 亿元左右。预计到 2021 年,中国生物 识别行业的市场规模将突破 340 亿元人民币。 图表 1-1 2007 2021 年全球生物识别技术行业市场规模与预测 图表来源:前瞻产业研究院 图表 1-2 2002 2021 年中国生物识别技术行业市场规模与预测 图表来源:前瞻产业研究院 1.2. 人脸指纹漏洞频发,个人隐私泄露风险加剧 人脸识别安全漏洞在 2017 年的 “ 3 15” 晚会上首次曝光,凭借一张观众的自拍照成功 “ 换脸 ” 破解手机人脸识别系统。 假体攻击相关的安全漏洞:无效的活体检测 雷锋网:盗刷 28 万,某支付平台 “人脸识别 ”现重大漏洞 无意图检测带来的安全风险: “ 被指纹 ” 和 “ 被人脸 ” 凤凰网科技:最担心的事发生了!男子睡梦中被人用手机刷脸,醒来卡里一 万多元没了! 3 半岛都市报:女子网上交友被坑 熟睡中手机被男友盗刷 20 万 比起数据在传输和认证过程中的安全漏洞,后台的生物特征数据一旦被盗, 大量带有唯一性的生物特征数据被盗取,给用户带来的风险将会更大。 中国支付清算协会 2018 年移动支付用户调研报告显示 , “ 个人信息泄露是用户使用移动支付过程中最常遇到的安全问题 ” 。在移动支付用户实际使用行为分析中, “ 个人信息被泄露 ” 高居第一,占比高达 81.0%,高于第二位的 “ 手机扫描 到伪假条码 ” 70.1% 图表 1-3 移动支付用户对生物特征识别技术认知程度分析 数 据来源: 2018 年移动支付用户调研报告 1.3. 系列政策法规出台,国家加快 AI 产业引导 2017 年 6 月,中华人民共和国网络安全法正式施行,提出 实施网络可信身份战略,支持研究开发安全、方便的电子身份认证技术,推动不同电子身份认 证之间的互认; 明确将个人生物识别信息纳入个人信息范畴进行规范管理。 2017 年 7 月,国务院印发新一代人工智能发展规划,从建立关键共性技术体系、探索行业创新应用等方面对生物识别技术发展提出了重点任务。 2017 年 12 月,工信部印发促进新一代人工智能产业发展三年行动计划 ( 2018-2020 年 ) ,智能身份识别系统、智能语音交互系统同时被列入率先取得 突破的 8 大重点领域。 2018 年 9 月,第十三届全国人大常委会将个人信息保护法列入本届立 4 法规划。人工智能和大数据时代的个人信息保护即将迎来专门立法。 1.4. 生物识别从生理特征走向行为特征 生物特征识别最大的共性是唯一性。人的生理特征都存在唯一性,每个人都有独一无二的脸、指纹、虹膜等。 由于每个人的生物特征具有与其他人不同的唯一性和在一定时期内不变的稳定性,所以利用生物识别技术进行身份认定相对其他身份认证技术是安全且准确的。 但也正是由于生理特征的不可撤销性,生物特征信息一旦被泄露、大量的带有唯一性的生物特征数据被盗取,基于生理特征的身份识别系统将彻底崩溃。这也是生理特征识别方式的真正 痛点 。 远程身份认证技术 要素类别 金融领域场景示例 风险分析 安全等级 知悉要素 持有要素 生理要素 手机号码 +短信验证码 手机银行找回密码 手机恶意软件窃取验证码 低 银行卡卡面信息 + 银行预留信息 + 交易密码 + 短信验证码 非银行支付机构利用银行卡绑定进行实名认证 银行卡卡面信息、交易密码、手机短信验证码泄露 较高 身份证照片 +人脸照片 非银行支付机构利用手持身份证照片进行 实名认证 照片被窃取或伪造 较高 指纹、人脸、虹膜等 生物认证技术 手机银行登录、移动 支付 生物特征泄露、假体攻击 较高 身份证号 +姓名 +人脸照片 、 类账户远程开户 身份证卡面信息泄露且人脸照片被伪造 高 数字证书 +PIN 网银专业版登陆 载体丢失且 PIN 泄露 高 声纹识别技术 (声纹 +动态声纹密码) 手机银行登录、移动 支付 生物特征泄露、重放攻击 高 图表 1-4 移动金融中远程身份认证技术安全性比较 资料来源:中国人民银行移动金融基于声纹识别的安全应用技术规范标准编制组 5 1.5. 语音交互从千人一面向个性化进阶 2017 可以看做智能语音交互元年,各品牌厂商打造的智能音箱纷纷上市。 2018 年语音交互落地突然加速,产品从智能音箱扩展到其他品类,如电视盒子、 闹钟、灯、智能马桶等。未来,语音交互将迎来更多成长机会和更大的发展空间。 在由全球最大中文 IT 社区 CSDN 组织编撰的 2018 中国人工智能产业路线图 中,将语音交互划分为三种阶段: L1 阶段:能以极高的准确率,在典型环境下响应用户的语音输入; L2 阶段:能以极高的准确率识别出交互的当事人和环境,然后进行个性化的交互; L3 阶段:只要有数据,语音交互系统的能力就可以无边界扩展 ( 包括个性和能力 ) 。 在 L2 阶段体现的是个性化,语音交互不再停留在千人一面的固定化模式中, 而是实现千人千面的个性化交互体验。 注:以上段落援引自声智科技李智勇语音交互的进阶之路:层级、技术与 颠覆性 6 2. 声纹识别技术发展现状 2.1. 声纹是一种特殊的行为特征 声纹,是对语音中所蕴含的、能表征和标识说话人的语音特征,以及基于这些特征(参数)所建立的语音模型的总称,而声纹识别是根据待识别语音的声纹特征识别该段语音所对应的说话人的过程。与指纹类似,每个人在说话过程中所蕴含的语音特征和发音习惯几乎是独一无二的,即使是模仿,也难以改变说话者最本质的发音特性和声道特征。 由于声音的特殊性,声纹识别与其他行为特征相比,又兼具生理特性。 声纹识别和语音识别在原理上一样,都是通过对采集到的语音信号进行分析和处理,提取相应的特征或建立相应的模型,然后据此做出判断。但二者的根本 目的,提 取的特征、建立的模型是不一样的。声纹识别试图寻找的是区别每个人 的个性特征,而语音识别则是侧重于对话者所表述的内容进行识别。 简而言之,语音识别 ( Speech Recognition) 关心说的什么 ( What) ,声纹识别 ( Voiceprint Recognition) 关心谁说的 ( Who) ,声纹识别通常又称作说话人识别( Speaker Recognition) 。 声纹特征以声音为载体,具有以下特点: 1) 交互性 。声音是唯一可双向传递信号的生物特征,既可以接收信息,也可以发出信息,实现交互。 2) 便捷性 。声音是唯一周边无死角的生物特征,可以实现非接触式采集, 方便使用。 3) 变化性 。声音是高可变性与唯一性的完美统一。没有两个声音是完全一样的,但里面所蕴含的信息,比如你是谁、你的年龄、你的情感等信息却都是唯 一确定的。这种高可变性和唯一性的完美统一使得语音信号自身就具备了很强的 防攻击能力。 4) 丰富性 。声音有 “形简意丰 ”的特点,它虽然只是一个一维信号,但是蕴含着丰富的信息。在相同一段语音中,除了包含说话人信息外,还包含内容、语种、性别、情绪、年龄,甚至包含出生地、身体健康状况等丰富的信息。 声纹识别作为生物特征识别技术中的一种,作为一种身份认证手段,具有如 7 下优势: 1) 不怕丢失 。不同于指纹、虹膜、人脸等静态的生理特征,声纹作为一种动态的行为特征,不容易丢失,可以做到 “失声(音)不失身(份) ”。 2) 难以伪造 。声纹蕴含于人的语音当中,而语音是千变万化的。即便人两次读相同的内容,也不可能发出完全相同的声音。正是声纹这种 “蕴不变于千变万化之中 ”的特性,使得声纹特征更加深层、难以琢磨,伪造起来也更为困难, 因而认证强度更高、更安全。 3) 隐私性弱 。俗话说 “身体发肤受之父母 ”,在一 般的大众认知中,人们在很多场合下往往不愿意被拍照或者按手印,但采集一段随机跟读的声音,对于大众更加容易接受。 错误接受率 错误拒绝率 容 易实 用 性 处 理速 度 /人 易 仿冒 程 度 生 物特征 视网膜 未知 未知 不好 15-30s 极难 生理特征 人脸 低 0.2 非常好 5s 一般 生理特征 声纹 低 低 可以 1-3s 难 行为特征 签名 低 10 一般 5-10s 一般 行为特征 图表 2-1 生物特征识别技术特性对比 资料来源:信息安全研究 2016 年 1 月第一期 2.2. 声纹识别技术的分类逻辑 声纹识别技术是一个统称,实际上,按照不同的应用方式和其他的一些限定, 声纹识别又被分成了多个技术类别。其中,按照实际应用的方式可分为四类: 1) 声纹确认 生理特征 极难 一起自动对准 虹膜需要 3- 5s,手工操作 需要 5-25s 需要培训才能 使用,手工操作对虹膜有困难 约 10 很低 虹膜 /% 指纹 很低 较低 好 1s 一般 生理特征 掌纹 低 5 使用困难 5-10s 一般 生理特征
展开阅读全文