资源描述
,中国智能语音行业前景研究报告,前言Introduction数据显示,2017年中国智能语音市场规模达到105.7亿元,与2016年相比增长70%。随着智能语音应用产业的拓展,市场需求增大,预计2018年中国智能语音市场规模将进一步增长,达到159.7亿元。,图片,图片,CONTENTS,前言,目,录,1.人工智能行业现状1.1 人工智能行业产业链分析1.2 人工智能行业相关监管政策1.3 人工智能行业市场分析2.全球智能语音行业现状2.1 行业发展历程2.2 行业市场分析,2.3 智能语音市场占有率情况3.中国智能语音行业现状3.1 智能语音市场规模分析3.2 智能语音市场占有率情况4.国内主要企业分析4.1 科大讯飞4.2 百度4.3 苹果4.4 腾讯4.5 搜狗5.行业发展前景预测,01,人工智能行业现状,人工智能行业产业链,目前,人工智能行业产业链明晰,其中包括基础技术支撑、人工智能技术及人工智能应用三个层次。其中基础技术支撑由数据中心及运算平台构成;人工智能技术是基于基础层提供的存储资源和大数据,通过机器学习建模,开发面向不同领域的应用技术;人工智能应用主要为人工智能与传统产业相结合实现不同场景的应用。,人工智能行业相关政策,随着人工智能的快速发展,国家相继出台一系列政策支持中国人工智能的发展,推动中国人工,智能步入新阶段。,2017年7月20日,国务院印发了新一代人工智能发展规划。规划中提到分三步走,第一步,到2020年人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人,工智能技术应用成为改善民生的新途径,有力支撑进入创新型国家行列和实现全面建成小康社会的奋,斗目标。第二步,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。第三步,到2030,年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。,2017年12月,促进新一代人工智能产业发展三年行动计划(2018-2020年)的发布,它作为对7月发布的新一代人工智能发展规划的补充,详细规划了人工智能在未来三年的重点发展方向,和目标,每个方向的目标都做了非常细致的量化,足以看出国家对人工智能产业化的重视。,中国人工智能市场分析,数据显示, 2017年中国人工智能投资事件数达到353次,与2016年的379次,下降了6.86%。在投资金,额方面,2017年投资金额为582亿元,与2016年相比增长65.34%。,2017年中国人工智能市场规模将达到152.1亿元,增长率达到51.2%。随着人工智能技术的逐渐成熟,科技、制造业等业界巨头布局的深入,应用场景不断扩展,预计2018年中国人工智能市场规模有望突破200亿元大关,达到238.2亿元,增长率达到56.6%。,02 全球智能语音市场分析,1952年,第一个语音识,别系统Audry诞生,技术萌芽阶段(20世纪50-70年代),1984年,计算机第一次开口说话。,1988 年,Sphinx 系统首个非特定人、连续语音识别系统诞生。,技术突破阶段( 20 世纪 80 年代),产业化阶段(20世纪90年代至21世纪初),智能语音行业发展历程1997 年,Viavoice。,2002 年, EAR 项目。,2009年, Windows7集成语音功能,00,快速应用阶段( 2010 年以后),苹果,2011 年Siri语音助手诞生,全国智能语音市场规模分析,随着人工智能产业的持续火热,,大量资本进入,在国际智能语音上诞生了一批明星公司,据统计数据显示,2017年全球智能语音市场规模达到110.3亿美元,同比增长30%。随着移动互联网、智能家居、汽车、医疗、教育等领域的应用带动智能语音 产业,规模持续快速增长,预计2018年全球智能语音市场规模将达到141.1亿美,元。,全球智能语音市场占有率情况,目前,在全球智能语音市场份额占,比情况中,Nuance全球市场占有率排名第一,市占率达到31.6%;其次为谷歌,市场占有率为28.4%;排名第三的是的苹果,市占率为15.4%。前三品牌市场份额占比高达75.4%。其后为微软以及科大讯飞分别占有 8.1%以及 4.5%的市场份额。值得注意的是科大讯飞已经超越老牌计算机巨头 IBM 位列全球第五。,03,中国智能语音市场分析,中国智能语音市场规模分析,伴随着人工智能的快速发展,中国,在智能语音技术的专利数量持续增长,通过庞大的用户群基础以及互联网系统优势明显,国内智能语音公司已经占据一席之地。,数据显示,2017年中国智能语音市场规模达到105.7亿元,与2016年相比增长70%。随着智能语音应用产业的拓展,市场需求增大,预计2018年中国智能语音市场规模将进一步增长,达到159.7亿元。,中国智能语音市场占有率情况,目前,中国智能语音市场的主要份额被科大讯飞、百度以及苹果分割。数据显示,目前为止,中国智能语音,市场,科大讯飞市场占有率排名第一,市占率达到44.2%;其次为百度,市场占有率为27.8%;排名第三的是的苹果,市占率为6.9%。其中,排名前三品牌在我国智能语音市场占比近八成,为78.9%。,其后为Nuance以及小i机器人分别占有,均为3.0%的市场份额。,04,国内主要企业分析,1.科大讯飞科大讯飞股份有限公司,中国智能语音与人工智能产业领导者。公司成立于,1999年,在语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等智能语音与人工智能核心技术上代表国际最高水平。2008年在深圳证券交易所挂牌上市,股票代码:002230。2018年第一季度财报数据显示,营业总收入达到13.98亿元,净利润为0.82亿元。,科大讯飞推出的以语音交互技术为核心的人工智能开放平台,讯飞开放平台。科大讯飞智能语音识别主要分为语音听写、语音转写、实施语音转写、语音唤醒、声纹识别以及离线命令词识别,六种产品。,序列,产品,产品特点把语音(60秒)转换成对应的文字信息,让机器能够“听懂”,123456,语音听写语音转写实施语音转写语音唤醒声纹识别离线命令词识别,人类语言,相当于给机器安装上“耳朵”,使其具备“能听”的功能语音转写(Long Form ASR)基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数为信息理和数据挖掘提供基础实时语音转写(Real-time ASR)基于深度全序列卷积神经网络框架,通过 WebSocket 协议,建立应用与 原三转写核 景,擎的长连接,将音频流数据实时转换成文 获取 数据 个目标设备(手机、玩具、家电等)在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令,即唤醒词),让处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步声纹识别(Voiceprint Recognize),是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术用户对设备(手机、玩具、家电等)说出操作指令(即“命令词”),设备即作出相应的反馈,开启语音交互,科大讯飞智能语音识别产品分析科大讯飞智能语音产品一览,2.百度百度(纳斯达克:BIDU),全球最,大的中文搜索引擎、最大的中文网站。2018年第一季度财报,百度一季度营收33.3亿美元,市场预期32.0亿美元。百度第一季总营收猛增31%,33.3亿美元。归属百度的净利润增至11亿美元,同比增长277%。,金融安防:,百度语音为开发者提供业界优质的远场语音 还原服务, 场景,,识别三维 通过,百度语音识别,提供业界领先的技术,让您的应用长上耳朵。支持车载导航、智能家居、社交聊天、应用助手、娱乐游戏等,助力企业实现多场景智能语音交互。百度智能语音识别产品功能分为语音识别、长语音识别、远场语音识别、呼叫中心实时,语音识别、呼叫中心音频文件转写五大功能。,教学深度 体采,长时目标 音转,作,深度 工作,同时多个 说话,、机整轨 音交,序列1234,产品语音识别长语音识别远场语音识别呼叫中心实时语音识别,5,功能介绍百度语音识别为开发者提供业界优质且免费的语音服务,通过场景识别优化,为车载导航,智能家居和社交聊天等行业提供语音解决方案,准确率达到90%以上,让您的应用绘“声”绘色提供业界优质的长语音识别服务,在会议、 基于或者媒 信息访中,百度长语音识别服务可快速准确的将 进行间的语 检测、化为文字,方便进行拷贝和编辑等后续的工 利用让您的 相机、生活变得更便捷麦克风阵列前端处理算法,有效消除噪音, 获取对目标 目标人声音进行增强,使得智能家居、智能硬件 的完器人语 迹。互等场景下的远场语音也可准确识别企业可使用呼叫中心实时语音识别服务,将智能电销、智能IVR、智能外呼、智能语音质检等场景的语音精准地转为文字,提升企业效率并降低成本。企业可使用呼叫中心音频文件转写服务,将电销业务、客服,呼叫中心音频文件业务、质检业务等多场景的语音精准地转为文字,提升企业转写 效率并降低成本。同时也为企业呼叫中心提供智能化、标准化服务,提升商务合作效率,百度智能语音识别产品分析百度智能语音识别产品一览,3.苹果公司苹果公司(Apple Inc. )是美国一家高科技公司。总部位于加利福尼亚州的库,比蒂诺。2017年苹果WWDC开发者大会上,Siri的更新当中,加入了实时翻译功能,支持英语、法语、德语等语言,未来将陆续进行支持,与此同时,Siri的智能化还进一步得到提升,支持上下文的预测功能。2018年第二季度财报,2018年二季度营收611亿美元,利润为138亿美元。,金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。,苹果智能语音产品:SiriSiri是苹果公司在其产品iPhone4S,iPad 3及以上版本手机和Mac上应用的一,项智能语音控制功能。Siri可以令iPhone4S及以上手机(iPad 3以上平板)变身为一台智能化机器人,利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。2017年苹果WWDC开发者大会上,Siri的更新当中,加入了实时翻译功能,支持英语、法语、德语等语言。,金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。,4.腾讯深圳市腾讯计算机系统有限公司成立于1998年11月,是中国最大的互联网,综合服务提供商之一,也是中国服务用户最多的互联网企业之一。2016年5月,腾讯上线智能语音服务;12月3日发布微信语音开放平台。后者在垂直细分领域的识别率可达 90%以上。2018年第一季度,腾讯实现营业收入735.28亿元,同比增长48%;净利润232.9亿元,同比增长65%。,金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。,智能语音服务AAI由腾讯云携手微信智能团队联合推出,满足语音识别、语音合成、声纹识别等语音处理需求。强大的垂直领域定制化服务,打造专业高效的语音大脑。智能语音服务AAI的具备语音识别、语音合成、声纹识别以及云端+嵌入式四大功能。,序列1234,产品语音识别语音合成声纹识别云端+嵌入式,功能介绍语音转文字,根据关键词列表搜索语音偏移量,情绪识别,静音监测;提供声学和语言模型定制化服务将文本转成自然清晰的语音,多种音色选择,支持中文,英文,中英文混读等语音一对一识别;判断某段语音是若干人中的哪一个所说;声纹安全存储云端服务可随需求弹性扩缩容,并提供持久化存储能力;嵌入式引擎满足无网络场景下智能语音需求,4.腾讯腾讯智能语音相关产品一览,5.搜狗2018 年第一季度财报。搜狗作为上市后首个财年的开年成果,数据显示,第,一季度营收达 2.48 亿美元,较去年同期增长 53%;净利润 1960 万美元,同比增长56%,营收与利润均超 50%,超出此前预期。3 月,搜狗发布了搭载业内最前沿机器翻译技术的智能硬件“旅行翻译宝”,具备离线翻译、拍照翻译、24 国语言互译等功能。,金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。,金融安防:,还原三维场景,,获取多个目标,搜狗语音云平台提供业内领先,的搜狗自有语音技术,目前已陆续推出在线的语音识别以及听歌识曲服务,,并向开发者提供离线语音识别及离线语音合成服务, 而更多服务正在逐步集成中,力求进一步降低开发者使用语音的成本;语音技术分为在线语音识别技,术、离线语音识别技术、在线听歌识曲技术以及离线语音合成技术。,序列,技术,技术特点,1,通过机器将语音信号转变为相应的文本,搜狗语音在线语音识别技 云提供的语音识别服务使用了高性能声学建模技术、术 高效语言模型建模技术以及高速大规模网络动态解码技术 基于深度信息,快行目 音识,利 集成;SDK,23,离线语音识别技术在线听歌识曲技术,完整 用权;,4,语音识别无需联网、无需流量,方便 进捷;语 标检测、别率业界领先;支持Android系统,便于 用深度相机占用空间较小,耗费内存较少。只需录制提交音乐片段,由搜狗音乐云自动给出演唱者和歌曲名称,用户可享受无上限 的免费使 轨迹。云端海量曲库支持;快速、准确的听歌识曲功能。离线语音合成则无需依赖网络即可在设备上合成出高音质的语音,其特点为高精度的多音字、变调处,离线语音合成技 理以及韵律层级预测;高性能的声学建模技术以及术 高质量的合成器;支持Android和IOS系统,便于集成;提供差异化sdk定制,最小不足5M,低运算、低功耗。,搜狗语音云平台搜狗语音云平台技术一览,05,行业发展前景预测,0103,行业监管加强,行业规范化发展随着行业的快速发展,行业发展进入新阶段,监管力度持续提升。未来促进行业规范发展以及维护市场秩序,出台多项重磅政策。04融入芯片加速规模化应用以芯片嵌入的形式,能够将智能语音更快速而广泛地应用到更多场景中。芯片将麦克风阵列、远场语音识别等功能集成,形成完整的远场语音交互链条。,技术切入教育行业核心业务随着智能语音技术的逐渐成熟,智能语音技术在口语教学、考试测评、模拟练习等环节能够代替现在很多老师的工作,大大降低人工成本。以智能语音为突破口,人工智能可以将教育行业,教学、科研、考试、评估等教育各个环节。02智能化与语音交互技术将成行业核心竞争技术智能音箱是语音交互式产品,语音交互技术直接影响用户体验,智能化与语音交互技术或将成为智能语音行业的核心竞争技术。,四大发展前景,THANKS,
展开阅读全文