资源描述
2018中国智能语音助手研究报告,摘要,智能语音助手用户多分布在经济发达地区,开始尝试使用智能语音助手的最主要原因是想通过语音操控从而解放双手,并且智能语音助手对语音语义识别的准确性也成为了用户选择及使用时最重要的考量因素。,该份案例报告通过对智能语音行业的市场动态、趋势,智能语音助手用户的行为习惯和需求以及典型企业案例进行分析,希望为行业发展提供参考。,近年来,人工智能发展迅速,也得到越来越多的关注。其中,语音类人工智能中的重要行业应用“智能语音助手”也成为了人工智能的一个主要应用领域。目前行业里的智能语音助手通常应用于消费级产品和专业级行业应用两大领域。,计 广 (算 动 移 机 告 营 视觉,移 广 动 ) 销,义,狭义移动营销,概念定义人工智能,英文全称为“Artificial Intelligence”(AI),是计算机科学领域的一个分支,包涵研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统等。人工智能企图通过模拟人类的思考反应方式,生产出具有与人类相似思考反应能力的机器,核心的三大基础技术是计算机视觉、智能语音和机器学习。其中,智能语音技术目的在于实现人机语言的通信,使人与机器之间能够通过纯语音进行交互,包括语音识别(ASR)、语音合成(TTS)和自然语言处理(NLP)三项主要技术。人工智能,机器学习,ASR,智能语音TTS,NLP,中国智能语音助手行业发展背景中国智能语音助手用户研究咪咕灵犀案例分析,123,人工智能行业发展历程,将逻辑推理能力,第五代计算机项目由,系统诞生,早期的系统适用,于更宽的选择和,更难的问题时效,果并不理想,CNN超第二名十,个百分点夺冠,人工智能行业发展现状语音识别、计算机视觉领域取得重大进展在20世纪50年代到70年代初,人工智能的研究尚处于“推理期”,人们认为如果赋予机器逻辑推理能力,机器就能具有智能。到了20世纪70年代,人们意识到人类之所以能够判断、决策,除了推理能力之外,还需要具备一定的知识。发展到20世纪80年代,机器学习真正成为一个独立的学科领域,相关技术层出不穷。2010年后,“人工智能”相继在语音识别、,1968,1970,2012,1942达特茅斯会议诞生了“人工智能科学”美国科幻巨匠阿西莫夫提出“机器人三定律”,自动定理证明系统完成数学原理第二章的证明,1992ImageNetHinton发表深,2016港中文实验室DeepID算法首次超过人眼识别人脸率度学习的 AlphaGo战Nature文章 胜人类顶尖围棋选手,计算机视觉领域取得重大进展,围绕语音、图像等人工智能技术的创业大量涌现。推理期DENDRAL世界上第一例成功的专家赋予计算机系统于技术路线明显背离计算机工业的发展方向而宣告失败1956 19632006,莱斯利提出概率近似正确模型1984知识期总结人类知识,教授给计算机系统,机器学习期深度学习在语音及图像领域大获成功2014,人工智能分类虚拟语音助手是人工智能的重要应用领域计算机视觉、智能语音和机器学习是人工智能的三大核心基础技术,目前研发出的人工智能应用大多是这三种技术综合运用的结果,只是其中的主次之分不同。依据核心基础技术类目,可以将人工智能分为两大类,即感官智能和决策智能,其中视觉智能、语音智能和深度学习智能是感官智能和决策智能下的三大子赛道。目前,语音智能的一个重要行业应用就是虚拟助手,即“智能语音助手”。它的核心在于人类通过纯语音信息实现与机器的交互,让智能机器“助手”帮忙完成指,派的任务。,视觉类计算机视觉目前主要应用于辅助驾驶、图像/视频编辑、图片识别、人脸识别、文字识别、视频监控、工业视觉检测、三维视觉、医疗影像诊断等。,语音类智能语音目前主要应用于智能家居、虚拟助手、可穿戴设备、智能车载、智能医疗、陪伴机器人等。,深度学习类机器学习目前主要应用于精准营销、风险预估、健康监测、优化运营、AlphaGo等。,人工智能行业分类,决策智能,感官智能,智能语音助手行业现状,互联网巨头纷纷进入布局,从2010年开始,互联网巨头们纷纷通过自主研发或并购/参股的方式开始探索智能语音产业,其中,智能语音虚拟助手成为重点布局对象,此外,为占据一定的市场先机,苹果、谷歌、微软、亚马逊、百度、腾讯、搜狗等巨头们也陆续开始在智能车载、智能家居、智能医疗、可穿戴设备等诸多细分市场寻求突破。,智能语音技术及其发展语音识别、声纹识别、语音合成等人类因为具有语言的能力而区别于其他物种,智能语音技术即研究人与计算机直接以自然语言的方式进行有效的沟通的各种理论和方法,涉及机器翻译、阅读理解、对话问答等,因为语言在词法、句法、语义等不同层面的不确定性及数据资源的有限性、背景知识的复杂性等各方面限制,智能语音技术仍有非常大的提升空间,仅在特定领域可取得较好的应用,鲁棒性存在大量挑战。在自然语言处理之前,声纹识别可根据说话人的声纹特征识别出说话人,语音识别技术可赋予机器感知能力(在深度学习的驱动下,目前近场语音识别准确率可达98%,远场、抗噪、多人等非限定或配合条件下的识别有待改进),将声音转为文字供机器处理,在机器生成语言之后,语音合成技术可将语言转化为声音,形成完整的自然人机语音交互,这样的语音交互系统可看作一个虚拟对话机器人,具体流程如下。,广义移动营销,智能语音交互系统的技术流程,语音,NLP,18,27,36,45,对话输入对话输出,ASR语音识别TTS语音合成,NLU语音理解NLG语音生成,DST对话状态维护Policy动作候选排序,广义移动营销广义移动营销,基础研究机构语义数据提供商,狭义移动营销(移动广告)语音技术提供商,智能语音应用提供商,智能语音产业图谱四大板块协同作业智能语音产业链分为基础研究机构、语义数据提供商、语音技术提供商及智能语音应用提供商四大板块。其中,基础研究机构包括语音合成、语音识别、声纹识别等基础技术的研发和技术输出;语义数据提供商为算法研究和技术输出机构提供语音、语义数据库及定制化的数据采集和处理;语音技术提供商将基础技术转化为软件或行业整体解决方案,提供嵌入式或平台是的语音软件服务、行业智能语音系统整体解决方案;智能语音应用提供商则有智能移动设备、智能车载设备、智能家居等智能终端厂商,以及输入娱乐等各类APP或软件客户端等。2018年中国智能语音助手产业图谱,作用:将基础技术转化为软件或行业整体解决方案参与企业:语音技术研发机构,基础研究机构,智能语音产业图谱自上而下推动产业发展2018年中国智能语音产业图谱作用:基础语音技术输出和语义数据采集处理参与企业:基础研究机构、语义数据支持机构,上游基础层中游技术层,下游应用层,数据支持机构,技术研发机构,作用:将智能语音设备提供给用户参与企业:智能语音应用服务机构 家汽车 居,其他,移动设备客服,语音识别技术应用聊天/问答,B端应用场景专业级智能语音助手的主要形式有语音识别转写以及语音语意内容分析等。,C端应用场景消费级智能语音助手的主要功能基于语音交互实现设备控制、日程管理、信息查询、生活服务、情感陪伴等。,移动设备智能手机、可穿戴设备,汽车汽车前装、汽车后装,家居传统家电、智能机器人,客服在线客服、呼叫中心,金融业务办理,其他教育、医疗法律、安防,智能语音助手应用场景应用于消费级产品和专业级行业应用两大领域目前行业里的智能语音助手通常应用于消费级产品和专业级行业应用两大领域。其中,消费级产品主要应用于C端衣食住行主要等生活场景,有基于语音交互实现的设备控制、日程管理、信息查询以及情感陪伴等;专业级市场面向的B端的教育、金融和医疗等,来实现语音内容转写和语义内容分析。中国智能语音助手应用场景,智能语音助手行业企业分类,国外巨头抢占先机,国内公司紧追而上,在目前的智能语音市场上,国外科技巨头率先抢占先机,运用并购等手段,夯实核心技术,开放应用平台,在既有的产品和业务中实现AI first,扩展以AI为核心的生态系统。而国内互联网公司近几年在智能语音方面也发展迅速,通过开放语音生态系统,以产业内合作的方式,将语音技术植入产品或应用于相关业务场景,构建全产业生态链。另外,国内智能语音公司依托原有优势,从单一智能语音技术商转型为全方位人工智能技术服务商;初创厂商则以垂直领域和细分场景为突破口,重点布局家居,车载和可穿戴设备。,国内智能语音公司:,从单一智能语音技术商转型为全方位人工智能技术服务商,初创厂商:,以垂直领域和细分场景为突破口,国外科技巨头:,夯实核心技术,开放应用平台,国内互联网巨头:,开放语音生态系统,将语音技术植入相关业务场景,2018年中国智能语音助手企业分类,智能语音助手行业企业现状互联网巨头具有天然优势,初创型企业深耕垂直领域,技术类公司教育、金融、客服等领域需要和行业进行高度定制,大型互联网公司不会轻易涉足,因此会成为像科大讯飞这样的智能语音专业技术类公司的主要阵地。初创型企业通过深耕垂直领域和细分赛道,实现自我造血和快速成长,创业公司也有机会在这一新兴产业中逐渐做大。接下来,随着语音识别和NLP技术的逐步成熟,智能汽车、智能家居、智能机器人产业的日渐完善,会有一批优秀的初创型企业在智能语音产业的浪潮中顺势而起。,互联网巨头互联网企业具有天然的C端优势。第一无论是通过自有2C产品还是借助合作,大型互联网公司依靠其庞大的用户量、大量真实场景下的数据积累、以及背后强大的搜索引擎和完整的知识库,可以极大提高语音识别在真实环境下的识别准确率,以及语义分析和理解能力。第二,互联网公司拥有丰富的C端产品经验,加上对用户消费数据的迭代,能够更好地提升产品体验。对于体验至关重要的消费端,一旦产品或应用形成良好的行业口碑,快速的走量也会水到渠成。,14,中国智能语音助手行业发展背景中国智能语音助手用户研究咪咕灵犀案例分析,123,智能语音助手用户画像多为学历高、家庭结构稳定的男性群体在智能语音助手的用户中,男性比女性更乐于地尝试这一新科技,占比也更高,达到61.7%。而且,这些用户多为从小就接触到互联网的年轻群体,其中26-35岁的用户比例为53.0%,他们普遍更易于接受新鲜事物。大多数用户家庭结构稳定,66.3%的人已经结婚并且有小孩。用户也具有高知识高学历的特征,本科及以上学历占到了80.2%,他们有着较为体面的,工作,经济收入水平也较高。广义移动营销狭义移动营销(移动广告),51.0%集中于企业管理人员及普通员工注释:C1.请选择您的性别: C2请选择您的出生年月:C3.请问您的最高学历是: C5.请问您的职业是?C6.请选择您的婚姻状况: C7.请选择您目前的个人月平均收入:样本:N=884,于2018年4月通过调研获得。:,2018年中国智能语音助手用户基本属性61.7%为男性用户53.0%分布在26-35岁之间66.3%用户已婚有小孩80.2%拥有本科及以上学历50.8%个人月收入在8000以上,智能语音助手用户地域分布用户多分布在经济发达地区智能语音助手属于人工智能新科技,技术含量较高,产品研发成本较大。智能语音助手用户多分布在经济发达地区,北上广深四个一线城市的用户占比达54.3%。其中,一二线城市经济发展水平较高,智能语音助手的用户数占到总体的76.4%。这是因为与三线及以下城市相比,一二线城市尤其一线城市的居民生活压力更大,忙碌的生活状态也让人更乐于去尝试能,解放双手的智能语音助手。,5 %10%20%10%-20%,广州、深圳20.7%,北京11.4%上海14.1%,一线城市41.4%,二线城市35.0%,23.6%,三线城市及以下,2018年中国智能语音助手用户城市分布,用户接触智能语音助手时长用户接触较早,接触时间较久智能语音技术作为人工智能的三大基础技术之一,随着人工智能的火热而迅速发展。其中,智能语音助手也成为一个相对较早被开发的领域。大多数用户比较早地就开始接触智能语音助手,52.7%的用户接触智能语音助手的时长都在半年以上。,注释:B3.您接触手机智能语音助手多久了?样本:N=884,于2018年4月通过调研获得。,3.1%,18.7%,25.6%,25.1%,27.6%,不到一个月,一个月到三个月,一年以上,半年到一年,三个月到半年,2018年智能语音助手用户的使用历史,新用户,普通用户,老用户,注释:B2.您开始尝试使用手机智能语音助手的原因是?样本:N=884,于2018年4月通过调研获得,用户尝试智能语音助手原因解放双手的“便利”和人工智能的“新奇”根据调研结果,用户开始尝试使用智能语音助手最主要是因为语音操控从而解放双手带来的便利性,占比达到64.0%,其次56.1%的用户则是对新科技兴趣较浓,出于对人工智能的好奇而开始尝试智能语音助手。2018年中国用户尝试智能语音助手原因,26.5%,56.1%,64.0%,43.0%,41.6%,操作方便智能,解放双手,好玩,可以调戏助手,跟随大众潮流,助手执行能力强,节省时间,探索尝试人工智能等新事物,每月一次或更少,5.9%大约每半个月一次,3.5%,大约每周一次,15.5%大约每周3-4次,41.9%注释: B4.您使用手机智能语音助手的频率是?TGI:即Target Group Index(目标群体指数),可反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体受众、产品消费者)内的强势或弱势。样本:N=884,于2018年4月通过调研获得,用户使用智能语音助手频率使用频率较高,用户粘性较大,重度用户更看重生活实用性用户对智能语音助手的依赖性较强,使用的频率较高,超七成用户每星期的使用频率在3次以上,其中33.3%的用户每天都会使用智能语音助手,41.9%的用户每星期至少使用3次,用户对智能语音助手的粘性较大。此外,在每天都使用智能语音助手的用户中,因为其能够节省时间与解放双手的倾向性显著,分别高达139与125。这也表明了在重度用户中,新奇好玩并不是主要因素,更加贴近生活场景的实用层面才是能让这个行业长久发展的原因。2018年中国智能语音助手用户使用频率,每天都会用,33.3%助手执行能力强,节省时间TGI:139操作方便智能,解放双手TGI:125,0.2%,40.4%40.2%37.4%36.3%26.1%,60.5%,手机功能引导搜索引擎搜索朋友介绍网站、论坛介绍应用商店推广媒体宣传其他,用户获取智能语音助手相关信息渠道用户具有搜索相关信息的主动性根据调研,用户获取智能语音助手相关信息的渠道除除手机功能引导之外,用户对智能语音助手也有较大的兴趣,具有上网搜索相关信息的主动性;相对应的,用户获取使用的手机智能语音助手的方式第一是手机自带,第二是会通过应用商店自主下载。,百分比(%)注释:B5.您是通过哪些渠道来了解手机智能语音助手的相关信息?样本:N=884,于2018年4月通过调研获得,2018年用户获取智能语音助手相关信息的渠道,2018年用户获取智能语音助手的渠道,0.2%,16.7%16.5%10.9%9.8%,63.0%57.0%,手机自带应用商店下载网页下载专业论坛下载线下人员帮忙安装短信发送安装链接其他,百分比(%)注释:、B6.您现在使用的手机智能语音助手是从哪种渠道获得的?样本:N=884,于2018年4月通过调研获得,注释:B7.您选择某款手机智能语音助手会受到哪些因素的影响?样本:N=884,于2018年4月通过调研获得,狭义移动营销(移动广告),33.5%,19.8%,34.3%,33.4%,30.4%,产品功能外观71.2%广义移动营销48.4%,产品附加属性,产品品牌口碑,用户选择智能语音助手考虑因素语音识别准确性是衡量的首要标准对于不同智能语音助手的抉择,智能语音助手用户大多从实用性的角度出发,智能语音助手语音识别的准确性成为用户选择产品的第一要素,占比71.2%,远超其他各项。其次是交互界面的便捷程度,用户对智能语音助手的知名度和应用商店排名及评分等品牌口碑指标则并没有太大关注度。2018年用户选择智能语音助手考虑因素,注释:B8.您一般会在什么情况下使用手机智能语音助手?样本:N=884,于2018年4月通过调研获得。,用户使用智能语音助手场景解放双手为最大吸引点,休闲娱乐功能受重视在智能语音助手用户中,不方便双手操作的时候是使用智能语音助手的主要应用场景,占比高达72.6%;此外休闲时的娱乐放松也是打开语音助手的另一重要原因,占比也超半数,达到55%。2018年中国用户使用智能语音助手场景,休息或休闲时,55.0%,一个人无聊时,42.5% 广义移动营销狭义移动营销(移动广告),做家务时,34.2%,不方便双手操作时,72.6%,搜索查询功能66.4%手机功能调用47.8%注释:B9.您通常使用手机智能语音助手做哪些事?样本:N=884,于2018年4月通过调研获得。,手机APP调用54.0%日程规划助理30.9%,用户使用智能语音助手目的主要用途在于信息搜索,手机APP调用其次从调研结果可以看出,66.4%的用户使用智能语音助手的目的是利用智能语音助手来进行搜索查询功能,其次54.0%的用户使用语音助手来调用手机内置APP。2018年中国用户使用智能语音助手目的,打电话、发短信52.0%聊天调侃17.4%,用户使用智能语音助手的满意度语音助手的语音识别准确度成最为在意及期望改善的地方根据调研结果,用户对于智能语音助手较为在意语音语义识别的准确度、人机交互的舒适度以及智能语音助手对自己的工作生活能否产生帮助。其中智能语音助手识别的准确度是用户最为在意的地方,占比达到47.2%。并且在智能语音助手有待完善的部分认为在目前的手机智能语音助手在语义识别率上仍然是最有待提升的地方。,注释: B11.在使用手机智能语音助手时,你比较在意哪方面的情况?最在意哪个?样本:N=884,于2018年4月通过调研获得。,注释: B13.您认为当前手机智能语音助手还有哪些需要完善的地方?样本:N=884,于2018年4月通过调研获得。,2018年中国用户在使用智能语音助手在意的方面,2018年中国用户认为智能语音助手有待完善的地方,5.3%6.3%,22.3%,18.8%,47.2%,59.0%58.0%,78.2%,84.2%80.3%,对工作、生活能否产生帮助安装在设备上占用的存储空间消耗流量的多少,语音/语义识别的准确度人机交互的舒适度,其他在意(%),0.5%0.1%最在意(%),53.9%42.9%40.3%29.9%,67.8%55.2%,其他,能够自主学习用户语料增加更多的新功能声音的动听程度手机界面的美观度,语音、语意识别的准确度回答的响应速度,0.2%百分比(%),25,中国智能语音助手行业发展背景中国智能语音助手用户研究咪咕灵犀案例分析,123,2.3亿全国用户规模,1800万月活跃用户,350万日活跃用户,咪咕灵犀概述咪咕灵犀基本信息咪咕灵犀,原名灵犀语音助手,是一款中文人工智能助手。它由中国移动咪咕公司与科大讯飞联合推出。采用全球最先进语音识别技术,特别针对中文口音问题进行识别优化。 咪咕灵犀支持全程用语音操控手机,用户在与手机交谈中即可完成打电话、发短信、设提醒、查地图、找美食、翻译、速记等日常操作,作为一个AI助手还为用户提供主动提醒服务。根据咪咕灵犀的数据显示,灵犀智能语音助手目前累计注册用户达2.3亿,日活跃用户突破350万。咪咕灵犀智能语音助手用户情况,3.0,4.0,版本,版本,版本,咪咕灵犀发展历程咪咕灵犀产品发展历程灵犀语音助手APP自2012年12月上线以来便惊喜不断, 保持每年一次大版本更新的速度,逐步增加语音拨号、语音编辑短信、流量监控、话费充值、语音翻译、语音速记、贴心提醒等服务类工具,并融合海量有声内容,时事热点。逐步完善的用户体验得到用户的认可,为了更好的服务逐渐壮大的用户群,灵犀品牌进行了全面的升级,灵犀语音助手正式更名为,咪咕灵犀。,灵犀语音助手上线,主打语音操控、聊天服务。,灵犀语音助手,咪咕灵犀,2013年7月,2.0版本,2015年1月,2017年4月,5.0版本,2017年12月,6.0版本,强化打电话刚需操1.0 控功能、搭建信源版本 管理平台,引入互联网信息服务。2012年12月,强化内容类功能、提升信息获取效率、 3.1连接智能硬件、探索流量分发变现与,垂直领域。,内容前置、缩短获取路径、支持用户个性化定制首页。2014年8月 2016年7月,常用功能与内容服务分类、强化语音功能、与咪咕内容及服务深度融合。,新增英、日、法、韩、西语五国翻译、 品牌速记功能和智能提 升级醒功能。2017年5月,产品进行品牌升级,正式更名为咪咕灵犀。,接入科大讯飞最新一代AIUI引擎,从底层技术方面大幅提升核心应用能力。,咪咕灵犀产品发展历程,2017.7.4咪咕灵犀荣获第21届中国国际软件博览会金奖2017.8.29机智过人央视首播 咪咕灵犀让人工智能走进生活2017.12.3Global Tech 2017环球智能世界大会在京举行咪咕灵犀荣获“智慧交互奖”2017.12.29咪咕灵犀速记助力2017环球网财经峰会,为会议提供智能语音同声传译服务2018.4.8咪咕灵犀打造最in趣朗读 央广导师团即将亮相,2017.6.28咪咕灵犀速记闪耀2017全球虚拟现实大会2017.7.10咪咕灵犀斩获2017 ECI Awards技术创新金奖2017.9.30李艺彤登顶SNH48语音包票选 成咪咕灵犀首位声音体验官2017.12.22咪咕灵犀暖心电话亭,感受人工智能的暖心打Call咪咕灵犀荣获牛耳奖人工智能领域年度最佳创新产品奖2018.1.2咪咕灵犀携手麦家理想谷联袂推出的付费音频栏目麦家陪你读书独家上线。2018.5.18咪咕灵犀6.0.3600新版上线,咪咕灵犀大事记荣膺各类奖项,让人工智能走进生活咪咕灵犀产品大事记,定制语音包l 提供明星定制、地方特色方言语音包,发挥粉丝效应,用户可以下载自己最喜欢的声音。智能硬件操控l 统一智能家居产品操控,通过语音实现照明控制、门锁控制、电器控制、远程监控。,语音翻译l 面向出国旅游提供翻译服务、面向跨国协作提供电话翻译、大型演讲翻译、会议翻译l 实现英韩日法西五大语种和中文的语音互译灵犀乐生活l 依托咪咕海量的优质内容资源,打造一站式数字娱乐服务。,咪咕灵犀产品功能介绍“能听会说”,网天下APP,享海量内容灵犀智能语音助手以“能听会说”的语音技术为核心,在语音拨打电话、发短信、设提醒、语音查询话费流量、天气、酒店、美食等生活服务的基础上,提供四大应用场景,“1+4”轻松享受智能生活。2018年咪咕灵犀产品介绍,用户眼中咪咕灵犀的特色语音语义识别准确为咪咕灵犀最大特色根据调研,用户在使用咪咕灵犀的过程中,37.5%的用户觉得咪咕灵犀语音助手最大的特色是其语音语义识别功能的准确度,占比位列第一,咪咕丰富的内容资源与趣味性的聊天问答分别以18.0%与14.8%位列二三位。2018年中国用户眼中咪咕灵犀的特色,语音语义识别准确37.5%咪咕丰富内容资源18.0%,明星、地方特色语音包8.6%兼容许多智能家居10.2%翻译、速记等功能10.9%趣味性的聊天回答14.8%注释:B1_1.在使用灵犀语音助手的过程中,您觉得它最大的特色是什么?样本:N=884,于2018年4月通过调研获得。,咪咕灵犀,家庭生活,便捷出行,休闲聊天,智能车载,在闲暇空余时间,满足用户对视频、音乐、阅读等的一站式要求,并可进行语音互动交流,为用户带来无限乐趣。,在开车时,使用灵犀语音播报功能+定制语音包能进行语音导航、听音乐、语音拨打电话及发短信。,使用灵犀的特色语音服务,可以实现在做家务的同时收听新闻与小说。,咪咕灵犀内置的翻译、查天气、订车票酒店等服务和功能,能满足用户出行的一体化需求。,咪咕灵犀应用场景日常应用多处场景,便利生活咪咕灵犀可用于休闲聊天、车载、家庭、出行等生活中的各种场景,满足用户形形色色的需求,为生活带来无限便利与无限可能。咪咕灵犀应用场景分析,THANKS,
展开阅读全文