资源描述
2016-2017中国互联网企业大数据研究报告,内容综述聚焦网络媒体大数据,研究其体系架构及相关产品,大数据Data 发展阶段:从信息驱动向数据智能驱动进阶; 产业结构:由数据源、技术服务及应用类型共同构成; 数据来源:企业自有数据是主流数据源,数据的流通和共享将成趋势; 数据管理:数据挖掘与可视化成行业热点,数据管理向垂直行业分化; 分析处理:文本、图像、语音分析相对成熟,视频分析存在探索空间; 应用类型:从独立数据产品向完整行业解决方案发展,定制化将成趋势。来源:XX研究及绘制。,互联网大数据Internet 优势体现:互联网基因有利于大数据的获取与处理; 现状分析:互联网行业是大数据应用的领跑者。1)已上市互联网企业中,以BAT为首的数据驱动型媒体整体表现较好;2)未上市互联网企业中,数据驱动型企业成为领跑者; 机遇:1)手机网民持续增长,可采集群体更加广泛;2)移动端使用时长占比超77%,信息采集更加丰富连贯;3)场景化特征为大数据发展带来新契机; 挑战:屏幕变小、行为碎片化对大数据的应用提出更高要求。,网络媒体大数据Media 海外发展:1)企业技术探索先行,政策推动产业发展进程;2)将自主研发与投资收购相结合,技术推动企业发展; 优势体现:具有强媒体属性的网络服务的发展策略相对成熟; 现状分析:中国网络媒体的数据生态系统雏形已成,多维度输出大数据能力; 发展策略:大媒体以流量+广告服务为起点,推进产业生态形成。本报告将聚焦于中国网络媒体,研究其大数据体系架构及相关产品,探讨大数据发展趋势。,中国大数据产业现状分析中国网络媒体大数据产业分析中国网络媒体大数据企业分析中国网络媒体大数据的机遇与挑战,1234,抽样数据 全量数据精确数据 混杂数据因果关系 相关关系,大数据定义与特征4V:数据规模大,数据流转快,数据类型多,价值密度低大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。为了适应数据量的爆发式增长,数据处理方式正逐步向全量性、混沌性及相关性发展。为了避免信息损失,越来越多的场景倾向于对全量数据进行挖掘与分析,其中,只有一小部分数据是结构化的,而非结构化数据中同样蕴含着大量信息,因此,能够处理各式各样的混杂数据的大数据技术得到了广泛应用和迅速发展。其中,占据着重要地位的大数据预测分析,也从主要基于因果关系进行分析发展成了建立在相关关系的基础上的分析模式。,Velocity数据流转快1秒定律:要在秒级时间范围内给出分析结果,超出这个时间,数据就失去价值了。Value价值密度低海量数据中,如何通过强大的机器算法,更迅速有效地完成数据的价值“提纯”,已成为目前大数据背景下亟待解决的难题。,Volume数据规模大IDC预计,到2020年,全球新建和复制的信息量将达到44ZB,中国数据量将超过8ZB。Variety数据类型多除了以文本为主的结构化数据、以网页数据为代表的半结构数据,也存在大量网络日志、音频、视频、图片、地理位置信息等非结构化数据。来源:XX研究及绘制。,数据仓库,Data Warehouse 的数据集合,用来支持,注释: ETL是指从源系统中提取数据,清洗、转换数据为一个标准的格式,并加载数据到目标数据存储区(通常是数据仓库)的工具。来源:XX研究及绘制。,按照某一特定部门的决策支持需求而组织起来的、针对一组主题的应用系统。,面向主题、集成、不可更新且随时间不断变化管理人员的决策。,源应用环境,从属数据集市,独立数据集市,数据集市Data Mart,数据源,ETL,数据仓库,数据集市,终端用户,大数据处理的数据价值流转过程,大数据集成与存储数据仓库基于企业整体建立,是大数据集成和存储的基础作为大数据集成与挖掘的基础,数据仓库是在企业范围内共享准确一致的集成数据、针对分析需求进行数据重组的工具,基于整个企业的数据模型建立。而数据集市基于单个部门或业务主题建立,为部门业务运行提供数据服务,可以根据仓库建设也可以独立建设,形成从属数据集市和独立数据集市。所有的从属数据集市都从属于同一个数据仓库,各子系统的数据均能保持一致。而每个独立数据集市都从各源应用环境中单独提取数据,独立拥有硬件平台、软件平台、数据和应用程序,彼此没有任何约束,无法保证数据的一致性,从长远来看,既不稳定也不可行。数据仓库能够对海量数据进行集成,满足大数据发展对数据存储的需求,为企业提供局部解决方案和全面解决方案。数据仓库与数据集市工作原理示意,智慧城市,智慧政务,智慧社区,智慧旅游,如:精准化营销搜索引擎精准营销RTB实时竞价广告重定向精准营销,如:互联网金融高频交易社交情绪分析信贷风险分析,数据源,Data Source,官方数据,第三方数据,行业数据技术服务,企业数据Technical Services,应用类型,Application Types,数据准备,存储管理,计算处理,分析技术,可视化,工具/产品化服务精准营销个性化推荐舆情监测网站/App分析工具,行业应用电信行业金融行业医疗行业电商行业,数据挖掘,解决方案如:智慧农场生长监测产量预测农业预警来源:XX研究及绘制。 ,大数据产业生态产业结构由数据源、技术服务及应用类型共同构成大数据产业结构示意图大数据Big Data,大数据产业图谱,舆情监测,网站/App分析工具,工具/产品化服务精准营销,征信,电信,医疗,娱乐,(社区)(农业)智慧政务,智慧公安,解决方案智慧城市(城管),注释:此大数据产业链地图为示意图,未将所有企业标出,举例企业顺序不涉及排名,按企业中文名称首字母排列。如有分类不当,请联系:。,数据应用,数据来源,行业应用金融物流,天气,地图服务,房地产农业,体育,教育,人力资源,能源,旅游,交通,数据安全,数据管理,数据分析,BI可视化,按数据类型图像分析,按应用类型AI,数据集成,云存储,数据存取,按类型按行业,关系类娱乐,个性化推荐,数据交贵阳、上易海、东湖等大数据交易中心,数据挖掘,计算处理全技术支持,文本分析 视频分析语音分析,体育,官方数据地理、水利、卫星、气象等基础数据金融 医疗 交通,行业联盟企业数据信息类物流 旅游,第三方数据服务交易类能源 建筑 农业,大数据产业图谱大数据应用广泛,价值升级来源于数据流通及共享,数据应用数据分析数据管理数据来源产品,应用类型分析技术基础架构数据源功能,应用存储、分析、挖掘、可视化收集/采集流程,来源:XX研究及绘制。,概述:本报告的大数据产业图谱以大数据产品的角度出发,对产业链角色进行划分。其中,数据管理与数据分析部分包括了大数据基础架构及相关分析技术,能够实现大数据的存储、分析、挖掘、可视化等环节。而在数据源与数据应用方面,从功能和流程角度来看具有高度的关联性及一致性,涉及行业极其广泛。数据应用大数据应用已渗透电信、金融、医疗、人力资源、物流、天气等多个行业,从产品角度来看,除传统的工具/产品化服务、行业应用及解决方案外,大数据应用也包括商业智能等分析服务。 应用情况:目前大数据应用的主要输出形式是可视化报表,未来将在功能方面进一步融合提升。 典型大数据行业应用: 物流:优化整体运输流程,实现实时查询把控。 营销:应用形式成熟落地,既提高了用户对目标商品的获取效率,又改善了商家的投放效果。数据管理与分析大数据基础架构包括多种数据库及相关分析计算技术,能够支持数据的采集、清洗、集成、存取、分析、挖掘等环节,从功能角度来看,除传统的数据处理过程外,可视化分析等分析服务也是基础架构的一环。 应用情况:企业(含互联网企业)的数据相关部门(如数据中心/数据分析平台/数据商业部等),主要通过对数据的管理、分析及整合,服务于自有业务,同时不断拓展应用类型和范围。 价值体现:大数据处理过程中流转的数据形态可划分为静态数据和动态数据,主要通过计算过程实现其价值,其中,模型算法为数据深度挖掘的核心,能够实现预测等功能。数据来源目前数据来源已较为多元,维度也越加丰富,尤其是互联网行业,在数据深度与广度方面具有天然优势,而物联网、车联网等的出现丰富了数据的采集方式与采集范围。 应用情况:目前企业内部的数据打通已成行业趋势,未来将进一步实现行业内外的数据流通乃至共享。 价值体现:1)大数据能够对人群进行细化管理,并提高对特定人群的覆盖率;2)数据价值的实现与其鲜活度相关;3)大数据的核心价值不在于数据量大,而在于通过数据的沉淀与应用产生价值,其价值升级来源于数据的流通和共享。,产业链:数据来源企业自有数据是主流数据源,数据的流通和共享将成趋势,注释:企业数据的数据类型主要可以分为四类,分别是基础类(LBS/设备等),信息类(搜索/浏览数据),交易类(网购/O2O),关系类(社交等)。来源:XX研究及绘制。,近年来,官方数据开放程度提高,行业联盟兴起,第三方数据服务蓬勃发展,各大企业(以互联网核心企业为主)也开始逐步开放群体画像数据,单一数据的跨界融合放大了其价值。但目前大数据应用的数据源仍以企业自有数据为主。整体来看,数据产生量爆炸式增长,可分析的数据维度越来越丰富。尚未形成完善统一的监管政策与行业规则,企业之间的数据孤岛情况仍然存在。数据交易方面,数据交易模式与数据资产定价标准有待建立,发展程度尚不成熟。XX分析认为,大数据行业的发展将在政策法规和行业自律的约束下,从探索期步入高速发展的成熟期;在市场客观需求的驱动下,数据的流通和共享将成为趋势。,1)发展现状2)主要困局3)前瞻视点,数据交易伴随着数据资源价值逐步得到认可,数据流通的需求不断上升,除企业直接合作外,数据交易市场开始出现,建立数据需求方与供给方之间成规模化的联系。而数据的开放需要多方助力,数据的流通与分享能够为大数据的价值提升赋能,尤其在经济价值和社会价值方面会有较大提升。Data Sources数据来源,行业数据 官方数据,包括国家统计局、工信部等及国家地理、水利、卫星、气象等部门发布的公开数据 行业联盟数据等,第三方数据 运营商数据 第三方机构数据 ,企业自有数据包括CRM、ERP数据等企业内部数据,以及投资并购企业的相关数据,外部企业数据主要通过企业合作、数据交易等方式获取,形式多样,来源广泛,数据准备包括数据采集、清洗、转换、集成等环节,从业务过程中提取多数据类型的数据信息,转化为便于计算和存储的形式。,存储管理包括数据存取、云存储等方面。数据量爆发式增长,数据存储由集中式向分布式发展,提高存取效率,同时易于扩展。,可视化以可读形式展现数据结果,在人与大数据系统间传递、交换信息。交互形式越发丰富,降低了大数据的使用门槛。,计算处理包括大数据查询分析计算、批处理计算、流式计算等多种计算需求。此外,云计算极大提升了对大数据的处理能力。,数据安全伴随着数据量的增加,数据安全的重要性越发凸显,既包括外来黑客攻击防护,也包括用户个人信息管理。,数据挖掘基于不同的数据类型和格式提出的数据挖掘算法能够更科学地呈现数据本身的特点,实现预测等更深入的分析需求。来源:XX研究及绘制。,产业链:数据管理(1/2)数据管理囊括从数据收集到应用的全过程,且外延仍在拓展数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,经历了人工管理、文件系统、数据库系统三个发展阶段。狭义的数据管理包括数据准备、存储管理、计算处理及数据安全等环节,伴随着非结构化数据的爆发式增长,对数据的处理和管控提出了更高的要求,因此将数据挖掘和可视化也纳入广义数据管理过程,以满足更深入的数据处理需要,在此过程中,数据管理的外延还将持续拓展。,来源:XX研究及绘制。,Data Management技术服务,数据挖掘和可视化成为行业热点,一方面,数据挖掘算法渐趋成熟,数据洞察深度提升,另一方面,可视化工具种类越来越多,应用需求的多样化催生了从场景衍生出来的定制化服务。技术方面,大数据的运作效率始终是行业发展的痛点之一,基础设施尚不完善。此外,在信息泄露事故频发的情况下,数据安全领域还有待进一步深耕,以应对越发丰富复杂的大数据应用场景。XX分析认为,云环境下的大数据存储和计算是未来数据管理的发展方向,大数据存储与计算效率将不断提高;数据管理整体将向更垂直、更贴合具体行业特征的方向发展。,1)发展现状2)主要困局3)前瞻视点,产业链:数据管理(2/2)数据挖掘与可视化成行业热点,数据管理向垂直行业分化大数据的数据管理环节,数据准备,存储管理,计算处理,数据安全,数据挖掘,可视化,产业链:数据分析文本、图像、语音分析相对成熟,视频分析存在探索空间,文本分析,图像分析,语音分析,视频分析,来源:XX研究及绘制。,技术 应用 技术 应用 技术 应用 技术 应用 关键词检索 舆情评估 图像识别 人脸建模 语音识别 语音听写 运动目标检索 活体检测 机器翻译 态度追踪 人脸识别 身份认证 语音理解 情绪洞察 目标路径追踪 交通监测 语义洞悉 口碑管理 相似图像对比 摄影测量 语音合成 人声模拟 侦察预警 场景布控Data Analysis分析处理,文本和图像的分析技术已相对成熟,可以达到较高精度,应用也相对落地。语音分析技术取得突破,可将非结构化的语音信息(语义、语调、语速、音量等)转换为结构化的索引,实现对海量音频文件的的知识挖掘和快速检索。而伴随着视频类应用的盛行和监控摄像头的普及,视频分析的需求也在逐年上涨。语音分析整体发展相对成熟,但在自然语言处理方面还存在难点;视频形成的多维非结构化数据的存储与挖掘技术仍不成熟,视频内容分析还存在优化空间。XX分析认为,视频分析和语音分析的需求将继续增大,在机器学习的基础上,未来将不断提高智能程度,进一步解放人工劳动,如应用于直播行业的内容监测工作。,1)发展现状2)主要困局3)前瞻视点,产业链:数据应用从独立数据产品向完整行业解决方案发展,定制化将成趋势解决方案,将基础设施和信息资源联合起来,结合政务、公安、旅游等领域的典型行业特征,共同为对应产业提供智慧解决方案。行业应用越来越多的行业开始探索利用大数据提升产业效能。互联网化程度较高的行业转变得更快,较早开始转型的领域积淀得更深。,来源:XX研究及绘制。,工具/产品化服务正逐步从通用型产品向更加场景化的方向拓展,应用层面也更加落地,尤以智能分析类软件的快速发展为代表。Data Application应用类型,大数据应用从独立的工具产品向完整的行业解决方案发展,相关产品和企业的数量大量增加,涉及领域越来越广。各行业的数字化发展程度并不均匀,行业智慧解决方案所涉及的各领域数据的关联程度和挖掘深度还有待继续加强。此外,各行各业的数据应用需求具有较大差别,难以通过一类或几类数据产品全面覆盖。XX分析认为,产业赋能方面,未来智慧城市领域的政企合作将进一步延伸;工具属性方面,具体的大数据产品/服务将向轻量级、定制化方向发展,满足多样的需求。,1)发展现状2)主要困局3)前瞻视点,2012 支持【国务院】支持海量数据存储、处理相关软件的研发和产业化,推进信息安全关键产品研发和产业化。,2013 推动【国务院】推动商业企业加快信息基础设施演进升级,增强信息产品供给能力,形成行业联盟,制定行业标准,构建大数据产业链,促进创新链与产业链有效嫁接。【工信部】定义个人信息范围,提出个人信息收集和使用规则、安全保障等要求。,造业结合,促进电子商务、工业互联网和互联网金融健康发展。【发改委】运用互联网与大数据的技术来创新监管的方式。【工信部】大数据产业将纳入“十三五”规划。【工信部】加快云计算与物联网、移动互联网、现代制造业的融合发展与创新应用,积极培育新业态、新产业,加快推进云计算与大数据标准体系建立。【国务院】运用大数据加强对市场主体服务和监管。【国务院】推动政府信息系统和公共数据互联共享,建立市场化应用机制,深化大数据在各行业的创新应用,强化信息安全保障,顺应潮流引导支持大数据产业发展。,国家对大数据产业的重视程度不断上升,从数据存储、软件研发到信息安全,从产业链、行业联盟到跨行业融合的新业态,不断完善宏观政策,推动数据互联共享和标准体系建立,引导支持大数据产业健康发展。一些地方政府也已开始着力发展大数据产业,自2013 年以来陆续出台了推进计划,强调研发及公共领域应用,促进相关政策法规的完善;重视通过大数据引领产业转型升级,与企业合作共建地区大数据生态;建立大数据基地,吸纳优秀企业落户扎根。伴随着宏观政策环境的逐步完善,我国大数据产业茁壮发展。来源:XX研究及绘制。,中国大数据产业发展宏观政策环境不断完善,大数据已上升为国家战略2012年-2015年中国大数据政策梳理2015 强化【国务院】推动移动互联网、云计算、大数据、物联网等与现代制,DT数据驱动Data TechnologyDT时代以服务大众、激发生产力为主。数据驱动业务,以数据流为中心,注重开放、透明、体验和分享,基于产业协同关系以及云计算等技术,通过数据整合打通数据链路,加快产业升级。,IT信息驱动Information TechnologyIT时代以自我控制、自我管理为主。信息技术驱动生产,以信息流为核心,通过传感技术、通信技术和计算机技术等实现占有、掌握、传输和控制。数据作为“附加产物”,碎片化严重。来源:XX研究及绘制。,“IT”智能驱动Intelligence Technology“IT”时代通过智能技术为产业智能提供解决方案、解放劳动力。智能驱动决策,在数据挖掘、机器学习、人工智能等技术逐渐成熟的基础上,赋能产业,改变人与场景的交互方式。,中国大数据产业发展从信息驱动向数据智能驱动进阶中国大数据产业的发展正在从信息技术驱动向数据驱动方向进阶,未来在数据挖掘、机器学习、人工智能等技术的基础上,还将以智能化的形式赋能各行各业。大数据趋势正从互联网向各个领域延展,各行各业的决策正在向“数据智能驱动”转变。中国大数据产业发展阶段的演变,来源:XX研究及绘制。,互联网大数据,传统行业,推动数字化进程提供行业经验,数据获取互联网形式更有利于与用户发生交互,能够采集到连续数据。数据处理互联网的形态更有利于海量数据的存储和分析。,中国大数据产业发展互联网基因有利于大数据的获取与处理大数据结合互联网行业的发展相较于其他行业而言,发展速度更快,应用更加落地。其优势在于:1)数据获取:互联网形式更有利于与用户发生交互,能够采集到连续数据;2)数据处理:互联网的形态更有利于海量数据的存储和分析,特别是将大数据与云计算的结合,改变了传统的高成本低效率的数据存取方式。在此基础上,互联网大数据能够结合大数据技术在金融、医疗等传统行业的发展经验,助力互联网+金融、互联网+医疗等互联网大数据的应用高效健康地发展。同时,互联网大数据各应用类型的高速发展,也推动了传统行业对数据资产的重视程度,加快了其数字化进程。中国互联网大数据的核心优势,84.0,115.9,中国大数据产业发展从互联网大数据向各领域延展根据中国信息通信研究所统计,2014年中国大数据市场规模约为84亿元,预计2015年中国大数据市场规模将达到115.9亿元,增速达38%,2016至2018年中国大数据市场规模还将维持40%左右的高速增长。2014 年-2015 年中国大数据市场规模,自2006年以来,我国出台多项规定,促进数据开放共享,引导大数据产业的,衡,部分传统行业的大数据技术与应用的渗透率还较低,仍有较大增长空间。,金融,互联网,物流,制造,医疗,交通,农业,能源,汽车,电信来源:XX研究及绘制。,2014 2015E中国大数据市场规模(亿元)来源:中国信息通信研究所2015年中国大数据发展调查报告,XX研究及绘制。2016.10 iResearch Inc 各行业的数字化进程并不均,增速38%,健康发展。从行业来看,互联网行业是大数据应用的领跑者,其次,大数据应用水平相对较高的主要是电信、金融等行业,而医疗、零售、交通、物流等传统行业也在大数据方面有所探索,并且已出现部分相对成熟的应用类型。企业大数据的应用情况相较于上一年度而言,整体呈增长态势。2016年中国大数据产业分布,中国互联网大数据产业发展已上市互联网企业:以BAT为首的数据驱动型媒体整体表现好,Top20席位中网络媒体占据半壁江山,企业市值Top3均为数据驱动型企业,640.4亿元663.8亿元,538.4亿元,943.6亿元1028.6亿元,广告营收总营收,广告营收总营收广告营收 174.7亿元总营收,注释:1.各企业广告营收统计标准以其财务报表中公布的广告营收数字为准,不考虑因税收和返点引起的统计口径差异;2. 阿里巴巴集团广告营收由财报及其他公开信息结合XX集团推算模型估算,淘宝广告营收为中国商业零售业务中的核心收入来源,其广告营收不包含佣金收入及其他店铺费用。来源:XX研究及绘制。,12966.1,12295.2,4251.0,2065.2,1537.2 1499.3,1091.0,796.1,591.7,509.3,475.4,459.9,423.3,414.2,409.7,268.9,256.6,252.3,228.3,224.3,阿里巴巴,腾讯,百度,京东,网易,携程,乐视,58同城,去哪儿 三七互娱科大讯飞昆仑万维网宿科技 唯品会 恺英网络,微博,汽车之家 人民网,搜房网,新浪,2016 年已上市互联网公司Top20 市值,市值(亿元),注释:统计时间节点为2015年12月31日收盘后企业市值,美元汇率统一按照6.5核算。来源:综合XX、招股说明书、公开新闻报道及专家访谈,根据XX统计模型核算,XX研究及绘制。2016.11 iResearch Inc,300.0,75.0,69.0,37.0,30.0,23.1,8.0,25.6,76.9,25.4,23.9,35.0,4.6,3.8,27.5,55.0,22.1,5.1,4.8,16.5,蚂蚁金服 小米科技 滴滴出行 陆金所,新美大 今日头条 大疆创新 菜鸟网络 借贷宝 众安保险 京东金融uber中国,魅族,链家网 乐视移动微众银行神州专车 饿了么 美图秀秀 乐视体育,2016 年未上市互联网估值Top20 企业增长指数,中国互联网大数据产业发展未上市互联网企业:数据驱动型企业成为领跑者,增长指数 =,2016年企业估值成立年份距2016年的年限,注释:统计范围为2013年1月1日至2016年7月15日间,获得过融资、主营业务在中国大陆,并在未来筹备独立上市的初创企业。不含已上市企业(包括新三板上市)。以2016年企业估值排名为序。来源:综合XX及专家访谈,根据XX统计模型核算,XX研究及绘制。,2016.11 iResearch Inc数据驱动型数据驱动型企业,通常自有完整大数据系统,以数据为支撑进行各环节分析决策,从而实现企业运营管理。相较于传统企业,数据驱动型企业在企业数据的时间纬度、颗粒度及覆盖度方面都趋于精细化,并通过与实际运营流程的结合,实现其数据价值。来源:XX研究及绘制。,企业估值Top3均为数据驱动型企业增长指数较高的均为数据驱动型企业,中国大数据产业现状分析中国网络媒体大数据产业分析中国网络媒体大数据企业分析中国网络媒体大数据的机遇与挑战,1234,2010年德国,启动“数字,德国2015”,战略,2015,2012,2013,2014,分布式计算系统,Storm;, IBM的沃森超级计算机每,秒可扫描并分析4TB数据,量,并在电视节目上击败,两名人类选手夺冠,来源:根据XX、XX整理。XX研究及绘制。,探索期(部分国家早期探索),宏观环境,技术积淀期(非结构化数据爆发),企业技术,应用探索期(并行计算与分布式系统形成),价值拓展期(人工智能、机器学习等兴起),发展期(上升到国家战略高度),爆发期(更多国家参与),海外数据驱动型网络媒体的大数据奠基企业技术探索先行,政策推动产业发展进程2003年-2015年海外网络媒体大数据政策及技术发展历程,2003,2005,2004年Google发布Map Reduce和Big Table2003年Google发布第一个大规模用分布式文件系统GFS,2009年Facebook推出数据仓库架构Hive;2009年Spark诞生于伯克利大学AMPLab,2006年Amazon推出企业云业务AWS2005年Yahoo发布Hadoop分布式计算系统,2009年美国政府开始开放政府数据,互联网巨头纷纷发布机器学习产品,IBMWatson 系统、微软小冰、苹果Siri等,标志着大数据进入人工智能、机器学习深层价值阶段,更多企业开始将大数据作为企业决策的重要支撑,但使用的数据仍以内部运营数据为主,美国政府发布大数据研究和发展倡议,并 美国白宫发布向大数据领域投 了2014年全球资2亿美元,是 “大数据”白大数据技术从商 英国政府宣布 皮书研究报业行为上升到国 注资1.89亿英 告;家科技战略的分 镑发展大数据 数据开放运动水岭 技术 已覆盖全球44,个国家,麦肯锡发布第一份大数据报告,定义“大数据”2009 2011,2010 年 Google推出大数 美国软件公司Google公开 据查询和存储工 Splunk在纳斯达交互分析引 具BigQuery; 克成功上市,是擎Dremel Twitter收购 第一家上市的大BackType,发布 数据处理公司,Twitter,Yahoo,Facebook,Google,海外数据驱动型网络媒体的大数据奠基自主研发与投资收购相结合,技术推动企业发展大数据已成海外网络媒体标配,其大数据发展历程与技术的迭代紧密相关,一方面,根据业务需求自主研发尖端技术,为数字化发展奠定基础;另一方面,通过投资或收购大数据技术相关公司,整合业务,提高整体效能。无论是大数据的存储形式还是运行机制的优化,都给产业带来了深远的影响。这对中国互联网媒体的大数据产业发展起到了示例作用。,19%,56%-3%28%,同比变化率,24.012.0,118.2,FacebookYahooTwitter,Google,2016H1 国外主要媒体营收情况414.1,总营收(亿美元)注释:Google总营收为Alphabet财报中谷歌业务收入。来源:根据XX、XX整理。XX研究及绘制。, 从2003年起,分别发布GFS、Map Reduce、BigTable、BigQuery及Dremel等先进技术产品。 投资或收购云商务公司Orbitera、图像识别技术公司Moodstacks、可穿戴设备技术公司Magic Leap、人工智能技术公司DeepMind等公司。, 以2004年Facebook创立为标志,社交网络的流行导致大量非结构化数据涌现,推动大数据发展进程,并推出Hive等先进技术产品。 投资或收购云管理公司SMS Assist、语音识别技术公司wit.ai、人工智能公司Vicarious等公司。 从2005年起,发布Hadoop等先进技术产品。 投资或收购移动数据分析公司Flurry、大数据服务公司Hortonworks、社交数据分析及挖掘服务商Ztelic等公司。, 从2011年起,发布Storm等先进技术产品。 投资或收购数字化营销服务公司TellApart 、人工智能公司Madbits、社交数据服务提供商Gnip 、数据分析公司BackType等公司。,中国数字信息量快速膨胀中国数字量在世界总数字量中的占比预计达到40%2015年底,全球网民数量达到31.7亿,中国网民数量为6.9亿,中国网民数量约占全球网民数量的22%。此外,2015年-2018年中国网络经济复合增长率为34%,其中,中国移动端的网络经济增速为55%,移动端对网络经济的整体贡献率达到74%,中国互联网发展的重点已向移动端转移。根据Zenith,2015年全球人均单日上网时长约为110分钟,其中,移动端的上网时长为86分钟;而根据XX网民行为监测系统iUserTracker以及移动网民行为监测系统mUserTracker的监测数据显示,2016年初,中国人均单日上网时长达到251分钟,其中,移动端的上网时长约为160分钟。在整体上网时长与移动端上网时长两个人均单日指标上,中国水平均为世界平均水平的两倍左右。根据以上信息推论,中国数字量在世界总数字量中的占比预计达到40%左右。2015年中国数字量与世界数字量对比推算,全球网民数量,31.7亿,中国网民数量,6.9亿,渗透率,22%,2倍时长倍数,中国数字量在世界总数字量中的占比预计达到,40%左右,全球人均单日上网时长中国人均单日上网时长全球人均单日移动端上网时长中国人均单日移动端上网时长,110分钟251分钟86分钟160分钟,6.2,6.5,17.5%12.3%5.13.62011,18.1%9.9%5.64.22012,19.0%9.6%6.25.02013,11.3%5.0%6.55.62014,11.3%6.1%6.92015,4.9%1.7%7.22016e,
展开阅读全文