资源描述
谨请参阅尾页重要声明及华泰证券股票和行业评级标准 1 证券研究报告 行业 研究 /专题研究 2019 年 09 月 15 日 计算机软硬件 增持(维持) 谢春生 执业证书编号: S0570519080006 研究员 xiechunshenghtsc 郭雅丽 执业证书编号: S0570515060003 研究员 010-56793965 guoyalihtsc 郭梁良 021-28972067 联系人 guolianglianghtsc 金兴 联系人 jinxinghtsc 1计算机软硬件 : 网络治理规定利好舆情监控行业 2019.09 2计算机软硬件 : 金融 IT:内因和外因带来的投资机会 2019.09 3计算机软硬件 : 趋势的落地和需求的分化 2019.09 资料来源: Wind 我们对“ Gauss 数据库”的理解 华为研究 系列报告之一 数据库 的重要性 &华为推出新一代 Gauss 数据库 数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与其进行数据交互。数据库的开发难度,不仅体现在与其他基础 器件 的适配,更在于如何实现对数据高效、稳定、持续的管理。 Oracle、微软的数据库之所以能长久不衰,一方面在于其强大的技术开发和产品升级迭代能力,另一方面在于其对数据库的 Knowhow 理解足够深,这个是其他厂商短期难以超越的。华为在数据库领域逐步取得新的突破。 2019 年华为推出了新一代的数据库产品 Gauss 数据库,该产品已经在金融、能源、政企等国内客户得到上线应用 。 华为 Gauss 数据库: AI 原生 &支持异构计算 华为在数据库领域已经有 12 年的开发经验,从早期的摸索到现在的产品逐步成熟,中间也是经历了很多历程。华为的数据库产品系列命名为:GaussDB,高斯数据库。华为 GaussDB 是一个企业级 AI-Native 分布式数据库。 GaussDB 采用 MPP(Massive Parallel Processing)架构,支持行存储与列存储,提供 PB(Petabyte, 2 的 50 次方字节 )级别数据量的处理能力。华为 Gauss数据库是全球首款 AI-Native数据库,能够同时支持 X86、 ARM、GPU、 NPU 等异构计算 。 华为 Gauss 数据库:三大产品线系列 GaussDB:三大产品线系列。目前华为已经开发有三个产品系列: GaussDB 100、 GaussDB 200、 GaussDB 300。 1) GaussDB 100:主要以 OLTP为主。目前该产品已经应用在招商银行。 2) GaussDB 200:以 OLAP 为主,兼顾 OATP。该产品目前已经在工商银行得到上线应用。 3) GaussDB 300: HTAP,是企业级分布式 HTAP 数据库( Hybrid Transaction and Analytical Process,混合事务和分析处理) 。 华为 Gauss 数据库:华为 IT 生态体系不可或缺 从生态体系来看, Oracle 数据库成为全球第一数据库的地位,也是经过了很多次版本的更新升级, 更 与上世纪 80 年代 开始的全球 IT 生态体系的逐步确立有关。 Oracle 数据库世界霸主地位,是随着 Windows 操作系统、 Intel X86 芯片一起建立的 PC 时代的 IT 底层生态而逐步确立的。而 AWS 数据库则是适应了互联网时代(云计算时代)新的计算场景对数据库的新需求,再加上自身的云生态体系,逐 步迎来了 客户使用的推广。从华为 Gauss 数据库来看,华为 IT 架构的底层生态已经逐步建立起来,包括芯片、操作系统、数据库等,这些在华为 IT 体系内部是高度耦合的 。 风险提示 : 数据库技术升级速度低于预期的风险,数据库产品应用推广 低于预期的风险 ,数据库应用场景拓展低于预期风险 。 (14)(1)12253818/09 18/11 19/01 19/03 19/05 19/07(%) 计算机软硬件 沪深 300 一年内行业 走势图 相关研究 行业 评级: 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 2 正文目录 华为数据库分析 . 4 华为 DB 开发历程 . 4 初识华为 GaussDB . 6 详解华为 GaussDB . 11 华为 GaussDB 200 . 11 华为 GaussDB 300 . 18 数据库产品对比分析 . 21 Oracle 数据库 . 21 AWS 数据库 . 25 华为 GaussDB:对比 . 28 总结 . 31 风险提示 . 31 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 3 图表目录 图表 1: 数据库的演进 . 4 图表 2: 华为 GaussDB 对 AI 技术的应用 . 5 图表 3: 华为 GaussDB 特点 . 6 图表 4: 华为 GaussDB 产品线 . 7 图表 5: OLTP&OLAP 对比 . 8 图表 6: 华为 GaussDB OLTP&OLAP 特点 . 9 图表 7: 华为 GaussDB HTAP 特点 . 10 图表 8: 数据库:行式存储 . 11 图表 9: 数据库:列式存储 . 12 图表 10: 数据库:行式 &列式存储对比 . 12 图表 11: 华为 GaussDB 200 架构 . 14 图表 12: 华为 GaussDB 200 软件构成 . 16 图表 13: 华为 GaussDB 特点 . 16 图表 14: 华为 GaussDB 200 架构 . 17 图表 15: 华为 GaussDB200 数据查询过程 . 18 图表 16: 华为 GaussDB 300 集群架构 . 20 图表 17: Oracle 数据库不断演进 . 21 图表 18: Oracle 数据库 18C 的升级 . 22 图表 19: Oracle 数据库 19C 的升级 . 22 图表 20: Oracle 数据库支持多种数据类型 . 23 图表 21: Oracle 的分布式数据库 . 24 图表 22: Oracle 数据库支持多种数据类型 . 25 图表 23: Amazon Aurora 典型客户 . 27 图表 24: Amazon DynamoDB 典型客户 . 28 图表 25: 华为 GaussDB 200 典型客户 . 29 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 4 华为数据库 分析 数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与其进行数据交互。 2008 年阿里提出“去 IOE”,而 10 年之后,我们现在来看,发现 Oracle 的数据库是最难替换的。不仅是因为 Oracle 的数据库沉淀了大量的企业客户数据,更是因为数据库产品开发难度确实比较大。数据库的开发难度不亚于操作系统,属于整个 IT 架构的基础软件(数据库软件在操作系统之上,我们可以将其称为类中间层的基础软件)。而且数据库的开发需要与底层计算架构高度相关和耦合,是适配 X86 架构,还是适配 ARM 架构等等。 当然以上这些都是数据库的与其他基础 器件 的适配,数据库难度更大的地方在于如何实现对数据高效、稳定、持续的管理。 Oracle、微软的数据库之所以能长久不衰,一方面在于其强大的技术开发和产品升级迭代能力,另一方面在于其对数据库的 Knowhow 理解足够深,这个是其他厂商短期难以超越的。 回到这篇文章的主题:华为数据库。华为在 IT 的底层架构,逐步搭建起自己的基础架构,建立华为生态。我们 这次把华为数据库进行讲解, 并对目前主流的数据库进行对比。只有对比,才能发现不同。 图表 1: 数据库的演进 资料来源:华为官网,华泰证券研究所 华为 DB 开发历程 华为对数据库的开发 经历 了长达 12 年左右的时间。 2007 年, 华为开始着手研发内存数据库,项目代号为 GMDB。这个项目的背景是,当时电信实施实时计费 , 电信行业对数据库有特殊的要求,有些需要定制化开发。而当时国外的数据库产品主要是标准化产品。 为了满足客户需求,华为当时开始研发内存数据库。 2010 年,华为开始从内存数据库向通用关系型数据库进行拓展,逐步将非内存数据库的功能融入到数据库产品中。 2012 年,华为数据库性能得到显著提升, GMDB 开始逐步商用化,主要应用于电信计费。同时,该产品也在华为内部的部分部门开始使用。 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 5 2013 年,华为 OLTP 数据库开始上线(后面我们 会详细介绍 OLTP 和 OLAP) 。 2014 年, 华为开发出第一个 OLAP 数据库版本 ( OLAP 我们可以简单理解为:是针对大量数据的分析型数据库) 。 2015 年, 华为与工商银行一起联合研发。 Gauss OLAP 数据库在工商银行上线 , 逐步替代海外的数据仓库。 2017 年,华为与招商银行一起联合开发 GaussDB。同时,华为启动面向事务和分析混合处理的数据库开发,即 HTAP。 2018 年,华为 Gauss OLTP 数据库(事务型数据库)开始在招商银行综合支付交易系统成功上线。 承接招商银行 “手机银行”和“掌上生活”两大 App 交易流水流量 。 2018 年, Gauss HTAP 数据库推出 ,并在民生银行得到应用。 从华为 Gauss 数据库产品演化至今来看, 1)华为数据库产品的研发是从内存数据库开始,逐步向通用关系型数据库延伸,这 与Oracle、 AWS 数据库开发的起点并不完全一样。 2)华为数据库 产品类型,包括了 OLTP、 OLAP,同时还研发出 HTAP 产品。我们认为,从产品应用角度来看,华为 OLAP(分析型数据库)大规模应用的时点更早 一些 。 Oracle的 OLTP(事务型数据库)在全球领域的竞争优势非常明显,这一领域的数据库产品比较难替代。 3) 华为的 OLTP 数据库是通过与大客户合作,特别是银行大客户合作 (工商银行、招商银行) ,来不断进行产品迭代和完善的。 我们认为, 这也是华为数据库能够快速成长的主要原因。 图表 2: 华为 GaussDB 对 AI 技术的应用 资料来源:华为官网,华泰证券研究所 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 6 初识华为 GaussDB 华为在数据库领域已经有 12 年的开发经验,从早期的摸索到现在的产品 逐步 成熟,中间也是经历了很多历程。 目前, 华为数据库 逐步建立起三大产品系列。 华为的数据库产品系列命名为: GaussDB,高斯数据库。高斯,是德国伟大的数学家,近代数学的寞基者之一,高斯 、 阿基米德、欧拉、牛顿 被世人 称为世界上最伟大 的四位 数学家。华为将自己的数据库命名为 Gauss 系列,也有 向 数学致敬的意味。 GaussDB: 开源数据库 。 华为的 Gauss 数据库是一个开源数据库,基于 PostgreSQL9.2开发。我们知道 PostgreSQL 本身就是一个开源数据库品牌。 现在除了 Oracle DB、微软的 SQL Server 等传统老牌数据产品 之外 ,目前新开发的数据库产品,开源数据库占比较大的部分。 包括我们看到的 AWS 的 Aurora 数据库、阿里的飞天数据库、华为的 Gauss数据库,以及数据库新进入者 MongoDB 等。 GaussDB:分布式 &AI 原生 。 华为 GaussDB 是一个企业级 AI-Native 分布式数据库。GaussDB 采用 MPP(Massive Parallel Processing)架构,支持行存储与列存储,提供PB(Petabyte, 2 的 50 次方字节 )级别数据量的处理能力。可以为超大规模数据管理提供高性价比的通用计算平台,也可用于支撑各类数据仓库系统、 BI(Business Intelligence)系统和决策支持系统,为上层应用的决策分析提供服务。华为 GaussDB 将 AI 能力植入到数据库内核的架构和算法中,为用户提供更高性能、更高可用、更多算力支持的分布式数据库。 图表 3: 华为 GaussDB 特点 资料来源:华为官网,华泰证券研究所 GaussDB:三大产品线系列 。 高斯数据库研发始于 2011 年。目前已经开发有三个产品系列: GaussDB 100、 GaussDB 200、 GaussDB 300。 GaussDB 100:主要以 OLTP 为主 。 GaussDB 100 研发开始于 2011 年,与后面的GaussDB 200/300 不同, GaussDB 100 并不是一个分布式数据库。 GaussDB 100 包括两条线,一条产品线是基于单机版开源数据库 PostgreSQL 研发的产品,另一条线是自研内核的 GaussDB 100 产品。后面这一条线是近几年华为研发的产品。目前该产品已经应用在招商银行。 GaussDB 100 主要是 OLTP,即事务型数据库。 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 7 GaussDB 200: 以 OLAP 为主,兼顾 OATP。华为 GaussDB 200 开始于 2012 年,在基于传统关系型数据库的 SQL 引擎和事务强一致性等基础上,进行了分布式、并行计算的改造。历时 6 年,打造了一款架构领先的分析型数据库,为各行业 PB 级海量数据分析提供有竞争力的解决方案。 GaussDB 200 既可以适用于 OLTP,也可以应用于 OLAP。 GaussDB 300: HTAP, OLTP 和 OLAP。 GaussDB 300 是一个分布式并行关系型数据库系统,是企业级分布式 HTAP 数据库( Hybrid Transaction and Analytical Process,混合事务和分析处理)。 GaussDB 300 架构上着重构筑传统数据库的企业级能力和互联网分布式数据库的高扩展和高可用能力,完全兼容 SQL 标准,提供百万级 TPMC 的交易处理能力和企业级可靠性。 GaussDB 200/300 都是基于开源数据库 PostgreSQL 研发,虽然是基于开源数据库,但已经对开源代码进行了大量修改,在很大程度上接近于自研。 GaussDB 200/300 既可以支持 OLTP 也可以支持 OLAP,也是华为投入精力最大、研发时 间最长的产品线。目前已经在工商银行和民生银行应用 。 图表 4: 华为 GaussDB 产品线 资料来源:华为官网,华泰证券研究所 在以上我们对华为 GaussDB 的介绍当中,提到了数据库领域比较重要的两个概念: OLTP和 OLAP。下面我们就介绍下这两个概念,以及其所对应的数据库类型。 华为 GaussDB 数据库包括:事务性( OLTP)数据库、分析型( OLAP)数据库和混合负载( HTAP)数据库。这里需要解释下 OLTP、 OLAP、 HTAP 之间的区别,这也是数据库最基本的内容。 数据库系统一般分为两种类型:一种是面向前台应用的,应用比较简单,但是重吞吐和高并发的 OLTP 类型;一种是重计算的,对大数据集进行统计分析的 OLAP 类型。 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 8 1) OLTP:联机事务处理 OLTP( on-line transaction processing) 它是事件驱动、面向应用的,比如电子商务网站的交易系统就是典型的 OLTP 系统。 OLTP的基本特点是: 数据在系统中产生; 基于交易的处理系统( Transcation-Based); 每次交易牵涉的数据量很小; 对响应时间要求非常高; 用户数量非常庞大,主要是操作人员; 数据库的各种操作主要基于索引进行。 2) OLAP:联机分析处理 OLAP( On-Line Analytical Processing) 是基于数据仓库的信息分析处理过程,是数据仓库的用户接口部分。 OLAP 系统是跨部门的、面向主题的,其基本特点是: 本身不产生数据,其基础数据来源于生产系统中的操作数据( OperationalData); 基于查询的分析系统; 复杂查询经常使用多表联结、全表扫描等,牵涉的数量往往十分庞大; 响应时间与具体查询有很大关系; 用户数量相对较小 ,其用户主要是业务人员与管理人员; 由于业务问题不固定,数据库的各种操作不能完全基于索引进行。 OLTP 是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。 OLAP 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 OLTP 系统强调数据库内存效率,强调内存各种指标的命令率,强调绑定变量,强调并发操作 。 OLAP 系统则强调数据分析,强调 SQL 执行市场,强调磁盘 I/O,强调分区等。 图表 5: OLTP&OLAP 对比 OLTP OLAP 用户 操作人员,低层管理人员 决策人员,高级管理人员 功能 日程操作处理 分析决策 DB 设计 面向应用 面向主题 数据 当前的,最新的,细节的,二维的,分离的 历史的,聚焦的,多维的,集成的,统一的 存取 读 /写数十条记录 读上百万条记录 工作单位 简单的事务 复杂的查询 用户数 上千个 上百万个 DB 大小 100MB-GB 100GB-TB 时间要求 具有实时性 对时间的要求不严格 主要应用 数据库 数据仓库 资料来源: 至顶网 ,华泰证券研究所 3) HTAP: 混合事务和分析处理 ( Hybrid Transaction and Analytical Process) , 既可以应用于事务型数据库场景,亦可以应用于分析型数据库场景。 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 9 GaussDB OLTP 数据库 ,业界首创 Switch Turbo 技术, AZ 内 TRO1 秒,满足金融场景下的数据库高可用诉求。 GaussDB OLAP 数据库 ,可以帮助客户实现 PB 级海量数据高效分析,目前已经广泛应用于金融、运营商、政府等行业。 图表 6: 华为 GaussDB OLTP&OLAP 特点 资料来源:华为官网,华泰证券研究所 GaussDB HTAP 数据库 ,多模引擎支持五种数据类型融合处理,包括流、图、空间、文本、结构化,可以解决集中式架构扩展性和性能瓶颈问题,同时分散风险,提升业务连续性。 行业 研究 /专题研究 | 2019 年 09 月 15 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 10 图表 7: 华为 GaussDB HTAP 特点 资料来源:华为官网,华泰证券研究所 华为 GaussDB 值得关注的点: 1、全球首款 AI-Native 数据库。 AI原生数据库 是 GaussDB的主要特点之一。 华为将 AI引擎内置到 GaussDB全系产品中,使其具备一定的自运维、自管理、自调优、故障自诊断和自愈的能力 。 华为 也 希望把在芯片、算法上面的优势,集中体现到数据库上来。 客观 来 讲 , 其实对于在数据库 中 植入 AI 技术, 并不是一个新鲜做法。 Oracle 在 几个 版本之前就 开始就植入了 AI 技术,开启了“ Autonomous”之旅。 2、异构计算支持 X86、 ARM、 GPU、 NPU。 这个也是 Gauss 数据库与其他数据库比较大的不同。 目前主流的数据库产品,包括OracleDB、 MySQL、 SQL Server 等,基本都是支持 X86 架构。 我们认为,华为数据库对于异构计算的支持,可能是 为 该数据库未来向更多计算场景的应用做准备。 我们知道,5G 带来计算场景的变革或将更大。
展开阅读全文