数据库行业深度报告:历史机遇,国产数据库市场迎来十倍空间.pdf

返回 相关 举报
数据库行业深度报告:历史机遇,国产数据库市场迎来十倍空间.pdf_第1页
第1页 / 共51页
数据库行业深度报告:历史机遇,国产数据库市场迎来十倍空间.pdf_第2页
第2页 / 共51页
数据库行业深度报告:历史机遇,国产数据库市场迎来十倍空间.pdf_第3页
第3页 / 共51页
数据库行业深度报告:历史机遇,国产数据库市场迎来十倍空间.pdf_第4页
第4页 / 共51页
数据库行业深度报告:历史机遇,国产数据库市场迎来十倍空间.pdf_第5页
第5页 / 共51页
亲,该文档总共51页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 1 Table_Summary 报告摘要 : 市场空间:数据库核心软件,国产替换带来十倍以上空间 数据库 作为三大基础软件,截至 2017年 我国市场规模约为 120.22亿元, 12-17年 复合增长率超过 17%。考虑未来我国数据量的持续增长和云部署方式的推广, IDC预计到 2024年,中国关系型数据库市场规模可达到 271亿元, 其中采用 公有 云部署的关系型 数据库市场规模可达到 178.21亿元。 考虑外部环境和信息安全因素, 数据库市场迎来国产替换历史机遇, 我们 预计替换将于 2020年起 从 政府、事业单位往行业推进。 我们 根据 政府机关、事业单位和国企人数 、数据库数量关系、 平均采购价格推算出政府机关、事业单位和国有企业的整体需求分别为 204亿、 290亿、 288亿, 假设至 2024年 完成替换 , 按 100%替换计算,则合计市场增量为 626亿;若按 50%替换计算,则新增空间 235亿 。 市场现状:国内厂商份额有所上升,但海外四巨头仍占一半以上市场 截 至 2019年,国外厂商 仍 占据我国数据库市场 80%以上份额 ,国内厂商市场份额 虽有所提升,但仍不是主题 。 1)整体市场份额:传统 关系型数据库中国产数据库市占率从 2009年的 4.2%提升至 2019年的 18.9%以上,海外四巨头仍占据 65%以上份额 ;2)部署方式: 云部署国内产商占优,传统部署仍是海外厂商优势范围。 传统部署方式的关系型数据库市场中,Oracle、 IBM、 Microsoft、 SAP四家厂商共占据市场份额超六成,其中 Oracle占据市场中近40%;云部署方式中阿里和腾讯市场份额居国内第一、第二; 3) 国产数据库 情况:国产 互联网与跨界 数据库 厂商 份额 增长迅速, 2019年 国内关系型 数据库 市场 中 华为、阿里巴巴分别占据 6.2%和 5.8%,位列第五、六名;传统数据库厂商份额有所下降,南大通用和人大金仓分别以 4.2%和 2.7%的市场份额排在第七、八位。 非关系型数据库、云数据库、内存式数据库和流数据库成为新方向 考虑当前数据量的爆发、云化趋势 、实时反应需求等,我们认为下述四种数据库将成为数据库行业的新方向、新动力: 1)非关系型数据库:在互联网背景下比关系型数据库有更好的表现; 2)云数据库:降低企业成本的同时为企业提供更加方便的云服务; 3)内存数据库:满足当今企业和用户对快速读取的需求, 4)流数据库:在内存数据库的基础上加强数据库的实时分析和流量监控能力。 投资建议 国产数据库迎来 10 倍替换空间的历史机遇, 建议关注 布局国产数据库 市场 的上市公司 科蓝软件、 中国软件 、太极股份 。 风险提示 信创采购力度不及预期 ;市场竞争程度加大 ;云数据库推广不及预期。 Table_ProfitDetail 盈 利预测与财务指标 代码 重点公司 现价 EPS PE 评级 8 月 7 日 2019A 2020E 2021E 2019A 2020E 2021E 002368 太极股份 33.56 0.81 0.85 1.16 47.90 39.70 28.83 - 300663 科蓝软件 33.16 0.16 0.24 0.38 155.59 139.66 87.13 - 600536 中国软件 116.50 0.13 0.73 1.27 573.39 160.35 91.52 - 资料来源: 公司公告、民生证券研究院 (上述公司盈利预测均来自于 wind 一致预期) Table_Invest 推荐 维持 评级 Table_QuotePic 行业 与沪深 300 走势比较 资料来源: Wind,民生证券研究院 Table_Author 分析师: 强超廷 执业证号: S0100519020001 电话: 021-60876718 邮箱: qiangchaotingmszq 研究助理 : 应瑛 执业证号: S0100119010012 电话: 021-60876718 邮箱: yingyingmszq Table_docReport 相关研究 Table_Title 计算机 行业研究 /深度报告 历史机遇,国产数据库市场迎来十倍空间 数据库行业 深度 报告 深度研究报告 /计算机 2020 年 8 月 10 日 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 2 Table_Page 深度 研究 /计算机 目录 一、数据库行业的基本情况 . 3 1.什么是数据库:负责数据存储、维护、获取的管理软件 . 3 2.数据库的分类:数据结构、使用需求与物理存储方式 . 3 3.数据库的用途:为各行业的业务处理和商业分析提供支持 . 7 4.数据库的性能:六个方面,一套标准 . 9 5.国内数据库市场现状:国产化持续推进,关系型数据库为主导 . 11 二、以史为鉴:行业与巨头发展史 . 14 1.数据库行业发展史:穿孔卡片、关系 数据库、非关系数据库到云数据库 . 14 2.ORACLE 发展历程:市场领导者是怎样诞生的? . 15 三、数据库行业的未来 . 19 1.数据库行业的发展方向:云数据库、非关系型 数据库、内存数据库与流数据库 . 19 2.国内数据库行业的未来:市场需求、国产替代与云化趋势 . 22 四、国内数据库基本情况 . 25 1.武汉达梦(中国软件) . 25 2.人大金仓(太极股份) . 27 3.东软集团 . 30 4.神舟通用(中国航天科技集团) . 31 5.南大通用 . 34 6.科蓝软件( SUNJE SOFT) . 37 7.华为数据库 . 39 8.阿里云数据库 . 40 9.柏睿数据库(威讯柏睿) . 44 插图目录 . 48 表格目录 . 49 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 3 Table_Page 深度 研究 /计算机 一、 数据库 行业 的 基本情况 1.什么是数据库 : 负责数据存储、维护、获取的管理软件 数据库是对数据存储、维护、获取进行统一管理和控制的系统 ,主要负责保证数据的安全性、完整性、多用户对数据的并发使用以及发生故障后的系统恢复。数据库和操作系统、中间件一起,是构成计算机设备的三大基础软件。 数据库行业 对应的 上游 是硬件设备供应商,包括存储器、服务器、计算机设备、网络设备等生产商;下游则是广泛运用数据库的各个行业,包括政府、军队、医疗、教育、金融、能源等。 图 1:数据库产业链 资料来源: 智研咨询 ,民生证券研究院 2.数据库的 分类 :数据结构、使用需求与物理存储方式 数据库 常见的分类 标 准 为 使用 需求 、数据结构和物理存储方式。 依据数据结构可以分为关系型数据库和非关系数据库, 依据使用 需求可以分为事务型数据库和分析型数据库, 依据物理存储方式可以分为内存型数据库和磁盘型数据库。 图 2:数据库 类型 资料来源:民生证券研究院 整理 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 4 Table_Page 深度 研究 /计算机 图 3:常见数据库 品牌 资料来源:民生证券研究院 整理 数据库基于数据存储结构的差异可以分类为关系型数据库( SQL)和非关系数据库( Not only SQL, NoSQL)。 关系型数据库是指采用关系模型来组织数据的数据库,以行和列组成二维表的形式存储数据,由二维表及其各表之间的联系组成数据库。 关 系型数据库优点是: 通用的 SQL 语言使得操作关系型数据库非常方便 ; 丰富的完整性 (实体完整性、参照完整性和用户定义的完整性 )大大减低了数据冗余和数据不一致的概率 ; 二维表结构 易于用户理解。关系型数据库同样存在问题:面对 用户并发性非常高 的情况,磁盘读写速度跟不上;在包含海量数据的二维表中查询,效率低下;关系数据库中的二维 表 只能 存储格式化的数据结构 。 图 4:关系型数据库数据结构 资料来源 : 民生证券研究院 整理 非关系数据库一般采用分布式架构,数据之间保持独立不存在关系,使得 数据库具有易拓展性和高速读写能力 。非关系数据库可以通过增加节点 解决关系型数据库扩展不宜、迁移难的问题。此外,由于分布式结构,允许系统在节点对数据处理,面对海量数据时依旧能保持高速的读写能力。但是非关系数据库同样存在不足:只适合存储一些较为简单的数据,对于需要进行较复杂查询的数据,关系型数据库更为合适。 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 5 Table_Page 深度 研究 /计算机 表 1: 关系数据库与非关系数据库对比 区别 关系型数据库( SQL) 非关系性数据库( NoSQL) 存储方式 以行和 列构成二维表格。表格之间存在联系,方便查询。 数据大块组合在一起,存储在数据集中。 存储结构 结构化存储。跟据预先定义好的结构存入数据。数据表的可靠性和稳定性高,但修改困难。 动态存储。无需预定义数据模式,允许数据类型和结构的变化。 存储扩展 纵向扩展,由于多表查询机制的限制,扩展能力受限于计算机性能。 横向扩展,数据之间不存在耦合性,易于扩展。 查询方式 使用结构化查询语言( SQL),使用预定义优化方式(比如列索引定义 )帮助加速查询操作。 使用非结构化查询语言 (UQL),采用更简单而精确的数据访问模式。 事务性 遵从原子性、一致性、隔离性和持久性 (ACID) 规则: 原子性 :事务完全执行或根本不执行。 一致性 :事务提交之后,数据必须符合数据库架构。 隔离性 :并发事务彼此分开执行。 持久性 :能够从意外系统故障或断电情 况中恢复到上一个已知状态。 满足基本可用、软状态、最终一致性( BASE)规则: 基本可用:出现不可预知故障的时候,允许损失部分可用性。 软状态:允许系统在不同节点的数据副本之间进行数据同步的过程存在延时。 最终一致性:所有的数据副本,在经过一段时间的同步之后,最终都能够达到一个一致的状态。 读写能力 为了维护数据的一致性,在面对高并发读写时效率非常低。 允许数据在同步时不同节点存在差异,提升读写性能。 代表 MySQL、 Microsoft SQL Server、 Oracle、PostgreDB, IBM DB2, MariaDB Redis、 Amazon DynamoDB、 Neo 4j、 Mongo DB、 Greenplum、 Cassandra、 Datastax、 InfluxDB 资料来源 : AWS 官网, 民生证券研究院 非关系型数据库, 是 区别于关系数据库 的其余数据库的统称 , 其中 同样存在差别。 常见的非关系数据库有五种:键值数据库、文件数据库、图形数据库、时间序列数据库、列式数据库。不同的数据存储模式 使得他们相比关系数据库在不同领域具有优势 。键值数据库运用于网络购物、网页 访问等方面;文档型数据库 广泛用于移动端和网站内容管理系统 ;图形数据库 常用于反诈骗、实时分析、存取管理、网络与 IT 运营;时间序列数据库多用于 IOT 设备和传感器;列式数据库广泛存在于商业智能和数据仓库领域。 表 2: 非关系数据库类型 非关系数据库类型 数据模型 优点 代表 键值数据库 Key 指向 Value 的键值对,通常用哈希值来实现 查找速度快 Redis 文档数据库 以 json 或 xml 形式存储数据,采用分层树状结构 数据结构要求不严格,表结构可变,无需预定义结构 MongoDB 图形数据库 图结构 利用图结构相关算法。 Neo4j 时间序列数据库 按照时间顺序排列数据 适合 IOT 设备的数据存储 InfluxDB 列式数据库 以列簇式 存储,将同一列数据存储在一起 查找速度快,可扩展性强,更容易进行分布式扩展 Cassandra 资料来源 : William Blair, 民生证券研究院 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 6 Table_Page 深度 研究 /计算机 图 5:常见非关系型数据库结构 资料来源 : William Blair, 民生证券研究院 根据 使用 需求 ,数据库又可以分为事务型数据库和分析型数据库。 事务型数据库主要用于业务支撑,负责联机事务处理( OLTP),以日常事务以及查询(处理少量数据)为主,响应时间短。分析型数据库主要用于历史数据分析,负责联机分析处理( OLAP),作为公司的单独数据存储,负责利用历史数据对公司各块业务进行统计分析、处理的数据量大、实时性要求不高。 表 3: 事务型数据库与分析型数据库对比 区别 事务型数据库 分析型数据库 用户 操作人员,低级管理人员 决策人员,高级管理人员 功能 日常操作处理 分析决策 数据内容 业务处理的动态情况 业务处理的静态情况 数据结构 当前的,最新的,细节的,二维分立的 历史的,聚集的,多维的,集成的,统一的 存取 读写数十条记录 读写上百万记录 时间要求 实时响应要求高 时间要求不严格 代表 MySQL, Oracle, IBM DB2, SAP HANA, PpstgreDB, Mongo DB, Neo4j Oracle Exadata, Teradata, IBM DashDB, Google BigQuery 资料来源 : 民生证券研究院 整理 数据物理存储方式的差异 ,又可以把数据库分为磁盘数据库和内存数据库。 磁盘数据库是指数据存储于磁盘中,是数据库常见的存储方式。数据库需要频繁地访问磁盘来进行数据的操作,由于对磁盘读写数据的操作一方面要进行磁头的机械移动,另一方面受到系统调用的影响,当数据量很大,操作频繁且复杂时,读写速度无法满足实时性需求。内存数据库数据处理速度比传统数据库的数据处理速度要快很多,一般都在 10 倍以上。此外,内存数据库存取时间易于预测,可以定制数据存取方式,满足特殊情况下对数据的实时性需求。 表 4: 内存数据库与磁盘数据库对比 区别 内存数据库 磁盘数据库 物理储存 内存 磁盘 存取时间 纳秒级 毫秒级 储存方式 不需要连续存放 连续存放 缓冲管理 不需要 需要 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 7 Table_Page 深度 研究 /计算机 并发控制 大粒度锁 细粒度锁、死锁检测 查询优化 基于处理器和 Cache 代价 基于 I/O 的代价 数据量 TB 级 GB 级 代表 Oracle TimesTen, Mongo DB, Redis Oracle, Microsoft SQL Server, MySQL 资料来源:民生证券研究院 整理 3.数据库的用途 :为各行业的业务处理和商业分析提供支持 数据库在各行各业得到广泛运用。 数据库 在信息系统中用于存储、管理数据,为 业务处理 、数据挖掘、商业分析 、 提供数据 支持。随着企业数字化与智能化转型需求的上升 , 越来越多的企业采集与经营、市场相关的数据以便做出 精准有效 的决策。 由此带来的数据爆发式增长让 这些 企业正视数据存储、管理与安全。处于信息技术核心的数据库,在金融、政务、教育、电信、医疗健康、电力、公安、企业等一系列领域得到广泛运用,为各领域的运营和决策提供支持。 表 5: 数据库运用领域及方向 领域 运用方向 金融 票据电子化、信用管理、市场交易 政务 电子政务、安全生产监管、社保平台 教育 教育云、电子阅卷、电子监考 电信 综合网管、资费结算 医疗健康 健康云、电子病历、护理管理、药品流通 电力 电网调度、电网监控 公安 电子警务、安全审计、智慧监狱 企业 财务管理、商业智能、质量合规化、库存管理 资料来源:民生证券研究院 整理 图 6:2015-2017 年国内数据库主要应用领域市场规模 ( 亿元 ) 资料来源 :智研咨询, 民生证券研究院 数据库为数据中台 的 数据管理 和数据分析提供支持。 数据中台主要提供全量数据的实时在线服务,同时提供对海量数据进行采集、计算、存储、加工以及基于全量数据的 数据发掘 。随着业务的复杂化以及互联网、移动业务带来的海量数据的增长,数据在治理、挖掘等方面的重要性凸显,因此数据中台就成为了现在金融等大型企业关注的业务重点 。数据库 帮助用户在管理全量数据的同时对外提供在线查询与分析能力,构建完整的数据中台,实现数据的全生命周期管理 。 比如在金融领域,数据库支持下的数据中台 帮助银行客户在柜台、网银、手机银9.9913.0614.8510.767.17 8.79 6.065.04 5.04 4.711.6715.4217.7512.488.5210.657.41 6.08 6.085.4813.7518.2420.7614.6110.0412.788.94 7.47 7.476.450510152025政府采购 装备 消费品 原材料 能源 金融 交通 教育 医疗 其他2015年 2016年 2017年本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 8 Table_Page 深度 研究 /计算机 行上随时随地查询开户以来所有数据记录。同时,多类型的全生命周期数据,帮助银行更好的针对数据进行价值挖掘和建模,为风控、营销和人工智能等业务提供了数据支持。 图 7:银行数据中台 结构 资料来源 :巨杉数据库, 民生证券研究院 数据库在大数据中心同样发挥作用 , 涵盖 数据采集、数据管理、数据服务、数据应用 四个阶段。 数据采集 是指 实现基础数据、行业数据、产业数据等相关基础数据和业务数据的采集,主要通过数据采集工具按照标准进行转换、抽取 ; 数据管理 是指 数据库 实现数据整合、数据源管理、资源目录管理、数据质量管理、数据资源管理 ; 数据服务是 数据库 对清洗处理过的数据进行集中服务管理,对外提供报表服务等通用数据服务 ; 数据应用主要是 数据库 按照业务类别、业务单位的功能需求对数据进行组织、展现和利用,为主要业务应用提供数 据支撑。 图 8:大数据中心中数据库架构 资料来源 : 达梦 数据库, 民生证券研究院 将使用需求和数据结构结合,可以组成四种数据库类型,满足不同使用场景。 四种数据库拥有各自的优缺点,并 根据 使用场景和用户需求在不同领域服务。 关系型 +事务型数据库 在传统业务如 CRM 系统、 ERP 系统和信用卡交易等仍占据主流 ; 关系型 +分析型数据库 则多 用于商业智能、数据分析 ; 非关系型 +事务型数据库 在网页和移动端有很大市场份额 ; 非关系型 +分析型数据库 在海量数据索引与预测分析有优势 。 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 9 Table_Page 深度 研究 /计算机 表 6: 四种数据库运用场景、优劣势和主流产品 类型 运用场景 优缺点 代表产品 关系 +事务 ERP, CRM,信用卡交易,电子商务以及其他需要数据记录的情况 优点:数据一致性;便于数据计算与分析 缺点:需要专业维护人员;响应 时间长 Oracle, SQL Server,DB2, SAP Hana,MySQL, PostgreSQL 关系 +分析 数据仓库,商业分析,数据分析 优点:数据一致性;便于数据计算与分析 缺点:需要专业维护人员;数据响应以分钟为单位 Oracle Exadata, Teradata,IBM DashDB, Google BigQuery 非关系 +事务 网页及移动端; IOT 设备 优点:方便使用;横向扩展(可以容纳海量数据);搭建成本低;无预定义数据模式 缺点:查询功能受限;生态不成熟。 MongoDB, Document DB, DataStax, Neo4j 非关系 +分析 预测分析,反诈骗,海量数据索引 优点:易于分批处理;易于海量文件处理;搭建成本低 缺点:不易于数据快速查询和更新;响应时间长。 Cloudera, Hortonworks,MapR, MarkLogic,Snowflake 资料来源:民生证券研究院 整理 图 9:四种数据库对应的主流产品 资料来源 : William Blair, 民生证券研究院 4.数据库的 性能 :六个方面,一套标准 数据库的性能指标聚焦于 6 个方面:吞吐量、负载均衡、读写速度、分区分片、并发性和可用性。 不同类型的数据库由于使用场景的差异,在性能和功能上有不同的偏重 ,在这六个指标方面同样会有所差异。常见的具体指标有平均每秒响应速度、查询速度、平均每秒吞吐量等。 表 7: 数据库性能指标和要求 指标 要求 吞吐量 满足高并发下的大数据量交互需求,满足数据备份或 ETL 过程的大数据量迁移 负载均衡 满足高并发下数据库的负载均衡能力,衡量数据库的部署架构、负载均衡策略 读写速度 单位时间内系统能处理的随机读写的请求数量 分区分片(分库分表) 数据库对于数据的垂直切换和水平分库的能力 并发性 单台数据库的 API 接口压力和能满足的并发能力 可用性 高可用性综合涉及到数据的多项能力,主要应用的是集群技术, HA 容错及互备技术,体现系统无故障运行的能力 资料来源:民生证券研究院 整理 本公司具备证券投资咨询业务资格, 请务必阅读最后一页免责声明 证券研究报告 10 Table_Page 深度 研究 /计算机 TPC 是国际上最流行和广泛接受的数据库性能标准测试。 TPC(事务处理性能委员会 )是由十几家会员公司创建的非盈利组织,总部设在美国。 TPC 的成员主要是计算机软硬件厂家,主要功能是制定商务应用基准程序的标准规范、性能和价格度量,并管理测试结果的发布。针对不同类型数据库之间的区别, TPC 颁布了对于数据库在线事务处理 (OLTP)能力测试的基准程序 TPC-C 和 在线分析处理 (OLAP)能力测试的基准程序 TPC-DS。 TPC-C 测试中的 tpmC 值( TPC-C 测试过程的吞吐量,按有效 TPC-C 配置期间每分钟处理的平均交易次数测量),在国内外被广泛用于衡量 数据库 系统的事务处理能力。 根据 TPC-C 最新排名,蚂蚁金服自研的OceanBase 数据库 tpmC 值达到 707,351,007, 成功超越之前的记录, 击败 Oracle 和 IBM 的数据库,登顶榜首。 图 10:TPC 委员会成员 资料来源 : TPC 官网, 民生证券研究院 图 11:TPC-C 数据库性能最新排名 资料来源 : TPC 官网, 民生证券研究院
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642