资源描述
京东云 备份和容灾技术白皮书 构建让客户安心的系统 2019-11-27 I 目录 1 京东云介绍 . 1 1.1 京东云概况 . 1 1.2 京东云主要优势 . 1 2 技术概述 . 2 2.1 备份和容灾技术发展概况 . 2 2.2 京东云数据备份技术 . 4 2.3 京东云系统容灾技术 . 5 2.4 平台工具和服务 . 7 2.5 安全保障 . 8 3 数据备份解决方案 . 9 3.1 适用场景 . 9 3.2 技术架构 . 9 3.3 技术方案 . 10 网络架构 . 10 产品数据备份与恢复 . 11 主要指标 . 13 4 系统容灾解决方案 . 14 4.1 适用场景 . 14 4.2 技术架构 . 15 4.3 技术方案 . 16 网络架构 . 16 数据级容灾 . 17 应用级容灾 . 17 云产品容灾支持 . 18 主要指标 . 19 5 典型场景和行业解决方案 . 20 5.1 多级容灾解决方案 . 20 周级容灾 . 20 天级容灾 . 20 小时级容灾 . 21 分钟级容灾 . 22 秒级容灾 . 24 5.2 行业解决方案 . 25 金融行业 . 25 II 政务行业 . 26 电商行业 . 27 教育、医疗及其它行业 . 28 6 总结 . 28 7 引用 . 29 1 1 京东云 介绍 1.1 京东云 概况 京东云 (JD Cloud)是京东集团旗下的全平台云计算综合服务提供商,拥有全球领先的云计算技术和丰富的云计算解决方案经验。为用户提供从 IaaS、 PaaS到SaaS 的全栈式服务 (Full Stack),从 IDC 业务、云计算业务到综合业务的全频道服务 (Full Spectrum),以及包含公有云、私有云、混合云、专有云在内的全场景服务 (Full Services)和跨行业的全生态云服务 (Full Ecosystem)。同时, 京东云 依托京东集团在云计算、大数据、物联网和移动互联网应用等多方面的长期业务实践和技术积淀,形成了从基础平台搭建、业务咨询规划,到业务平台建设及运营等全产业链的云生态格局,为用户提供一站式全方位的云计算解决方案。 当前 京东云 具有可信云服务认证、支付卡行业数据安全标准认证( PCI DSS)、ISO27001 信息安全管理体系国际认证、 ISO9001 质量管理体系认证、信息系统等保三级安全认证、 CSA STAR云安全认证、 CSTAR云计算安全评估认证等数十项资质认证。 1.2 京东云 主要优势 京东云 经过多年的发展,在不断的技术积累与创新下,形成了如下五大优势: 高端的技术人才队伍 京东云 基于京东集团近 20 年的互联网技术积累,组建了一支成熟稳定的以高端技术人才为核心主力的人才队伍。在一批云计算行业领军人物的带领下, 京东云 技术人才队伍不断拼搏创新,实现业界领先的技术实力和服务能力。 完善的基础设施 京东云 在覆盖全国的 4个地域建设了多个设施先进、功能完善的 IDC。地域多层次 立体式场景 支持丰富的云计算产品高端的 技术人才 队伍优质 的服务体系完善的基础设施2 之间通过超高带宽的骨干网络连接,形成巨大的网络数据传输优势。基于稳定可靠的基础设施, 京东云 以一流的技术和运维能力向用户提供安全、专业、稳定、便捷的云计算服务。 丰富的云计算产品 经过多年的努力,基于 京东云 对整个行业的深入理解,当前公有云已经为全社会贡献出 种类繁多的 产品和服务。 京东云 通过人工智能、大数据和物联网等行业领先的高技术产品,为用户业务的快速发展助力赋能。 多层次立体式场景支持 京东云 通过功能丰富的标准产品提供 IaaS、 PaaS、 SaaS等全栈式云计算服务,能够很好的支持公有云、私有云、混合云、专有云等多种场景,能够对外提供 IDC业务、云计算业务、综合业务等全频段业务服务,还能够针对用户需求提供快速的定制化开发,充分满足用户对云计算的全方位需求。 优质的服务体系 京东云 基于用户服务和通用技术服务等基础服务,以促进用户成功为理念,建立了金牌服务、优质架构服务、应急服务、迁移服务、系统优化服务等高技术价值服务,形成了基础稳固、技术先进、用户满意的层次化服务体系, 客 户服务更加专注、贴心,技术保障更加有力。 2 技术 概述 当前, IT信息系统已经渗透到各 行各业的业务建设之中。用户业务系统的稳定 可靠 运行是用户业务发展的重要基础 。 京东云 通过不断技术积累 ,并且通过 搭建 可靠的基础设施 平台 ,为用户提供数据备份和系统容灾技术保障,成为行业中最值得信赖的云计算厂商。 2.1 备份和容灾技术发展 概况 备份和容灾技术 起源于 人类 的 技术发展,在各种工程、系统建设过程中都有广泛应用 。 中国古代 著名 水利 工程都江堰通过 分水鱼嘴和宝瓶口 等结构的 联合运用 ,实现了抗洪容灾的功能。 由于 IT 信息系统在不受保护的情况下非常脆弱,比如断电 即刻 导致 系统 瘫痪 ,故 IT 信息系统是备份和容灾技术的重要应用领域 。 对于政府、组织和企业用户,一旦 重要 IT 信息系统停摆,业务体系将受到巨大冲击。 据 University of Minnesota 的研究,当发生重大数据丢失事故后,半数以上的公司会在两三年内3 倒闭。 因此, IT 信息系统的备份和容灾技术应用,越来越重要,也越来越被重视,国家和行业标准中 规定了 明确的技术要求。 备份和容灾 在 IT 信息系统中主要 指 数据备份和系统容灾两项技术。 数据备份技术是系统容灾技术的重要支撑,但数据备份技术也可以单独在系统中实施。最早在数据备份和系统容灾技术上有重大突破的是美国 。早在 40 年前 SunGard公司就在美国的费城建成了数据备份和系统容灾中心, 用于保护金融业务系统。 当今, 京东云 紧跟数据备份和系统容灾技术发展 的 前沿,将既符合中国国情又遵循业界实践经验的完整数据备份和系统容灾解决方案贡献给用户。 京东云 重视每一个用户的业务长期稳定发展,将通过易用的工具、成熟的方案和可靠的服务提供最符合用户期望和利益的业务连续性保护。 系统故障原因主要有外部因素和内部因素,根据不同的类型可以分为异常 事件 、事故 事件 和灾难 事件 等三个级别。 异常事件是导致系统按照偏离设计的模式运行的 系统内部原因 ,通常会在 某些条件下触发 并导致系统出现问题。 事故事件是导致系统出现较严重问题的内部或外部原因。灾难事件是 超出系统建设和维护人员控制能力 并 导致系统出现大范围严重问题的外部原因。 基于业界的长期经验积累,通常异常事件、事故事件和灾难事件发生的概率逐 级 减小,但造成的损失和需要防止其造成持续损失所需要投入的成本逐 级 增大。 如 上 图所示,根据 京东云 多年的项目建设和维护经验,故障原因的类型、事件发生的概率和系统保护所需建设和维护成本的关系为一个 分段 图 。 为了保护系统最基本的 可靠 运行,需要投入不低于最低成本线的成本。为了实现 更好 的系统保护,需要投入 更 高 的成本。每提升一个系统的保护级别,都会产生成本的跃升。在 能够 抵抗同等规模故障的系统中,根据技术选型的不同会产生不同的建设和运维成本,不同的技术方案也同时对系统的稳定性、安全性和性能等关键指标要素产生影响。 0一段时间内故障发生概率1建设运维成本大规模灾难性故障大规模一般故障中规模故障小 规模故障单 实例故障最高成本线最低成本线同 一容灾能力最高成本线同 一容灾能力最低成本线图示说明:4 2.2 京东云 数据备份技术 数据备份技术 的 核心是将生产环境 中 的在线数据通过技术方法备份到离线环境。 当系统发生 问题,则技术人员能够基于备份数据将数据恢复到理想的状态。备份数据并不用于业务生产,但保留 关键 版本的备份数据对业务系统的长期有效运行具有非常重要的意义。 京东云 在向用户提供丰富的云资源产品的同时,深刻总结数据备份领域的技术经验,对用户开放技术能力,并进行数据备份技术赋能。 根据业务场景和备份环境的不同, 京东云 提供两种主要的数据备份方式 : 一是 支持在云平台上建立数据备 份环境并将用户的业务系统核心数据安全可靠地备份到云平台上。二是 支持将数据通过 网络专线 或 VPN的方式备份到用户自有的数据中心。 京东云 支持 京东云 平台或用户自建数据中心 的数据库、文件、对象存储备份。通过 网络专线 或 VPN 在用户的业务生产环境和数据备份环境之间搭建安全可靠的网络数据传输通道。 若用户的业务生产环境和数据备份环境都搭建在 京东云 公有云上,则 能够在业务生产环境和数据备份环境之间搭建高带宽网络通道,实现数据安全高速传输 。 京东云 通过 部署数据备份服务或数据备份工具, 使 数据备份过程简单高效 。 并 提供强大的资源监控工具, 当 系统出现问题,技术人员能够及时准确了解情况,并进行快速稳妥处理。 在平台支持方面, 京东云 支持用户将数据备份到 京东云 公有云、私有云、专有云和混合云平台上。还支持用户将数据备份到用户自有 IDC 中或第三方公有云上 , 为用户 带来极大方便,提供让用户满意的数据备份解决方案。 在数据备份技术方面, 京东云 支持 数据库的迁移和复制、对象存储中数据的迁移和复制、文件系统中的文件迁移 , 并支持数据传输加密保护。 利用云平台提数据库复制备份快速恢复业务生产环境互联网O S S 迁移文件复制数据库 迁移O S S 备份传输加密数据 备份 管理平台公有云专有云私有云混合云自有 I D C数据 备份 环境第三 方 公有 云数据 备份资源数据备份服务代理专线 / V P N云硬盘快照前端服务器后端服务器数据库硬盘O S S 文件虚拟服务器物理服务器虚拟服务器云主机物理服务器云主机公网负载均衡内网负载均衡资源监控数据库备份 多副本机制5 供的快照功能,用户能够快速将数据恢复到所需的版本。 京东云 也提供完善的资源监控系统,使用户能够完全掌握数据备份过程中 系统 的运行情况,并在发生异常时发出报警提示。 2.3 京东云 系统容灾技术 系统容灾技术的核心是当 信息 系统遭遇灾难 并导致严重故障 时能够 保护 客户 数据安全 和 保持关键核心 业务稳定。 能够造成系统严重故障的 灾难 一般有 地震、水灾、 火灾 、军事 袭击 、不当市政施工 等 ,这些灾难在社会运行过程 中均有一定发生的概率,因此 在 关键系统 设计和建设时 采取系统容灾技术进行有效保护非常重要。 京东云 支持对系统的 数据 级 容灾和应用 级 容灾。 数据级容灾支持 对 客户 的数据进行 备份、 同步 复制 或异步复制,维护 客户 数据安全 ,确保严重故障发生时关键数据可用和可恢复 。 应用级容灾支持 建立与业务生产环境相匹配的备份系统,保证故障发生时 及时将业务流量 切换到备份环境, 使业务系统持续对外提供服务 。 京东云 能够 根据 客户 系统容灾需求 并基于系统架构 制定 有效 的容灾方案 。通过丰富多样的系统容灾方案支持, 提供多种系统容灾能力, 满足 客户 的系统容灾需求。 冷备 : 支持数据的定期备份,并利用未运行的系统作为生产系统的备份环境,当大范围系统故障发生时启动备份系统支撑业务系统运行 。 温备 : 支持数据的定期备份或周期性同步,利用周期性运行的系统作为生未 运行的系统冷备双 / 多 活温 备周期性运行的系统持续运行的系统热备最小化运行的系统互联网系统容灾服务系统容灾环境前端服务器后端服务器数据库硬盘O S S 文件虚拟服务器物理服务器虚拟服务器云主机物理服务器云主机公网负载均衡内网负载均衡业务生产环境6 产系统的备份环境,备份环境中的系统定期开启并进行必要的系统同步操作。 热备 : 支持数据的定期备份或数据复制,在 容灾环境 建立 最小化运行 的热备份系统,当大范围系统故障发生时容灾环境接替原生产环境提供服务,并根据业务情况扩展资源。 双 /多活 : 支持数据的同步复制,建立两个或多个相互隔离的 业务生产环境 ,并保持各个业务生产环境的数据一致性 。 利用 京东云 底层资源的容灾能力 , 支持多种系统容灾 架构 ,充分满足不同行业 客户 的实际业务需求 。 跨故障域容灾 : 京东云 提供故障域支持,实现了在同一可用区内相互 独立的供电、网络设施等 基础设施建设。 跨可用区容灾 /双活 : 利用 京东云 的负载均衡技术, 客户 能够便捷地实现跨可用区系统容灾 ,或实现两个可用区内双活系统架构 。 京东云 在同一地域内的可用区之间相隔数十千米,采用相互独立的双路供电系统,能够满足大多数 客户 的容灾架构需求。 两地三中心架构容灾 : 通过在不同的地域搭建业务系统,使系统获得极大的抗灾能力。 异地 多活架构容灾 : 在多个可用区和多个地域建立同时运行的业务生产系统,在提升系统大范围抗灾能力的同时,能够保障系统最佳的灾后恢复速度。 不同的容灾系统架构对应不同的系统容灾能力和灾难发生后的系统恢复效地域 X业务生产/ 容灾环境地域 Y数据同步业务生产/ 容灾环境两地三中心架构容灾 异地多 活架构容灾跨故障域备份业务 生产环境机架 A系统 容 灾 环境机架 B跨故障 域容灾可用区 K地域 Y系统容灾环境可用区 A 可用区 B跨 可用区切换业务生产环境 系统容灾环境地域 X跨 可用区容 灾 / 双活业务生产环境地域 X可用区 A跨地域 切换 负载均衡跨故障域切换数据复制业务生产环境可用 区 A 可用 区 B 可用 区 A 可用 区 B业务生产环境可用区 B数据复制数据复制数据同步数据同步数据复制业务生产环境业务生产环境业务生产环境7 率,同时也会产生不同的系统建设和维护成本。 京东云 支持 客户 根据行业标准和实际需求选择最适合的容灾架构。 2.4 平台工具和服务 京东云 提供 专业 的 JD Cloud Mesh 数据备份和系统容灾工具集 ,如下图所示 ,全面 支持 客户 快速 便捷实现 数据备份和系统容灾。支持 数据库迁移 、 OSS(对象存储) 迁移 、 文件迁移,同时支持 OSS 复制和数据库复制。 支持 传输加密 功能,为数据 传输 提供 可靠 的安全保障。 支持 主机迁移、 数据 级容灾、 应用 级容灾 ,能够 全面 提升 客户 系统的抗灾能力,并实现快速的灾后恢复 。 支持对业务系统和容灾系统进行全方位的资源可视化监控,能够及时发现故障并进行有效的预警。 在 JD Cloud Mesh 基础之上 , 京东云 为 客户 提供多层次平台服务,主要包括备份和容灾系统建设和运维中的 基础云服务、网络 支撑、存储支撑 。 基础云服务 。 京东云 根据安全 性 、数据规模 、资源扩展性 等 客户 需求, 提供公有云、私有云、专有云、混合云 等多种可选的 备份容灾环境 ,通过专业的技术服务帮助 客户 高效合理的构建云计算环境下的业务系统和备份容灾系统,并提供可靠的 后期 技术保障 支持 。 网络支撑 。 京东云 通过 支持 VPN、 网络专线 、负载均衡、 DNS 等 多种网络技术,帮助 客户 在建设备份和容灾系统时获得可靠的网络技术保障,确保数据传输的安全和灾后数据流量切换的及时有效 。 存储 支撑 。 京东云 通过支持 多种 RDS(关系 型云 数据库服务) 、海量对象存储 OSS 和大容量高性能云硬盘,为 客户 提供可靠的数据备份环境,并基于多副本机制确保 客户 数据不会丢失 。 基础云 服务私有云公有云 混合云专 有云网络支撑存储支撑R DS O S S 云 硬盘V P N 专线 负载均衡 D NS系统容灾数据备份主机迁移 应用级容 灾数据级容 灾J D C l o u d M e s h数据 备份和 系统容灾工具数据库迁移 O S S 迁移文件迁移 O S S 复制 传输加密数据库复制
展开阅读全文