2021-2022数据中心网络自动驾驶指数报告.pdf

返回 相关 举报
2021-2022数据中心网络自动驾驶指数报告.pdf_第1页
第1页 / 共30页
2021-2022数据中心网络自动驾驶指数报告.pdf_第2页
第2页 / 共30页
2021-2022数据中心网络自动驾驶指数报告.pdf_第3页
第3页 / 共30页
2021-2022数据中心网络自动驾驶指数报告.pdf_第4页
第4页 / 共30页
2021-2022数据中心网络自动驾驶指数报告.pdf_第5页
第5页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2021-2022数据中心网络自动驾驶指数报告 目录 执行摘要 .4 情况概述 .4 为什么组织需要一个 数据中心网络自动驾驶 .4 当今数据中心网络挑战 .2 敏捷的障碍 .3 数据中心网络自动驾驶 指数报告 .4 数据中心网络自动驾驶 指数报告 .5 前进之路:实现 数据中心网络自动驾驶 的道路 .6 数据中心网络自动化现状 .8 数据中心网络自动驾驶 调研结果 .8 数据中心组网挑战 .8 数据中心网络挑战 .9 对无损、低时延的融合 IP数据与存储网络表示浓厚兴趣 .9 数据中心网络自动化:现状和计划 . 14 数据中心网络自动化等级 . 17 数据中心网络自动化:企业在网络自动化进程中最迫切的需求和寻找方向 . 19 数据中心网络自动化的主要障碍 . 21 完全自治的数据中心网络是一个共同的目标吗? . 22 如何开始、利用和提升自动驾驶级别 . 23 评估技术需求 . 23 评估技能集 . 23 考虑组织结构和运作模式 . 23 借助可信的供应商和第三方的协助 . 23 华为数据中心网络自动驾驶解决方案 . 24 数据仓库 . 25 平台开放性 . 25 广泛的网络智能 . 25 关于 IDC. 27 表 表 1: 数据中心网络自动驾驶 指数 报告 . 5 表 2: 数据中心网络自动驾驶 指数 报告 的前三个自动化级别到整个网络生命周期的需求 的映射 . 7 图形 图 1:数据中心网络挑战 . 9 图 2:对无损、低时延、高性能的融合 IP数据和存储网络的兴趣(按行业分列) .10 图 3:对无损、低延迟和高性能的融合 IP数据和存储网络的兴趣(按数据中心数量划分) .11 图 4:在 12-24个月 内 部署无损、低时延、高性能的 融合 IP数据和存储网络 的可能性(按行业划 分) .12 图 5:在 12-24个月内部署无损、低延迟、高性能的融合 IP数据和存储网络的可能性(按数据中 心数量 划分 ) . 13 图 6:部署无损、低时延、高性能的 融合 IP数据和存储网络 面临的障碍 .14 图 7: DC网络自动化部署和智能运维现状 .15 图 8:数据中心网络自动化 规划 (按数据中心数量) .16 图 9:数据中心网络自动化 规划 (按行业) .17 图 10:数据中心网络自动化 等级 (按行业) .18 图 11:网络生命周期中最重要的网络自动化领域 (按行业划分) . 19 图 12:数据中心网络自动化驱动程序 .20 图 13:数据中心网络自动化障碍 .21 图 14:三分之二的受访者将 数据中心网络自动驾驶 作为 1-2年的 目标 .22 图 15:华为 数据中心网络自动驾驶 L3自治系统 Huawei CloudFabric . 24 白皮书 数据中心网络自动驾驶 指数 报告 发起 单位:华为技术有限公司 Brad Casemore 2020年 10月 执行摘要 在本文档中, IDC推出 了 数据中心网络自动驾驶 指数 ,用以帮助 企业评估数据中心 的 网络自动化水平 , 并 帮助企业 在 网络的生命周期中 制定 一个 计划 , 逐步 部署和运维 完全自治的 数据中心网络。 IDC还评估了 在 推动 企业数据中心网络现代化和全面自动化 过程中 的挑 战 。 文中 针对全球各行 业企业的 调研展示其推动 数据中心 网络 自动化的驱动因素 ,当 前 利用数据中心网络自动化方面所处的位置 , 以及 他们对 数据中心网络 自动驾驶愿景的认同程度等 。最后, IDC提供了 一些 指导 建议 企业如何 推进并 逐步实现全面自动化 , 无论 当前数据中心网络自动化水平如何。 情况 综 述 为什么组织需要一个 数据中心网络自动驾驶 数据中心网络 从一开始 就存在, 它 向用户提供应用程序和数据所需的连接和带宽。 然而 网络 为了 满足应 用环境不断变化的需求 , 一直 处于 被迫适应和演进 的角色 。 今天,数据中心网络 正处于一个 关键 的 转折点。 为了 能够更好地 满足 新应用 的 需求和业务目标 , 网络必 须在架构和 运营 上进行调整 。 数据中心网络 正 面临前所未有的压力,不仅 需 要 实现 可 扩展 性 和 高性能, 还 要 通过 在 网络 的 生命周期 内实现 广泛的 自动化来获得更 高 的敏捷性和灵活性 , 主要包括网络的 开通 和 部署 , 故障 的 排除和补救 , 以及诸如 补丁 、 升级 、 持续的变更管理和优化 等 日常 网络 管理。 在云时代,传统的网络设计、发放、部署和运营方式已经无法 满足要求 。应用程序是当今组织的生命 线,网络提供了支持和交付这些应用程序的数字神经系统。问题在于,随着应用架构和开发方法变得更 加敏捷,传统的数据中心网络已经 无法满足需求 。 幸运的是, IT变革和 AIOps的兴起 能够帮助 企业重新评估网络架构和运营模式, 以 一种更现代 化 的方法 来满足应 用程序的需求, 实现 业务敏捷性, 同时 更加 灵活 和 更具成本效益 ( 包括资本支出和运营支 出 ) 。 企业 正在逐渐 认识到数据中心网络自动化的价值,包括作为 它能够 增强业务韧性和连续性 。 但 企业所 需 要的不仅是自动化脚本 、 配置自动化工具 等碎片化的 方法 和手段 , 它们更 需要一 种 综合 的智能网络自动 化方法, 该方法可 提供灵活的架构 作为 基础 以及优化的运营便捷性 , 从而让 网络运维 能够将网络作为一 个统一、认知、和自动 化 实体,而不是一个需要繁琐的手动管理的不同设备的集合。 尽管 SDN是向前迈 出 的重要一步,但其 更多的是 基于策略的管理和 开通流程 的自动化 。 正是基于此, 自动驾驶 的数据中心 网络开始 兴起, 它 提供智能意图转换、智能自动化规划和设计、完全自动化的部署和验证、智能自动化 的故障排除和补救 ,以及 自动化的变更管理和优化, 从而 有效 实现 网络自动化 闭环 。 当今数据中心网络 的 挑战 随着数字化转型、云运营模式、云原生应用架构的出现,企业数据中心网络面临诸多挑战。 一个 重 要问题是 , 数据中心网络需要与计算和存储等其他数据中心基础架构的自动化保持一致。网络运 营商 和 管理者 在努力 避免让网络 成为运营 敏捷性和 实现 商业速度的 阻碍因素 , 他们为此 感 受 到 了 焦虑和 压力。 与此同时,许多组织 也 试图对其数据中心网络架构实施重大变革, 并且 往往与汇聚和整合其 IP数据和存 储网络以 降低 运营 费用 ( OPEX) 和资本支出 ( CAPEX) 相关 。许多企业目前拥有独立的光纤通道存储区 域网络( SAN)和以太网数据中心网络。 很多 客户,特别是那些运行 HPC或高计算密集型 AI应用的客 户,也可能拥有 InfiniBand网络。 因为有急迫的需求和充足 的资源, 大型互联网公司 已设法在单一以太网 或者 IP数据中心网络中运行所有 应用程序和工作负载,以满足无损和高性能的需求 。 但对于大多数 企业来说,情况并非如此。与 大型互 联网公司 不同, 一般 企业往往缺乏资源和内部专业知识,无法通过单一以太网 或者 IP数据中心网络聚合 所有工作负载和应用程序,无法满足无损、高性能和极低延迟的需求。因此,他们在 多个 数据中心采购 和维护多个网络, 这就推高了 运营 费用 和资本支出 。 一个 融合、智能的数据中心网络 显然会让这些企业受益 ,该网络可以满足无损存储工作负载以及 HPC和 AI对 低延迟 的严格 要求。 因为是 合并采购和 有 持续管理 的 单一网络,这种网络将节 省大量资本支出和运 营费用。当然,这样的网络 在性能上绝不能逊色 , 它必须不仅能够支持所有必需的工作负载和用例,能 够提供在云时代日益增长的弹性伸缩能力。 除了需要汇聚和整合数据中心网络之外,还需要实现网络和 NetOps的敏捷性,需要支持 DevOps实践、 CI/CD工作流以及其他类似云的运营模式和流程。 传统的数据中心 网络已经与所支持的应用和服务分离,网络规划和部署速度太慢,无法满足 应用和开发 者的需求。随着虚拟化、云计算、容器的快速发展,企业 IT业务正在发生前所未有的变化,不仅给计算 和存储基础设施带来了变化,对数据中心网络的需求也发生了深刻的变化。 虽然开发人员和 DevOps团队已经转向 CI/CD流程 等 敏捷方法来加速开发流程, 但 因为 现有的 基础 设施 发 展缓慢,其工作效果 受到限制。资源请求需要快速响应和快速周转,但网络基础设施 部署 存在滞后。繁 琐的 部署 过程消耗了 过 多的时间,开发人员步履蹒跚,限制了处于数字业务前沿的应用程序。 最终结果 是 制约 了业务敏捷性,网络 因而 成为不受欢迎的罪魁祸首。 云的兴起 加剧了 问题 的 严重 性 ,云不仅 是 工作负载的目的地, 也 代表了运行模式和一系列相关技术。云 模式及 流程已经成为数字化转型的关键手段,开发者和 DevOps团队 通过云 来 实现 敏捷 性 、灵活 性 和 速 度。 然而,在数据中心中, 网络一直是 实现 敏捷性的阻碍因素 ,长期 以来 以硬件为中心的、面向 CLI的离散网 元 部署 、配置和手动管理方法 削弱了 敏捷性 。在许多方面,网络本身仍然是一个由人工流程所 定义 的孤 岛, 配置起来既复杂又 耗时, 并且 容易出现配置错误 。这 导致网络和依赖这些流程的应用程序瘫痪。 IDC估计,由网络中断引起的企业 宕机 通常 平均成本为每小时 25万 美元。这个数字适用于所有行业、 不 同规模和地域的 组织。但是,根据组织的不同, 宕机 时间的实际成本可能会有很大差异。例如,大型金 融机构, 因 交易量很大 宕机 时间损失可能以每小时数百万美元计。一个 处于 “平均 ”水平的 组织在经历相 对短的 8小时 宕机 后, 其 损失大约 在 200万美元。同样,这些中断经常 源自于 手动 网络错误配置或配置 漂移 未被检查。 与此同时, 应用程序也 也 在经历变革。大多数企业运行的应用程序种类比以往任何时候都多,包括传统 的单体应用程序和以容器和微服务为特征的较新的现代工作负载。数据中心必须支持多种工作负载和应 用基础架构,包括裸金属、虚拟机和容器。 敏捷的障碍 上述 所有这些挑战都 造成了 网络的复杂性,成为 实现 敏捷运维的主要障碍。现在,网络生命周期的每个 阶段都充满了复杂性,从规划设计 、 部署配置, 到 故障排除和补救 ,最后到变更管理和网络优化。仅仅 在故障排除和补救方面,网络运维者 通常必须依赖过时的工具和操作流程, 这 往往使 他们 很难在 重大服 务中断之前 发现和修复问题 。由于缺 乏协调和整合,零碎 的工具和手 动 操作往往本身就造成了问题。此 外, 那些零散且难以满足目的的 工具集合, 也致使 网络管理和可视性 难以令人满意 。 数据中心网络的另一个制约因素是企业运维团队之间的技能差距和专业知识不足。 我们很难去责怪 网络 运维者 , 他们 已经在多 条战线上应对快速 变化,不堪重负, 他们 不得不学习新的网络拓扑和架构 、 自动 化 、和可编程 能力( API) 。他们的工作也像 云 模式一样 在完成所有责任内 工作 的同时,还 要随时 救火 。 因此 ,网络供应商必须帮助他们的客户,即运营者 ,为他们提供架构、基础设施和平台, 帮他们 应对 这些多重挑战。 最后,随着 这些年来 网络 的 增长和扩展, 越来越 需要 基础架构 能够管理 异构网络 的 一致 性。 这些基础架 构源于不同供应商并承担 不同 职能 。网络运维团队 正在 寻找方法 弱化挑战 , 通过工具让 复杂 的 事情变得 简单 。 网络自动化是解决这些挑战的答案 。 但是,正如前面所说,这种自动化必须是 易用 的、易于规模实施、 易于管理和维护的。 企业还需要一个框架 体系 来清楚地了解自己在数据中心网络自动化历程中所处的位 置 , 以及如何以 数据中心网络自动驾驶 为代表逐步达到顶峰。 数据中心网络自动驾驶 指数 报告 为了 帮助 组织 评估 网络 的 自动化程度, IDC联合华为 撰写了此份 数据中心网络 自动驾驶 指数 报告 。该 报 告 将数据中心网络自动化的复杂程度归类到网络生命周期的每个阶段。 要实现网络完全的自动驾驶,必 然是一个长期的过程,不可能一蹴而就 。 但 这是完全可以实现的, 切合实际 的规划 可以 确保组织能够制 定适合其需要和资源的路线。 该指数 报告 定义 自动化 等级 ,从无自动化开始,逐级上升到综合自动化: Level 0 在整个网络生命周期中, 所有操作和维护全部通过 人工 执行 ,没有自动化。 Level 1 整个网络生命周期 中, 以人工操作和维护为主,通过 CLI对网络设备进行一些工具 辅助分析和决策。 Level 2 部分 场景部分 自动化,虽然标准工具为策略定义和分析提供信息,但决策和执行仍由 人工完成。 Level 3 限定 条件自动化,系统提供建议,由人工执行。 Level 4 网络具有广泛的自动化和高度自治性,在闭环的基础上动态实施声明性(基于意图的) 策略, 尽管运维者 经常收到基于事件的告警并决定是否接受和允许自动建议 。 Level 5 网络在整个生命周期中完全自动化 ,并且能够自动驾驶,能够应用策略、故障排除和 补救事件。运维者 相信,网络能够正常运行, 并 适应几乎所有已知场景。 表 1列出了所有级别。 表 1 数据中心网络自动驾驶 指数 报告 资料来源: IDC与华为, 2020年 前进之路:实现 数据中心网络自动驾驶 的道路 理想情况下, 数据中心网络 自动驾驶 应在整个网络生命周期内提供全面的智能 化和 自动化。如果未能完成 这一良性循环(或关闭自动化循环) ,只 算 取得 部分成功。这意味着 数据中心网络 自动驾驶 应解决以下问 题: Day 0(规划建设): Day 0规划建设包括两个阶段, 规划设计, 其次是部署开通。 规划设计阶段主要涉及基于业务需求洞察的产品选择和网络规划参数,即 LLD和 HLD,包括 意图 分析、洞察分析、网络规划、规划仿真、网络设计、设计仿真等。 Day 1(业务部署): Day 1业务部署场景是指完成 Day 0流程后,将客户服务意图下发到设备的过程。 Day 1流程 包括意图翻译、网络设计、 仿真 决策、网络配置、 SLA配置、业务验证等。 Day 2(运维 监控 ): Day 2运维监控场景是指在 Day 1业务部署后,对业务意图进行监控,确保网络和业务按预期 运行。监控流程包括意图翻译、监控与可视化、潜在风险排查、异常识别、问题定界、故障 定位与隔离、故障修复、 仿真 决策、业务恢复(恢复)和业务验证 等 。 Day N(网络变更和优化): Day N变更优化包括网络变更和参数优化。 网络变更是指基于意图的网络变更的评估、实施和验证,包括意图评估、变更方案、 仿真 决 策、变更实施、验证测试、异常回退、参数优化等。 表 2描述了 数据中心网络自动驾驶 索引中的前三个自动化级别如何映射到整个网络生命周期(从 Day 0到 Day N)的需求。 表 2 基于 网络生命周期需求的匹配 , 数据中心网络 自动驾驶指数前三个 等级 衡量标准 生命周期 Level 1 Level 2 Level 3 Day 0 意图翻译 洞察分析 网络规划 规划仿真 网络设计 设计仿真 人工评估输出洞察分析指标和规划参数 人工 获取历史数据, 人工 分析 线下规划评审 无 基于离线工具的 人工 设计 无 人工评估输出洞察分析指标和规划参数 自动获取历史数据或自动预测 离线规划 离线仿真验证 基于线下工具的半自动化设计( 人工 定义策略和规则) 离线仿真验证 系统生成洞察分析指标和规划参数,人工校验 自动获取历史数据,自动预测 在线规划,数字化应用 在线仿真验证 在线半自动设计,数字化应用 在线仿真验证,辅助决策 安装调测 数据准备 网络配置 SLA配置 软件调测 拨测验证 手 动 +离线硬件调测工具 人工 准备数据 人工 批量配置 人工 批量配置 人工 执行 手动拨测 人工 +离线硬件调测工具 网络参数数据自动生成 联网设备自动检测和网络参数设置 SLA保障策略配置自动下发 自动调测,手动调用 手动拨测 人工 +离线硬件调测工具 网络参数和 SLA保障策略数据自动准备 联网设备自动检测,提供网络参数设置 SLA保障策略配置自动发放 自动调试、基于异常或异常的预警、手动更正 自动验证和验收报告 Day 1 意图翻译 网络设计 仿真判决 网络配置 SLA配置 业务验证 运营人员通过工单 人工 录入服务参数(网络意图) 工具 辅助 、工具化的资源查询和分配 无 工具辅助 工具辅助 人工验证 运营人员 通过 portal选择业务参数(网络 /业务意图) 工具 辅助 、工具化的资源查询和分配 无 网络参数配置自动下发 SLA参数自动下发 人工验证 运营人员通过 Portal选择服务,自动生成参数(网络 /服务意图) 自动查询、分配资源,制定解决方案 仿真验证和辅助决策 网络参数配置自动下发 SLA参数自动下发 自动验证业务,生成业务发放报告 Day 2 意图翻译 可视化监控 隐患排查 异常识别 问题定界 问题定位 解决方案 仿真判决 业务恢复 业务验证 根据运营商经验和知识配置监控规则 固定系统监控视图 人工 检查 告警、性能、日志可视化,工具辅助识别 手动 和离线工具辅助定界 手动 和离线工具辅助故障定位 根据专家经验提供修复建议 无 人工修复 人工 +工具拨测 根据预置模板自动转换监控规则 固定视图 +局部自定义视图 基于操作员知识、离线工具、 What if故障模拟、自动巡检等,预测潜在问题 告警压缩关联,动态基线异常识别 可视化定界工具 可视化定位工具 提供 修复 建议 无 人工修复 人工 +工具拨测 监控规则自动转换 场景化自定义视图 worst-case仿真 异常自动识别 故障自动定界 部分故障自动根因分析,人工确认 自动生成具体的 修复 解决方案 仿真验证和辅助决策 部分业务自动恢复 自动验证业务,生成维修报告 Day N 意图评估 变更方案 仿真判决 变更实施 验证测试 异常回滚 基于 SLA/时间窗人工评估, 人工 输出变更约束 人工 变更 专家评审 工具辅助 网络快照手动比对 手动回退 基于 SLA/时间窗等人工评估,自动输出变更约束 人工 变更 专家评审、线下验证 离线生成 网络快照自动比对 手动回退 基于 SLA/时间窗自动评估,变更约束自动输出 在线、自动生成 更改 在线仿真验证,辅助决策 自动实施更改 业务自动测试,异常自动发现 手动触发自动回退 意图翻译 劣化预测 异常识别 环境监控 问题定界 问题定位 优化方案 仿真判决 调整参数 业务验证 根据运营商知识 人工 翻译策略 离线工具辅助预测 固定规则监控异常 人工 检查 工具辅助定界 工具辅助故障定位 人工 制定方案 人工决策 工具辅助参数调整 人工 +工具拨测 策略根据预置模板自动翻译 运营商知识 +在线工具 动态基线监控异常 人工 检查 可视化分析定界工具 可视化分析定位工具 人工 制定方案 人工决策 工具辅助参数调整 人工 +工具拨测 自动调用策略进行意图转换 运营商体验 +在线工具 自动准确识别异常 环境自动监控 故障自动定界 自动故障定位分析,人工确认 AI与自动化方案 仿真辅助决策 参数自动调整 业务自动验证,生成优化报告 资料来源: IDC与华为, 2020年 数据中心网络自动化现状 当前 网络生命周期阶段,大多数组织 尚未 采用 或 实施完全自 动 的数据中心网络。许多组织刚刚开始网络自动化之 旅。有些组织还在使用 人工 流程和 CLI进行网络配置和管理,有些组织则使用 Ansible、 Puppet、 Chef、 Salt、 Terraform等自动化配置管理工具。还有一些组织采用了 SDN,利用控制器、应用策略或网络虚拟化 ( overlay) 。 对于 Day 2和 Day N场景,一些企业已经使用了各种网络分析工具, 但是 很难关联和集成可操作的数据,以便及时解 决问题和持续 进行 优化。 数据中心网络自动驾驶 调研结果 接下来的部分将介绍一项全球调查的结果,该调查生动地说明了各个行业的企业在数据中心网络自动化的现状。 IDC代表华为 对 全球多个主要行业进行了 数据中心网络 自动驾驶状况 调查。 调查的目的是了解当前企业数据中心网 络面临的挑战、企业数据中心网络的 自动驾驶 进展 ,以及企业受访者是否计划实施 数据中心网络 自动驾驶 。 数据中心组网挑战 在调查的 初始阶段 , IDC要求受访企业找出他们数据中心网络 面临的 最大挑战。 所有 受访企业列举的挑战 中 排名第 一的是 “与计算和存储自动化保持同步 ”, 所占 比例为 41%。 这表明网络运营者 对网络能否与数据中心基础设施的其 他方面保持同步感到焦虑。 其次为 “灵活性” , 包括对混合工作负载和环境的支持, 所占 比例接近 40%。 并列第三 的 是“管理多厂商网络基础设施”和“敏捷”(包括对云架构和应用的支持),后者的反应与受访企业关于数据中 心存在云原生容器的说法非常吻合。 排名第五的 “使能 AI的网络智能 ”, 比例几乎相同(近 33%),这表明受访者将 这一挑战视为他们能够快速提高运营效率和有效性的应对措施。 其他上榜的相关挑战是 简单性(易于管理)、可伸 缩性以及技能差距 /专业知识(见图 1)。 图 1 数据中心网络挑战 问:在您的数据中心网络方面,您的组织面临的最大挑战是什么? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 对无损、低时延的融合 IP数据与存储网络 表示 浓厚兴趣 IDC还问 询 了被访者对 一个无损、低延迟、高性能的 融合 IP数据和存储网络的兴趣。 结果 如图 2和图 3所 示,金融 /银行和媒体 /娱乐 /游戏以及拥有三个或三个以上数据中心的受访者 对此融合网络 的兴趣最高。 图 2 无损、低时延、高性能的 融合 IP数据 和 存储网络(按行业) 问:贵组织对拥有一个无损、低延迟 、 高性能的融合 IP数据和存储网络的兴趣有多大? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 图 3 无损、低时延、高性能的 融合 IP数据 和 存储网络(按数据中心数量) 问:贵组织对拥有一个无损、低延迟 、 高性能的融合 IP数据和存储网络的兴趣有多大? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 “未来 1224个月,企业部署无损、低时延、高性能的融合 IP数据和存储网络的可能性有多大。 ”超过 55%的金融 /银行 行业 受访者 和 近 46%的媒体 /娱乐 /游戏 行业 受访者 表示他们可能或极有可能部署此类融合 IP数据和存储网络。按数据 中心数量划分 的受访者 , 其回答 并没有 很大差异 大约 50%只有一个 数据中心 的 受访者 表示他们很可能或极有可能 在 12-24个月内部署,而有 2个数据中心的 受访者 有 46%,有 3个 或以上 数据中心的受访者有 43%。总体而言,在 12-24 个月内部署融合数据和存储网络的可能性很大(见图 4和图 5)。 图 4 12-24个月 内 部署无损、低时延、高性能的 融合 IP数据 和 存储网络的可能性(按行 业) 问:贵公司在未来 12-24个月内部署无损、低延迟、高性能的融合 IP数据和存储网络的可能性有多大? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 图 5 12-24个月部署无损、低时延、高性能的 IP数据 和 存储融合网络的可能性(按数据中 心数量) 问:贵公司在未来 12-24个月内部署无损、低延迟、高性能的融合 IP数据和存储网络的可能性有多大? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 IDC还要求 受访者 识别 “在您组织中部署无损、低时延、高性能的融合 IP数据和存储网络存在哪些障 碍 ”。超过 43%的受访者表示担心以太网 /IP网络能否提供无损性, 38%的受访者表示相信其他协议 如 FC 和 IB更适合存储 组网, 约 35%的 受访者 表示 ,与融合网络相关的操作复杂性 是 一个 障碍, 约 29%的 受访 者 表示 障碍是 “存储管理员采购和管理存储网络 ”。相反,超过 20%的人 认为没有 障碍(见图 6)。 图 6 部署无损、低时延、高性能的 融合 IP与存储融合网络面临的障碍 问:在您的组织中,部署无损、低延迟和高性能的融合 IP数据和存储网络有哪些障碍? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 数据中心网络自动化: 现状 和计划 接下来 的问题具体涉及网络管理和自动化。首先, IDC要求 受访 者评估其数据中心网络自动化部署和智 能运维的现状。约 48%的 受访者 说他们使用了 Ansible、 Puppet、 Chef、 Salt和 Terraform等自动化管理 工具。同时, 19%的 受访者 表示使用命令行 /SNMP,约 18%的 受访者 表示 正在 使用网络分析。不到 9% 的受访者使用 SDN或 Overlay, 6.3%的受访者声称使用 “基于意图的闭环网络、自动驾驶网络或其他自 动驾驶网络 ”(见图 7)。 图 7 数据中心网络自动化部署和智能运维现状 问: 您数据中心网络的自动化部署和智能运维现状如何? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 IDC的下一个问题是关于受访者 是否 计划 部署某种形式的数据中心网络自动化。总体而言,约 30%的受访 者表示他们已经部署了某种形式的数据中心网络自动化,但根据受访者拥有的数据中心数量, 具体情况 存在相当大的差异。在拥有 1个数据中心的受访者中,只有 4.3%的人表示他们 完成了 部署,而拥有 2个数 据中心的受访者和拥有 3个或更多数据中心的受访者中,有 27.5%的 受访者 表示他们 完成了 部署。 受访者 一致 表示,他们 都 计划 了 部署数据中心网络自动化 。 但 可以得出 ,拥有 3个或更多数据中心的客户在网络 自动化 这条路上 要走得更远(见图 8)。 图 8 数据中心网络自动化计划(按数据中心数量) 问:贵组织在部署某种形式的数据中心网络自动化方面有何计划? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 行业 受访者的回答 表明,所有受调查的行业都 正在进行 数据中心网络自动化 或 已有 计划 做 ,但政府 稍微 落后于其他行业(见图 9)。 图 9 数据中心网络自动化计划(按行业) 问:贵组织在部署某种形式的数据中心网络自动化方面有何计划? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 数据中心网络自动化 等级 IDC接下来要求受访者使用本文档前面 提到 的 指数 报告 和相关分类法来评估他们的数据中心网络自动化 等级 。总体而言,只有一小部分受访者表示他们处于 Level 0( 即 在整个网络生命周期中完全由人工操 作和维护),而且各行各业的情况也普遍如此。 相 同的是 , 也 有一小部分 受访者 表示,他们处于 Level 5,在该阶段,网络在整个生命周期中 实现 完全自动化,能够 自动 实施 策略 、 排除故障和补救 事件 。大 多数受访者位于 Level 2到 Level 4之间,尽管 IDC强烈怀疑一些受访者 对其当前网络自动化状况态度宽 松 ,可能并不如 他们所述 的那样先进(见图 10)。 图 10 数据中心网络自动化水平(按行业) 问: 基于 下面的分类法,您 会 如何描述您 组织 的数据中心网络自动化水平? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 数据中心网络自动化:企业在网络自动化进程中最迫切的需求和寻找方向 IDC还要求 受访者 指出,在网络生命周期中,他们认为 要实现 网络自动化 最迫切 的需求 是什么 。虽然有 很大比例的受访者( 23%)认为网络生命周期的所有部分都很重要和紧迫,但超过 33%的受访者认为 Day 1的自动化(配置和部署)是最迫切的要求 ,其中 媒体 /娱乐 /游戏和金融 /银行业务 Day 1的紧迫性 比例较高。这表明自动化配置和部署对于许多 受访者 来说仍然是一个未解决的问题(参见图 11)。 图 11 网络生命周期中最重要的网络自动化领域(按行业) 问:考虑到网络生命周期,贵组织对 哪个阶段 网络自动化的需求最迫切? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 了解受访者在数据中心网络自动化过程中所处的位置无疑对同行和整个社区很有价值,但 同样, 了解受 访者为什么追求和采用数据中心网络自动化也很重要。 因此, IDC问询 受访者他们对数据中心网络自动化需求的驱动因素 有哪些 。排在榜首的是应用和业务 的 连续性和韧性(数据中心 /云之间),大约 45%的受访者引用了这一点。 IDC认为, COVID-19疫情 推动 此 结果 。 各组织将业务 弹性 和连续性放在 首 位,因为它们专注于在 不可预见的 危机中保持 组织持续运 行 。 38%的受访者认为网络具有灵活性,近 38%的受访者表示需要降低运营成本和提高运营效率。 31% 的受访者认为网络敏捷,希望通过智能工具 实现 主动运维。 28%的受访者引用了基于策略的网络安全,如通过微分段等手段,大约 24%的受访者引用了简单声明性 管理 /可编程性的需求作为驱动因素(见图 12)。 图 12 数据中心网络自动化驱动程序 问:是什么推动了贵组织对数据中心网络自动化的需求?需要: n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 数据中心网络自动化的主要障碍 在确定了驱动因素之后, IDC接着要求 受 访者找出他们成功实现数据中心网络自动化的最大障碍。 缺乏 资源(投资) 位 于榜首, 超过 23%。略微落后的是超过 22%的 受访者认为是 应用上云( IaaS和 SaaS), 而根深蒂固的 “运维 习惯 ”被 17的受访者引用。近 11的受访者表示 是 “缺乏技能 ”,而 10 的受访者则强调 “缺乏感知 需求 ”。超过 9的人表示 “管理计划外的紧急情况和分散注意力 ”是最大的障 碍,而超过 7的人表示其组织的 “文化和不愿改变 ”是主要障碍(见图 13)。 图 13 数据中心网络自动化障碍 问:贵组织在成功实现数据中心网络自动化方面最大的障碍是什么? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 完全自治的数据中心网络是一个共同的目标吗? 最后, IDC询问受访者 “完全自动驾驶的数据中心网络 ”是否是他们组织的目标,总体来看,约 67%的受 访者表示,完全自动驾驶的数据中心网络 是他们在未来 1-2年内 的目标或者已经设定为他们的目标了 。 近 91%的人表示, 这是他们两年后的 目标。只有剩下的 9.3%的受访者表示他们没有 计划建立 完全自动 驾驶的数据中心网络。虽然各行业的兴趣程度不同,甚至在政府(最不看好行业)也存在差异,但 85% 的受访者将完全自动驾驶的数据中心网络确定为组织的目标(见图 14)。 图 14 2/3的 被访者将 DC网络自 动 驾驶作为 1-2年目标 问:完全自 动 ( 驾驶 )的数据中心网络是您的组织的目标吗? n = 205 来源: IDC数据中心网络自动驾驶 调查, 2020年 8月 如何开始、利用和 提升 自动驾驶级别 无论 组织 当前 在 指数 报告 中 处于什么位置 ,都有一条可行的前进 之 路。企业网 络 运维者 没有理由被挑战 阻 吓或 不知所措 。 而且,许多组织会发现他们选择的体系结构 、 自动化策略和网络基础设施供应商 将帮 助他们克服许多挑战,特别是如果供应商的产品有助于抽象并减化 所 提供全面 的 数据中心网络自动化的 复杂性。 以下各节为组织提升 自动驾驶级别 提供了指导。 评估技术需求 首先评估组织的应用环境。在您的组织今天可以找到自己并与组织中的其他人一起工作的基准,以 了解 随后几年形势 的 演变。掌握了这些信息和知识后,您将能够使网络的功能与企业的应用和业务需求保持 一致,从而确保网络可以 预见 和支持所有需求。正如本文所证明的那样,全面的数据中心网络自动化将 在实现该策略的过程中发挥重要的推动作用。 评估技能集 确保人员 专业知识 和技能组合符合当前和未来的要求。在某些情况下,可能需要培训项目,但正如我们 在以下章 节中讨论的那样,供应商和第三方(顾问、集成商和渠道合作伙伴)在明显 降低新技术学习的 复杂性方面可以发挥 显著 作用 , 实施网络自动化 的 最佳实践, 并 适应新的运营模式。 考虑组织结构和运作模式 在运营模式方面,积极采用云模式和云原生应用基础设施(容器和微服务)的组织可能会寻求打破传统 的组织和运营孤岛,采用更符合 DevOps原则和持续流程的运营结构 。 这有可能导致建立多学科平台 团 队 , 其中网络专家与其他 ITOps同行整合在一起,以创建简化的跨基础架构自动化方法,以支持敏捷性 和快速应用交付。 借助 可信 的供应商和第三方的协助 如前所述,供应商和其他 可信的 第三方应能够协助组织应对数据中心网络自动 化挑战。供应商 不仅可以 通过架构和基础设施来应对本文中描述的挑战,而且还可以 提供咨询和专业服务来帮助组织在部署和管 理新技术和掌握新的自动化流程时获得信心和保证。 华为数据中心网络自动驾驶解决方案 华为 CloudFabric旨在为 客户提供大容量、网络智能化、自动驾驶的现代化数据中心网络。因此,该方 案 可以帮助企业从数据中挖掘智能,加速数字化转型, 并加快 数字化商业发展。 华为 CloudFabric基于 SDN网络架构,将 AI技术与机器学习相结合,构建数据及业务模型的独立 AI训练 平台。此外, 华为 CloudFabric提供 一个自动驾驶管理和控制系统。将训练平台生成的模型导入管控系 统,网络 就能够 调用业务模型 来 智能控制网络行为。同时,持续采集网络行为数据,进行平台训练和模 型优化,实现闭环控制。该体系结构允许网络处理网络生命周期 的所有方面 ,从业务自动部署到智能自 愈、网络自优化、网络全面自治(见图 15)。 图 15 华为 L3数据中心网络自动驾驶 Huawei CloudFabric 来源:华为, 2020年 8月 华为 CloudFabric通过下层网络安全设备、中间层网络管控 系统 、上层业务编排系统,将 AI技术注入到 在持续不断的迭代流程增强过程中,解决 涵盖 规划、部署、运维和闭环优化的生命周期流程。实现这一 结果涉及以下各节中讨论的特征。 数据仓库 数据仓库是自动驾驶的基础。 数据仓库 采集 iMaster NCE-Fabric的历史数据 以及 非纳管设备或 人工 纳管 设备的网络数据。采集到的数据可以作为数据挖掘和 AI学习的源 数据 。例如,能够识别历史网络配置对 网络性能的影响,从而达到最佳的网络规划。 平台开放性 开放仍然是华为 CloudFabric的关键目标。华为基于 Neuron标准模型和 VXLAN协议,实现多层开放 Fabric架构,满足不同客户需求。 此架构 帮助客户实现软硬件一体化,保证互通性, 并将 业务集成时间 从月缩短到天。 开放的资源管理层包括 iMaster NCE-Fabric,基于 Neutron模型,通过 RESTful API等标准协议与 OpenStack等云管理平台对接。从而保证云编排平台下发的业务模型参数可以应用到 iMaster NCE- Fabric。同时, iMaster NCE-Fabric支持基于 OpenFlow、 OVSDB、 NETCONF、 SNMP、
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642