资源描述
01 02 1 4 4 7 10 10 11 1.1 云时代运营商IP网络面临的新变化 1.2 云时代运营商 面临的新挑战 1.2.1OTT竞争挑战 1.2.2运营商云网运营升级挑战 1.3 技术创新驱动结构性问题解决 1.3.1智能云网技术演进思路 1.3.2智能云网发展愿景 2.1 智能云网IT架构 2.1.1概述 2.1.2智能云网IT目标架构 2.1.3智能管控单元:网络服务化 2.1.4新一代云网运营系统:运营电商化 2.2 智能云网应用场景 2.2.1售前:拓扑服务实现云网产品智能推荐 2.2.2售中:连接服务实现云网业务一站式开通 2.2.3售后:分析服务实现租户自助服务 13 13 15 16 18 20 20 22 25 运营商云网发展与挑战 智能云网IT架构与应用场景 目录 03 04 05 06 3.1 拓扑服务关键技术 3.1.1云路径服务化 3.1.2智能云图算法 3.1.3高性能弹性控制面 3.2 连接服务关键技术 3.2.1意图编排 3.2.2高可靠配置面 3.3 分析服务关键技术 3.3.1云网多维可视 3.3.2智能保障 3.3.3高算力数据面 28 29 32 34 35 35 36 38 38 39 41 4.1 IT架构与集成挑战 4.2 IT架构与集成实验室 4.2.1集成实验室生态构建思路 4.2.2集成实验室管理流程 4.3 IT架构与集成实践 42 43 43 45 46 47 48 智能管控单元关键技术 IT架构与集成生态建设 总结 参考文献 1 1.1 云时代运营商IP网络面临的新变化 从非洲鼓语完成村落之间复杂信息的传递,到如今信息爆炸席卷全球。我们正在进入一个计 算无所不在、软件定义一切、万物智联的新时代。相比与以蒸汽机的发明为标志机械化特征的第 一次工业革命,以电的发明为标志电气化为特征的第二次工业革命,以计算机的发明为标志信息 化为特征的第三次工业革命,现在我们迎来了以云计算、大数据、物联网、人工智能等新技术引 领的第四次工业革命。 运营商云网发展与挑战01 2 智能云网IT架构与集成白皮书 云计算成为第四次工业革命的核心数字动能。千行百业的物联终端快速发展,需要云计算的 大智能和大算力,才能实现从大数据中获得所需的信息和知识。类比电网,如何构建一张云网把 云的算力源源不断的输送到千行百业,显得尤为重要。 在各国国家战略普遍支持和企业应对经济发展趋势而进行数字化转型的双驱动下,越来越多 的企业将业务迁移到云上。根据IDCFuture Scapes2020预测,到2025年,85%的企 业新建数字基础设施将部署在云上。企业上云应用也从初级阶段的门户网站、电商系统等互联网 应用,逐步发展到关键信息系统、核心生产系统上云。同时,考虑到上云成本、不同的底层技术 服务不同的部门、数据的灾难恢复、资产主权合规等,单一云往往无法满足企业的所有要求。多云、 混合云(私有云+公有云)成为企业的战略选择。 图 1-1 云网为第四次工业革命输送澎湃数字动能 3 变化1:云快网慢到云网一体化调配 企业上云初期以私有云、行业云、公有云为主,云内率先实现自动化,给用户提供在线购买、 即开即通的电商化体验。企业上云中期阶段,混合云、多分支上云成为主流,这就要求上云连接 能达到云内连接一样的敏捷体验。但是,当前专线开通速度是周级甚至月级,难以满足企业上云 诉求。因此需要运营商将传统网络升级到智能云网,给用户提供云网一体化调配的电商化体验。 变化2:云好网差到云网一致性体验 数据中心采用Spine-Leaf的极简架构组网,实现任意两台主机流量一跳直达,以及通信低 时延、无阻塞,保障上云的极致SLA体验。随着企业上云已进入中期阶段,并逐步走向信息系统、 核心生产系统上云,使得应用对SLA有了更高的要求。比如信息系统上云要求大带宽和确定性 时延,核心系统上云需要极低时延,例如某电网差动保护业务要求承载网确保时延2ms。传统 Overlay最后一公里的上云方式已经无法满足企业的SLA诉求,因此,需要云网端到端SLA保 障,给用户提供一致性体验。 随着企业数字化转型加速,多分支上云成为主流需求,云对网的要求也发生了相应的变化: 来源 : Flexera 2020 State of the Cloud Report 4 智能云网IT架构与集成白皮书 1.2 云时代运营商面临的新挑战 1.2.1 OTT竞争挑战 云网络成为数字经济的基石,企业上云成为趋势, 构建有竞争力的云网络成为兵家必争之地。 OTT云商也逐步从数据中心走向云广域网络,最终的目标是构建“应用-云-边”一体化的网 络。云商的主流思路是自建云骨干网络,并逐步将POP点下沉到地市。利用网络虚拟化技术, 为租户构建了一张云广域网络,提供云间高速互联、SD-WAN分支上云、专线上云等多种产品。 OTT非常重视用户的产品体验,将网络的能力服务化,让云广域网络也具备了实时、按需、自助 服务等云的特征: 图 1-2 主流 OTT 云网络发展历程 实时开通: 租户在云操作台下单购买产品后,付费即通。可以快速构建一张租户网络,实 现分支互联及多云互联。 5 按需付费: 可以精细化的基于企业实际使用的流量来计费。可以灵活购买带宽包,并自主 在站点之间分配,实时调整站点之间分配的带宽。 自助服务: 租户可以通过云操作台在线完成所有操作,涵盖业务开通,租户网络运维,实 时掌握租户网络质量状态。 图 1-3 OTT 云网络对比运营商专线 相对比OTT云网产品给用户提供的在线订购、所见所得、即开即通的电商化体验,运营商 的专线产品当前体验还相对落后: 6 智能云网IT架构与集成白皮书 售前: 云网资源不可视、业务SLA不敢承诺 客户在业务订购平台发起订单。客户经理获取商机后,与客户洽谈。但此 时,客户经理只能借助存量系统简单查询客户接入地址网络资源(接入设备、 光纤资源等),无法准确预估客户业务开通时长,无法评估业务的时延质量, 因此不敢与客户签订SLA承诺,最终也导致网络时延无法变现。 售中: 工单流转、人工配合,业务月级开通 客户签署完专线合同后,运营系统会进行工单分发。资源核查设计、管 线施工、设备采购安装、数据配置、业务调测等流程都依赖人工串行处理。 对于一条简单的跨省专线往往需要接近两个月才能够开通。这对于企业上云是 无法接受的。因此,由于运营商上云业务不够敏捷,企业客户纷纷选择OTT 或StartUP公司提供的SD-WAN解决方案敏捷上云,牺牲掉最后一公里的 SLA保障能力来获取业务敏捷性。 售后: 业务阻断时有发生,业务端到端质量不可视 客户业务开通后,进入服务的履约阶段。当前运营商普遍缺少端到端云网 一体的运营平台,仍然采用分级、分段、分专业的运维模式。因此,当客户的 业务发生阻断或者劣化时,客户无法判断是客户自身系统问题,还是运营商专 线问题,因此只能采用投诉方式驱动问题解决。而运营商分级、分段、分专业 的运维方式就导致需要多人协同配合定位,定位效率低下,客户感知差。 7 图 1-4 运营商 IT 系统集成的流程断点 面对OTT的竞争,运营商如果不能进行云网运营系统升级,提升客户的产品体验,将在云 时代失去流量高地。OTT通过SD-WAN技术,将流量就近接入到自建云骨干的POP点,购 买带宽包进行灵活的跨地域互联。这最终将导致运营商骨干网的流量逐渐被分流。运营商传统的 专线业务也会被局限在最后一公里。因此,云时代的到来,运营商进行云网运营升级,已经成为 迫在眉睫的事情。 1.2.2 运营商云网运营升级挑战 相对比OTT,运营商的云网运营升级挑战更大。首先是网络层面,运营商的网络规模更大, 组网更复杂,给租户提供有质量保障的虚拟网络,无疑面临更多技术挑战。其次是运营系统方面, 运营商传统运营习惯是以网络为中心的,很多流程依赖工单驱动,人工处理,要打通流程上的断点, 8 智能云网IT架构与集成白皮书 断点1:缺少实时资管,CPE上线手工录入,硬装多次进站 当前的业务激活系统主要涉及三个部件:资管、服开、网管。具体业务开通流程是服开调用 资管接口完成物理世界的九级地址到网元设备标识的映射,然后调用网管的北向接口,将业务开通, 网管负责完成网元的VPN、隧道等配置。 激活系统子部件多,配合流程复杂,耦合性大。存在硬装工程师多次进站的情况。硬装工程 师安装完CPE后,需要手工在资管系统录入,然后才能业务激活。业务激活后,硬装工程师需 要二次进站,确认业务是否开通。一旦硬装工程师手工录入CPE信息出错,则业务激活就会失败。 整体系统升级到硬装即通的体验,难度是非常大的。资管需要增加与网管之间的机-机接口, 能够自动感知到CPE的上线。但资管在传统流程中是个离线系统,改造成在线系统成本很高。 而无法改造资管,则无法实现真正的 自动化。 全面实现机-机接口自动化,也有相当难度。最后是云网运营的生态问题,目前B域、O域、控 制器域,存在众多厂商,相互集成缺乏标准和规范,众多系统之间的接口存在定制开发,系统集成难, 新业务上线慢。 当前,一些领先运营商率先进行了云网自动化运营的探索。但在IT系统集成方案上仍然采取 了分域管控,分层协同的思路。因此,在实际系统集成与运营过程中,发生了一些集成困难及流 程断点: 断点2:跨省业务VPN拼接, 对接资源人工协同,难以自动化 运营商传统的建网及管理方式是 按区域划分的。因此,当跨省业务开 通时,往往采用VPN 分段拼接的方 式来实现。VPN对接方式的好处是 运维团队之间责任界面清晰,但缺点 图 1-5 跨区域业务 VPN 拼接 9 却十分致命: 网业耦合:边界设备存在大量租户级VPN配置,难以维护。 难以自动化:虚实映射难,管理系统无法获取跨域链路信息,只能依靠人工资源核查,每 业务每接口的资源分配非常难以规划。 因此,当前只要涉及了跨越多个管理域的业务开通,都只能通过工单驱动,人工配合的方式 实现,这导致一条简单的跨省专线往往需要2个月才能开通。 断点3:云网对接周期长,云网编排器实现复杂 部分运营商聚焦多云连接商业场景,建立云骨干并引入多云汇聚平台,为租户提供跨云商的 VPC互通业务。本质上,云骨干与数据中心网络使用的是VPN对接方式。因此,多云汇聚平台 内部需要具备云网编排的能力,需要提前规划云网对接的物理接口、Vlan资源。当租户在线申请 VPC及上云专线时,多云汇聚平台会自动分配空闲的物理接口及Vlan资源给租户,并自动完成 VPC和上云专线的开通。 当前云网协同流程复杂,云网编排器实现难度较大。主要原因在于云网编排器与网管对接的 接口是网络级接口,网络级接口将网络技术细节全部暴露给了上层系统。网络级接口有成千上万 的接口参数,系统之间的集成工作量非常大,同时接口集成人员需要不断的进行接口参数交流, 理解不一致就会导致对接失败,从而修改对接流程。因此,目前普遍系统集成周期要大于6个月。 而云平台提供的VPC API,作为服务化接口屏蔽掉技术细节,涉及的参数只有几十个,这使得 多云汇聚平台对接云平台的速度非常快。因此,要实现云网一致体验,加快IT系统集成速度,网 络侧也必须改进到服务化接口对接方式上来。 10 智能云网IT架构与集成白皮书 1.3 技术创新驱动结构性问题解决 1.3.1 智能云网技术演进思路 众所周知,数据中心网络是率先实现业务自动化、运营电商化的网络。回顾数据中心网络的 成功,在技术选型上有如下三点值得运营商借鉴: 极简网络:通过POD内Spine-Leaf设备组网简化,构建了一个无阻塞、高 可靠、弹性扩展、易于维护的基础设施。 极简接口:租户网络模型简化后,云平台就非常容易抽象出了服务化的VPC API,屏蔽了网络实现细节,方便多云汇聚平台的集成。 云路径服务化:借助SRv6 BSID服务化技术,将复杂的广域网络进行资 源池化,将非规则物理拓扑重塑成以BSID为虚拟链路组成的标准Spine- Leaf虚拟极简基础设施。利用智能管控单元路径集中计算及闭环自治能力, 实现BSID的SLA可保障。因此就能够构建一个无阻塞、高可靠、确定时延 的虚拟极简网络。 极简协议: 通过引入VxLAN协议,实现了数据中心内的任意连接,从而简化 了租户网络模型设计,免去了VPN拼接。 相对比数据中心网络,运营商的广域网络规模更大,组网更复杂,既要具备连接的敏捷性, 又要具备连接的SLA可保障,这就需要引入新的开创性技术。基于SRv6协议的智能管控就是 使能运营商智能云网的关键技术: 11 综上,技术创新给运营商云网带来了新希望。相比OTT有云无网,运营商有网有云,天然 具有最后一公里网络的广覆盖优势。因此,只要运营商提升了云网运营水平,就可以利用网络优 势在云时代取得成功。 SRv6一跳直达: 通过SRv6路径可编排,实现网络内任意两点一跳直达, CPE一跳入云。因此达到租户网络模型的简化,免除VPN的拼接。 网络服务化: SRv6一跳直达,简化了租户网络模型。因此,智能管控单元可 以实现场景化的服务化北向接口,屏蔽掉网络技术细节,简化掉上层云网运营 系统的集成难度。 1.3.2 智能云网发展愿景 所谓云网,就是联接云、使能云的网。 在数字经济浪潮之下,云网已经成为数字 经济的基础底座。截至今日,世界上已有 超过50个国家制定了数字战略及规划。 对于运营商来说,打造一张面向云的全新 业务网已成为必然之举。区别于传统网络, 云网作为使能云的网络,必然要满足云对 网的要求。以中国电信为例,2020年发 布的“云网融合2030技术白皮书”,明 确了云对网的新要求,主要涉及网络性能、 网络可用性、网络智能性、柔性适配能力 和网络安全等五个维度。 来源 : 中国电信云网融合 2030 技术白皮书 12 智能云网IT架构与集成白皮书 从图中可以看到,目前运营商网络距离云的要求仍有较大差距,差距最大的是“柔性适配能力” 及“网络智能性”,也就是说网络服务的调用速度仍然难以满足云的要求。 iMasterNCE致力于成为智能云网的核心使能引擎,帮助运营商全面提升云网运营水平。 首先提升网对云的响应速度,做到云网服务一体化调配。其次,发挥运营商网络广覆盖优势,提 供有SLA保障的上云联接,做到云网服务一致性体验。最终,面向企业用户实现云网产品一站 式订购,电商化服务体验。总结起来,华为期望给运营商云网带来“一跳入云、一网通达、一键 导航、一纤多用、一体安全”五个一全新能力,充分将运营商优势的网络资源价值最大化,充分 发挥云和网的互补优势,为运营商提供云网一体的DICT服务奠定基础: SRv6云路径实现跨域打通,技术打破流程壁垒,解决跨域连接人工 配置难题,实现业务分钟级一网入云。 网络服务化,用网像用云一样敏捷。网络服务化架构,提供租户级接 口,屏蔽网络实现细节,降低系统集成时间90%。智能分布式算路, 实现超大规模组网,海量租户全球互联。 智能云图算法,结合网因子、云因子,为企业推荐最优上云路径,实 现云网资源一体调度,提升云网资源利用率30%。 层次化切片,为千行百业提供确定性业务体验。满足企业视频监控、 办公上网、远程会议多种不同SLA诉求,一根光纤进入网络侧不同 业务切片专网,实现精细化体验保障。 构建云网安一体的立体防御能力,隐秘攻击分钟级感知,云网安联动 威胁近源阻断,为用户提供便捷的安全服务。 一跳入云 一网通达 一键导航 一纤多用 一体安全 13 智能云网IT架构与应用场景02 2.1 智能云网IT架构 图 2-1 云网一体架构图概览 2.1.1 概述 要实现智能云网的智慧运营,必须由云网分离走向云网一体。从网络基础设施层、网络管理 控制层、网络运营层进行技术变革: 14 智能云网IT架构与集成白皮书 网络基础设施层:协议简化是基础 传统网络协议技术繁杂,隧道层面存在:LDP、MPLS-TE、BGP- LSP等多种隧道,且每一种隧道都不能独立跨域。因此,又导致出现了多种 VPN的拼接技术,包括:VLL/VPLS/L3VPN等等。网业耦合在一起,网络 设备上配置繁多,难以维护和实现自动化。 智能云网采用新一代的极简协议,将繁杂的多种协议技术归并到EVPN 与SRv6,SRv6是新一代SDN网络使能协议,通过智能管控单元实现集中 路径计算,实现跨域一跳直达,免除VPN拼接。 网络运营层:运营电商化是结果 传统网络BSS往往只实现了工单的自动化,依赖人工处理实现业务的开 通。无法提供面向租户的售前、售中、售后全流程的电商化购物体验。 智能云网时代,需要新一代的云网运营系统。它需要融合传统OSS、 BSS系统功能,并新增多云汇聚功能。通过服务化接口,调用智能管控层提 供的网络服务能力。面向租户提供云网产品的一体化供应,电商式购买体验。 智能管控层:网络服务化是关键 传统网管采用网络级接口与OSS对接,网络级接口存在K级参数,将网 络技术细节全部暴露给OSS,集成复杂。同时,由于传统网管网络管理规模 限制,上层OSS需要看到多套网管,需要支持跨管理域的VPN编排功能, 进一步加大了OSS系统的开发难度。 智能云网引入智能管控单元新部件。智能管控单元通过网络服务化技术, 对上提供租户级的服务化接口,屏蔽掉网络技术细节,仅通过不到100个参 数就实现租户网络的开通、调整全功能。极大简化上层系统集成难度。 15 上图是我们建议的智能云网IT集成目标架构。它的集成原则是:智能管控层通过网络服务化 对上提供极简参数的对接接口,屏蔽网络细节。云网运营层聚焦给租户提供云网产品的一体购买, 电商化体验。智能管控层的服务化接口如下: 云管理平台:云内API及云专线API 云专线API: 为租户开通物理专线上云的API。调用该API,云管理平台会创 建虚拟边界路由器,并完成虚拟边界路由器的VPN配置。该API属于上云专 线产品,打通云网对接,云内一段连接的服务化接口。 云内API:为租户开通专有网络VPC。VPC基本组成包括虚拟交换机及虚拟 路由器。 新一代云网运营系统调用该API后,云管理平台会自动完成虚拟交 换机、虚拟路由器、云服务器相关部件的配置,自动生成专有网络子网。 图 2-2 智能云网 IT 目标架构 2.1.2 智能云网IT目标架构 16 智能云网IT架构与集成白皮书 图 2-3 iMaster NCE 智能管控单元 智能管控单元:上云API iMasterNCE聚焦智能管控单元功能定位,致力于通过网络服务化技术,成为智能云网的 核心使能引擎。 上云API: 为租户开通上云专线/专网。调用该API,智能管控会依据租户上 云意图,完成CPE到VPC上云连接,VPC与VPC多云连接的自动化开通。 除此之外,该API还会包含售前阶段的时延预估的产品推荐能力,以及售后阶 段的连接运维,故障诊断能力。 2.1.3 智能管控单元:网络服务化 17 网络服务化有三大核心内涵: 模型抽象: 对网络能力进行抽象建模,屏蔽网络具体实现技术。将网络功能定义为可被灵 活调用的服务模块,按需使用。 服务闭环: 网络服务的持续提供能力,对网络设备状态,业务状态高度实时感知。针对服 务执行阶段的异常情况,具备基于策略的自决策和高度智能的修复推荐能力,是网络智能性和自 治性的高度体现。 服务化北向:极简北向,聚焦描述网络服务的功能,而不是描述网络具体实现细节。 拓扑服务:作为iMaster NCE面向云网场景的核心服务,提供网络拓扑的实时 感知,路径的集中计算,一跳直达。并提供网络资源的实时核查,预估能力,提 供云网产品智能推荐等增值服务。 连接服务:提供面向租户网络连接模型的服务化接口,实现CPE设备的即插 即用、即装即通、即通即测功能。避免传统网络集成方式下实时资管改造,多 次硬装进站的问题。 分析服务: 提供面向租户,网络运维人员等多维多层的质量分析,故障诊断能 力。提供基于租户网络的连接质量可视,提供租户的自助诊断。面向NOC中 心的网络故障主动感知,分析闭环能力。 iMasterNCE提供的三大网络服务,功能定位如下: 18 智能云网IT架构与集成白皮书 iMasterNCE的三大关键网络服务可以支持云网运营系统的按需取用,灵活组装。按照网 络服务的层次关系,连接服务属于最上层,它会使用拓扑服务及分析服务提供的能力,进行灵活 编排和组装,为新一代运营系统提供面向租户模型的极简服务化接口,将网络技术,如VPN、隧道、 分片等技术参数全部屏蔽。对接参数少于100,极大加快系统集成速度。 2.1.4 新一代云网运营系统:运营电商化 在智能云网IT集成架构下,新一代云网运营系统聚焦构建面向最终用户的产品及面向租户的 服务(CFS:Customer FacingServices)功能。(CFS:Customer FacingServices) 的功能。将网络资源层(RFS:ResourceFacing Services)的功能交给智能管控单元及云平台, 并通过网络服务化接口进行对接。整体对最终用户提供云网一体化运营,电商化体验。 新一代云网运营系统是融合传统BSS/OSS功能,再加上多云汇聚,上云连接等云网产品租 户Portal。同时裁剪掉传统OSS系统对网络技术的感知,仅保留云网产品租户模型,使用服务 19 化接口对接智能管控层。整体功能模块可分为: 用户管理:提供租户账号管理,提供账号在线创建,鉴权,分权分域等功能。 产品订购:提供租户在线购买云网产品,订单管理,流程审批等。 计费管理:提供云网产品费用计算,趋势分析等。 产品控制台:提供租户Portal,租户可以在线订购云网产品,云网产品 状态可视。 上面的功能,偏向于BSS层面的能力,聚焦产品和CFS层面功能。 云内产品编排:调用云平台提供的VPCAPI,基于租户开通云内产品。 上云产品编排:调用智能管控单元提供的上云API,基于租户开通上云产品。 硬装综调:硬装流程管理,在线的工单系统(硬装流程必须依赖人工处理)。 上面的功能,偏向于OSS层面的能力,但不关心网络技术细节,直接使用智能管控层提供 的网络服务化能力。 20 智能云网IT架构与集成白皮书 Underlay拓扑服务: 控制器可以基于全网拓扑,提供基于时延、带宽、跳数等多因 子算路能力,同时提供故障重算路和网络重优化能力。该服务中上述特性的实现,依赖两个条 件:一是拓扑变化实时感知,及时修复业务路径;二是链路带宽、时延及隧道流量实时感知, 精准调优实现网络负载均衡。为此在控制器和设备间引入BGP-LS和Telemetry两个协议, 分别用于上报链路信息和采集链路、隧道的质量信息。BGP-LS是IETF定义的链路状态收 集协议,通过BGP机制快速洪泛链路状态路由信息,相比较于Netconf协议,更为敏捷可靠。 Telemetry可以实现秒级数据采集,更快速高效。 Overlay拓扑服务: 是在Underlay拓扑的基础上构建基于Spine-Leaf架构的逻 辑拓扑。该拓扑的网元是ABR或者ASBR点,“链路”是SRv6 Policy隧道,通过BSID 标识,并带有时延属性,可以通过Underlay拓扑服务自动优化。基于Overlay拓扑的API 服务化能力,业务创建时仅需感知BSID编排以满足SLA要求,方便入云应用的灵活、按需 调用。Overlay拓扑服务的快速、极简构建,是Overlay拓扑服务的关键能力。控制器提供 隧道组规划功能,一键式批量创建SRv6 Policy隧道,并实现BSID分配、隧道时延采集、 Overlay拓扑构建的全自动化流程。 2.2 智能云网应用场景 下面介绍智能管控单元的网络服务化能力如何支撑新一代云网运营系统,给最终用户提供的 售前、售中、售后功能及体验。 2.2.1 售前:拓扑服务实现云网产品智能推荐 在售前阶段,iMaster NCE通过Underlay拓扑和Overlay拓扑服务实现网络资源在线核 查,实时可视。根据企业分支位置、云池资源找到最匹配的网络路径,并可以根据租户的SLA 要求提供不同的云网可选套餐,并支持一体化订购。 21 图 2-4 iMaster NCE 拓扑服务 利用这些拓扑服务能力,运营商可以在自己的运营门户提供丰富的云网产品: 云网产品不同的套餐推荐: 就像打车软件的专车、优享、快车服务,实现网络时延、带宽、 可靠性等差异化能力的变现,为企业客户提供不同SLA等级的服务。 套餐的时延圈和云池推荐:根据企业分支位置信息、云池位置,管控系统即可根据 CPE接入位置,给出入云业务的时延等推荐,并可以结合成本、带宽、可靠性等各种 约束条件,推荐符合的云池资源和网络路径。 22 智能云网IT架构与集成白皮书 图 2-5 iMaster NCE 连接服务 业务订购接口:是高度极简的面向业务意图的服务化接口。通过该接口,O/B域可以不 再关注网络参数细节,更多的专注于商业设计和产品定义。业务订购接口对网络参数简化的对比 如下: 2.2.2 售中:连接服务实现云网业务一站式开通 在售中阶段,iMasterNCE通过业务订购接口、业务开通接口及业务调速接口等连接服务, 与运营商O/B域系统深度集成,实现云网业务一站式开通体验,开通状态全程可视。 23 图 2-6 网络参数简化对比 从上图可以看出,该业务订购接口将一个云网业务抽象为一个大对象(租户网络)和五个 子对象(线下站点和接口、云上站点和接口以及VPC),每个对象的定义都只描述业务意图。 实现简化接口的关键是基于乐高模式的业务编排能力。管控系统内置多种基础业务模型,可以 根据云网产品定义快速构建端到端逻辑业务实现逻辑,但维持对外极简接口不变。同时管控系 统内部提供不同云池的VPC预置接入能力,可以实现云资源自动匹配和配置分解。 业务开通接口:提供CPE即插即用到业务自动开通的能力。该接口匹配CPE资源 不具备场景下的业务订购场景,重点是简化CPE的上线流程,自动感知CPE上线,快速完 成业务发放。该服务化接口相较于传统的工单流转,大大提高了业务开通时间,并协助O/B 域实现业务开通时间可预测。 24 智能云网IT架构与集成白皮书 业务开通接口,关键能力是CPE的扫码上线能力和业务仿真验证功能。装维人员进站后, 通过APP扫码可以免NOC值守。iMaster-NCE可以根据扫码上线能力实现CPE自动纳管、 光纤自动拨测,基础配置自动下发等能力。CPE扫码上线后,业务仿真可自动匹配租户业务数据, 并通过算路仿真功能确认对用户的业务质量满足度,完成业务数据端到端下发。 业务调速接口: 在极简业务订购接口的基础上提供租户级业务调速能力。通过此接口可以 自动实现业务限速和网络路径资源调整。 三个连接服务接口,涵盖了业务订购、发放和调整的三个不同阶段。接口调用的流程可以及 时反馈给O/B域,协助实现业务开通状态可视。 25 图 2-7 iMaster NCE 分析服务 2.2.3 售后:分析服务实现租户自助服务 传统IP网络运维方式,业务质量感知能力差,业务故障定位难,业务恢复时间长。通过网 络分析服务,结合秒级性能数据采集能力和业务随流检测iFIT技术,同时引入智能化及大数据技 术,让云网业务具备了“智慧”的能力,云网业务的带宽、时延等SLA信息实时可视。 云网融合场景下,除了传统运营商侧网络主动运维外,租户侧签约业务SLA可视,可管, 可保障关系到运营商履约的执行。iMaster NCE通过分析服务可以提供基于租户自助服务、站 点工程师扫码运维和NOC中心主动运维的多级运维模式。 26 智能云网IT架构与集成白皮书 租户自助服务:云网融合运维的一个重要演进是提供租户业务SLA可视、可对账,以及 出现问题时用户一键报障功能。用户可以通过Portal查看业务质量,也可以定时收取业务质量 报告。当业务产生故障时,可以一键自助申报故障,并实时跟踪故障修复进度。分析服务提供租 户级业务可视服务接口,实时感知业务质量,可针对不同的业务模型,自动选择对应的业务SLA 检测方案,租户仅需对业务进行可视使能,而不需关注诊断技术细节。此外管控系统可实现业务 SLA检测自动启停,检测数据自动整理分析,并自动生成报表数据。 站点工程师扫码运维:该运维模式可用于解决用户业务最后一公里的故障诊断和维护, 有效判断是客户侧问题还是网络侧问题,是NOC中心运维的有效补充。站点工程师通过运维 APP,对客户侧CPE设备进行扫码上传,管控系统自动根据扫码上传的CPE设备ESN号, 查找所属的租户业务,并自动对该站点到其他站点的业务进行业务层、隧道层Ping&Trace诊断, 同时对该站点跟网络连接链路的光功率、告警等信息,进行综合判断,给出故障诊断结果,支持 后续业务维护流程。该运维APP具备灵活、高效的优势,可以解决70%CPE侧问题。 NOC中心主动运维:在提供租户自助服务和站点工程师站点扫码运维之外,iMaster NCE还提供基于整网深度分析的主动运维。 27 基于业务SLA的主动监控和故障定界定位 网络KPI深层洞察 故障根因智能诊断 得益于业务随流精准检测(iFIT)技术的发展,可以实现每业务每报文粒度的实时SLA感知, 可以并基于端到端和逐跳快速检测丢包、时延、抖动等业务质量,实现快速的定界定位。 华为智能IP设备能够基于telemetry采集7大类80k网络KPI指标,并通过独有的嵌 入式智能技术,主动识别异常指标并上报。 通过对4万台设备的华为自动化测试工厂数据、16万+历史故障信息和1000+网络运维 经验数据进行离线学习,训练故障根因算法。目前已经支持上百种故障诊断模型根因分析, 实现分钟级根因定位。同时还可以识别静默故障根因。此外,还支持对90%以上常见故 障提供精准故障修复建议,实现业务故障自愈同时保障SLA体验。 28 智能云网IT架构与集成白皮书 智能管控单元关键技术03 3.1 拓扑服务关键技术 拓扑服务是iMaster NCE提供的最重要服务。它定位于运营商网络云化,提供任意连接的 云路径一跳直达。同时,智能感知网络状态变化,提供云路径的自调整、自优化能力。拓扑服务 是智能云网运营升级的关键。下面介绍iMaster NCE在构建拓扑服务所采用的三大关键技术: 一是云路径服务化,二是智能云图算法,三是高性能弹性控制面。 图 3-1 拓扑服务关键技术 29 图 3-2 云路径服务化 3.1.1 云路径服务化 网络世界的路径导航服务:实时多维拓扑,SLA自动算路,闭环有路即通 云路径服务化本质就是在网络世界构筑一个实时、在线、智能的路径导航服务。回顾物理世 界的驾车体验,在电子地图出现之前,只有纸质地图的时候,司机无法进行实时导航,无法感知 路况从而规避拥堵,因此驾车准确性完全依赖于司机的行驶经验。传统网管就相当于物理世界的 纸质地图,不能实时感知网络拓扑通断,不能实时感知网络链路时延,无法基于业务质量要求计 算出最佳网络路径,并持续保障路径SLA。iMaster NCE提供的拓扑服务就相当于物理世界的 电子地图。它基于SRv6网络可编程技术,通过路径的智能集中计算,基于业务SLA要求,构 建最佳转发路径,并持续保障。 30 智能云网IT架构与集成白皮书 图 3-3 拓扑服务能力 BSID服务化:跨管理域一跳直达,实现云路径服务化 图 3-4 SRv6 Policy BSID 服务化 31 SRv6Policy是云路径服务化的技术载体,它利用源路由机制,通过在头结点封装一个有序 的指令列表来指导报文网络转发。利用IPv6地址128 bit的可编程能力,丰富了SRv6指令表 达的网络功能范畴。除了用于标识链路转发的End.X指令、结点转发的End指令外,还能够对 一个SRv6Policy本身分配BindingSID。如果一个报文携带相应的BSID,则该报文会被导入 相应SRv6隧道。 如果我们把SRv6 Policy看做一个网络服务的话,BSID就是访问这个服务的接口。利 用这个能力,我们可以把SRv6 Policy设计成一个服务的订阅发布模型。类比于铁路系统, BSID(网络视图)可以类比于一张火车车票,它无需关心是谁购买了车票,只需要按照承诺的服 务等级将乘客送到站。而乘客可以根据自己的出行要求,购买相应的一张或几张(倒车)车票, SRv6Policy(业务视图)就相当于乘客的行程,可以通过携带多个BSID来实现端到端一跳直达。 而拓扑服务则类似于12306,帮助客户推荐最优的出行方案(直达/中转)。 SRv6BSID服务化最大的好处就在于网业分离,Underlay BSID(网络视图)给Overlay SRv6Policy(业务视图)提供服务,屏蔽掉了物理世界的变化,当一个链路发生故障或者由于 拥塞导致时延增大的时候,Underlay BSID会自动调整转发路径,以确保达到承诺的SLA。 OverlaySRv6Policy可以做到无变化。这样就能够做到业务极速收敛,快速闭环。 32 智能云网IT架构与集成白皮书 3.1.2 智能云图算法 一个好的导航服务离不开一个智能的路径算法。iMaster NCE面向云网场景,构筑了云图 算法。该算法的最大特点是结合了网因子及云因子双重因子,实现了云与网的一体化智能调度。 该算法具备如下关键能力: 路径多因子算路 支持从业务带宽、时延、可靠性等SLA约束,实时考量网络状态,实现最优路径选择。 带宽保障:可以支持实时带宽及预留带宽两种模式计算。实时带宽模式采用网 络拓扑链路的实时带宽作为约束进行计算,而预留带宽模式则会精细化的关联 每条链路通过的隧道,将隧道的预留带宽之和作为约束计算。预留带宽模式在 云网场景尤其重要,因为面向最终用户是按照带宽收费的,带宽可承诺是基本 要求。 时延保障:路径时延主要包括逐跳的链路时延和设备转发时延之和。链路时延 相对固定,跟距离相关。而设备转发时延跟流量突发,路径拥塞,队列优先级 等多个因素相关,相对不确定。云图算法支持通过网络演算技术,将转发时延 与分片预留带宽进行关联,给用户绝对的确定性时延保障。 可靠性保障:云图算法充分考虑了工作路径、保护路径与网络状态的关系。例 如:工作保护路径分离,防止一条链路中断导致主备路径中断,业务中断;工 作路径与保护路径不经过相同的风险链路组(SRLG),防止光路中断,导致 多条链路中断,从而导致主备路径同时中断,业务中断。云图算法能保障给客 户可承诺的冗余路径可靠性保障。 33 云+网多因子算路 类比现实世界,云就相当于宾馆,网就相当于道路,用户诉求是去宾馆过夜,他既要考虑宾 馆的服务质量、过夜费用,也要考虑距离宾馆的远近,路上拥堵情况,打车费用等多种因素。云 图算法核心能力就是考虑云的成本,存储负载等因子,叠加上网络带宽、时延等因子一起计算, 最终帮助用户购买到最优的云网产品。 网络资源优化 随着网络业务运行一段时间后,网络会存在资源利用率不均的问题,局部链路流量过载,局 部链路流量轻载。这个时候就需要对网络路径进行全局优化,在对用户SLA承诺不变的情况下, 均衡网络负载,提高网络吞吐量。 局部优化: 当网络中链路出现局部拥塞时,将该链路上的隧道进行路径重计算, 将流量疏导到其他轻载链路上。该功能的关键点是要考虑隧道之间的优先级抢 占,始终保证高优先级隧道得到最优SLA。 全局优化:将网络中所有隧道全部进行重优化,从而达到网络负载均衡。该功 能的难点在于计算速度和均衡收益之间的平衡。云图算法具备在超大网络规模, 海量隧道下的全局优化能力。 时延圈:以网络任一设备为中心,快速找到满足一个时延要求的所有设备。该 功能可以快速帮助用户找到满足时延要求的所有云池。也可用于选择最合适的 网络位置建立云池,覆盖最大的网络范围。云图算法采用逆向搜索手段,能够 做到超大网络规模时延圈的秒级快速计算。 34 智能云网IT架构与集成白皮书 3.1.3 高性能弹性控制面 拓扑服务作为网络大脑,网络路径的 集中控制点,性能、可靠性就显得尤为重 要。iMaster NCE 构建高性能,高可靠 控制面,采用了如下关键技术: 微服务+嵌入式ICT融合架构: 控制协议遵循IETF标准规范,属于传 统CT网元设计模式,对于协议报文的 处理效率和存储效率要求极高。因此, iMasterNCE在需要
展开阅读全文