通信人工智能赋能自智网络白皮书_64页_6mb.pdf

返回 相关 举报
通信人工智能赋能自智网络白皮书_64页_6mb.pdf_第1页
第1页 / 共64页
通信人工智能赋能自智网络白皮书_64页_6mb.pdf_第2页
第2页 / 共64页
通信人工智能赋能自智网络白皮书_64页_6mb.pdf_第3页
第3页 / 共64页
通信人工智能赋能自智网络白皮书_64页_6mb.pdf_第4页
第4页 / 共64页
通信人工智能赋能自智网络白皮书_64页_6mb.pdf_第5页
第5页 / 共64页
点击查看更多>>
资源描述
2 / 64 目 录 摘要 . 4 一、 概述 . 5 1.1 自智网络产生背景 . 5 1.2 自智网络国际标准现状 . 6 1.3 全球主流运营商及业界在自智网络方面的创新 . 8 1.4 网络管理系统自智等级分级总体方法 . 11 1.5 自智网络实施路径五步法 . 12 二、 自智网络实现框架与实施路径 . 14 2.1 网络运营管理生命周期 . 15 2.2 运营商 OSS 体系 . 16 2.3 自智网络立方体 . 18 2.4 自智网络功能与场景全集 . 20 2.5 OSS 智能化能力提升支撑自智网络等级演进 . 22 三、 自智网络核心技术组合 . 26 3.1. 网络数据中台 . 27 3.2. 通信人工智能 . 28 3.3. 网络数字孪生 . 31 四、 自智网络典型应用案例 . 33 3 / 64 4.1. 网络规划 . 33 4.1.1. 无线网络容量规划 . 33 4.1.2. 切片资源勘查 . 36 4.2. 网络建设 . 39 4.2.1. MPLS L3VPN 订购开通 . 39 4.2.2. 站点智能验收 . 42 4.3. 网络维护 . 44 4.3.1. 告警监控 . 44 4.3.2. IDC 巡检 . 47 4.4. 网络优化 . 51 4.4.1. MIMO 天线权值智能优化 . 51 4.4.2. 无线网能效优化 . 54 4.5. 网络运营 . 56 4.5.1. 5G 切片业务开通 . 56 4.5.2. 投诉预处理 . 58 五、 总结与展望 . 61 缩略语与术语解释 . 63 参考文献 . 64 4 / 64 摘要 随着 5G 网络建设和业务发展逐步加速,在网络 运营 与 运维领域,运营商正在面对巨大挑战。一方面, 5G 在网络基础设施中引入 NFV、 SDN、云原生架构等新技术,运营商的网络 运营与 管理工作 的技术 对象已经与传统的 2/3/4G 时代大不相同。另一方面,纷繁的业务场景 组合 要求 5G 能够提供按需分配,实时响应、端到端保障的网络体验,运营商的网络管理目标也已从“确保网络运行稳定”向“高效支撑业务发展”转变。这些变化为网络 运营管理 工作带来了前所未有的复杂度,运营商存量 OSS 系统能力已难以满足 5G 网络的 运营 管理要求。 为了应对这些挑战,近年来,国际标准组织、各主流运营商和厂家 陆续 提出了自动驾驶网络 /随愿网络 /自治网络 /自智网络等 概念,并正在逐步开展技术探索和落地实践工作。当前业界普遍将运营商网络自动化 /智能化水平分为 L0-L5 共6 个等级(等级由低到高代表自动化 /智能化水平逐步提升)。并希望通过引入大数据、人工智能、数字孪生等 通用目的 技术,不断推动 通信网络智能化 等级向更高级别演进,最终实现零等待、零接触、零故障的全面自治的通信网络。 本白皮书聚焦于通信人工智能技术赋能自智网络,创造性提出自智网络立方体体系(后简称为自智立方体),并描述了基于自智立方体的自智网络实现框架与实施路径 。 自智立方体旨在帮助运营商明确下一代 OSS 系统在网络生命周期中实现全面智能化的演进目标、实现框架和实施路径,从而有力支撑运营商的自智网络目标从概念设计阶段向实际落地阶段迈进 。 同时,本文介绍了网 络数据中台、网络人工智能、网络数字孪生 3 大关键技术驱动自智网络发展演进 。 基于自智立方体体系以及三大关键技术助推,本文进一步介绍了通信人工智能赋能自智网络的相关典型案例。最后本文对自智网络的未来发展做出前瞻性展望。 5 / 64 一、 概述 1.1 自智网络 产生背景 5G 为了满足 不同 客户和应用场景对通信网络的差异化 服务能力的 需求, 在核心网引入 NFV 技术 ,传输网引入 SDN 的虚拟化技术、 无线 接入网 引入超大规模天线系统 等因素 使得 5G 网络的规模和复杂性急剧上升 。 同时 5G 切片的业务管理方式使得网络部署更加动态和复杂。这些都 大幅提升了 网络 运营 管理难度。面向新的网络功能和架构运营商需要 进一步提升 业务快速发布、网络状态实时感知、网络故障自动定位、业务流量精准预测、网络 和 业务 质量 自动优化 等能力 。传统人工主导的运维模式难以满足这些需求,需要引入新的理念和技术提升运营管理 效率。 能够 提供零等待、零接触、零故障业务服务 ,并 基于自服务、自组织、自保障的网络,即 自智网络 成为全球运营商共同期待的发展方向,也是 5G 时代运营商自身的 重要 核心竞争力 之一 。 自智网络的 核心是 实现 网络运营 管理 的线上化、自动化、智能化 ; 通过 B/O 域融合的大数据分析、结合应用场景的人工智能 、 网络数字孪生技术构建以客户体验为中心的网络 ; 实现配置管理自动化、业务编排自动化、运维诊断智能化等新型的运营 管理 手段。 日本乐天移动采用高度自动化的管理方式, 以 精简 的网络管理团队提供覆盖全日本的移动通信。美国 AT&T 多年来专注 提升核心网和接入网的自动化程度, 有效 提升 了 运营效率,节省运维成本 。国内运营商也积极参与 自智网络 的实践,面向 5G 网络全生命周期 不断 提升网络 运营 运维的智能化能力,推动 自智网络 向更高阶的意图驱动、完全自 智 演进。 6 / 64 1.2 自智网络 国际标准现状 自智 网络 理念在被提出时有不同称谓,包括 Autonomous Networks(AN) Autonomous Driving Networks(ADN)、 Automation Network 等 。 其核心理念较类似 , 均为通过人工智能等技术 的 引入 推动通信网络向自配置、自治愈、自优化、自演进的新一代网络发展。 下文如无特殊说明, 将以 “自智 网络 ” 一词统一 指代相关概念及 名称 。 目前 全球主要的行业、标准化组织都对 自智 网络开展研究并发布了相关的白皮书或研究报告。 TMF 率先提出 “ Autonomous networks” 的理念并于 2019 年正式发布了首个 自智 网络白皮书 1,对 自 智网络 的 提出的背景、理念与 框架, L0-L5 的 6 级 自动化程度评级进行了系统阐述,并 通过不同维度的应用案例 辅助说明 自智 网络 理念 。 2020 年 10 月, TMF 发布了名为 Autonomous Networks: Empowering digital transformation for smart societies and industries 的第二版白皮书,进一步从电信运营商为社会及其他行业提供数字化转型服务的角度阐述了 自智 网络三层四闭环的理念。 2021 年 9 月和 11 月 TMF 先后 发布 了 名为 Autonomous Networks: Empowering digital transformation 的英中文白皮书 。 TMF 也 发布了自智网络的系列 研究报告 5 6 7 8,全面 阐述了自智 网络愿景路标、等级评估指导、业务需求与框架、技术框架 等内容 。 GSMA 在 2019 年发布了名为 “ AI & Automation: An Overview” 的研究报告, 主要包含 智能网络的基本概念、架构、 AI 技术如何分级逐步实现智能网络以及 部分 应用案例。 同年 末, GSMA 发布了 “ AI in Network Use Cases in China”的白皮书 14阐释了智能自治网络的概念 及 需求、智能自治网络的总体规划 以及 与 7 / 64 TMF 自智 等级 评级方法类似的评估框架。白皮书还 介绍 了 中国通信产业界在 网络规划建设、网络维护监控、网络优化配置、业务质量保障提升、网络节能增效、网络安全防护、网 络 运营服务 等 七个领域的二十余个 AI 技术提升网络自动 化 的案例。 ETSI于 2020年发布了名为 “ Autonomous Networks, supporting tomorrows ICT business” 的白皮书 4。 从业务需求的 “ Zero-X” 即运营商 希望 提供零等待、零接触、零故障的业务服务为需求出发点 , 引入了 “ Self-X” 即自配置、自治愈、自优化的 自智 网络。 白皮书也 介绍了类似于 TMF 的 L0-L5 的 6 级 自智 等级 评估框架。在白皮书最后举出了部分应用案例,包括端到端 自智 传送网、固网自动化、网络资源编排自动化、无线网络覆盖优化与保障、无线网节能、智能网络切片等。近年 ETSI 来也开展了 与 自智 网络密切相关的 零接触网络及服务管理 、意图驱动网络等多项研究及标准制定 工作 。 3GPP SA5 于 2019 年 5 月启动了名为 “ Study on concept, requirements and solutions for levels of autonomous network” 的研究项 2。 该研究包括了 自智 网络的定义、标准工作 流程 、自动化评级方法以及相应的应用案例。在 2020年 7 月 , 3GPP 在 R17 版本就 自 智 网络 分级体系 完成 了正式 标准 立项。主要目标为对 自 智 网络理念及架构,自动等级分级方法 等内容 进行标准 化 。同时 3GPP SA5 也 持续 开展 多项与自智网络密切相关的标准化工作, 包括意图驱动 管理 、 闭环管理控制、 管理 数据分析 服务 等。 ITU-T 于 2020 年发布 了 名为“ Framework for evaluating intelligence levels of future networks including IMT-2020” 的 Y.3173 标准 3, 该标准 主要内容为 定义了评估网络智能化的 相应 标准。 包括“需求映射、 数据采集、分析、决策、方案执行的”相应工作方法,并就 L0-L5 等级评估原则进行了介绍 。 总体而言 ITU- 8 / 64 T 的网络智能等级评估方法与 TMF 的 自智 网络等级评估方法类似。该标准的附录中也 介绍 了网络覆盖优化、告警根因分析及故障恢复、网络资源维护与管理、端到端 IoT 业务等智能化、自动化 案例 。 同时 ITU-T 下设 了 焦 点组 FG-AN, 旨在探索和研究 自智 网络相关的体系结构、关键技术、数据集和概念验证 并负责 起草 自智 网络相关的技术报告和规范 。 中国通信标准化协会( CCSA),于 2020 年立项信息通信网运营管理智能化水平分级技术要求 移动通信网 10,该标准的主要目的为 制定 移动通信网络运营 管理 智能化水平的分级方法,将其用于评测和度量移动通信网络运营管理的智能化水平,给出可量化的分级评测结果,促进运营商网络运维的智能化水平的逐步提升。标准主要内容包括移动通信网络运营管理智能化水平分级的概念、总体方法、运营管理智能化需求、用例和通用流程 等 。 1.3 全球主流运营商及业 界在 自智网络 方面的创新 自 2019 年 自智网络 理念提出以来, 在 全球 ICT 产业界迅速形成了共识,国际主流运营商、设备商纷纷发表了自己的白皮书或研究报告 , 学术界 也 就 自智 网络对未来通信 发展 影响 开展 研究 。 中国移动于 2021 年正式发布了其 自智网络 白皮书 11( 发布时使用 “动驾驶网络” 名称 ) ,介绍了 自智 网络 的背景与驱动力、提出了“三层四闭环”的内部实践目标框架,建立了“分级评估与短板识别”、“系统建设与规范引导”、“应用试点与复制推广”量化迭代闭环方法 。 并对其内部的 6 个重点运维场景、 5 个重点网络专业、三大类重点业务分别进行了 自智网络 等级评估。 白皮书重点 介绍了中国移动在网络管理和业务管理层面提出的“ 2+5+N”的网管总体规划以及中国移动的运维智能化 AI 应用体系 。 白皮书 最后展示了中国移动 7 项智能化、自动化 9 / 64 最佳实践。中国移动 也是业界首个 设定了其网络运维 自治 水平在 2025 年达到 L4目标 的运营商 。 中国电信 于 2019 年发布了 中国电信 人工智能发展白皮书 12, 从自身业务发展、网络演进和用户感知的需求出发,全面系统阐述了中国电信应用、发展人工智能技术的愿景与顶层设计 。 介绍了中国电信人工智能发展的驱动力、发展目标、演进路线、切入领域与关键举措。 在 自智网络 方面,中国电信首先引入随愿意图网络理念,实现了云网资源按需服务,这是迈向网络 自智 的关键一步。 “随愿网络”的概念主要是指跨网、跨域的高层智能联网,应用层只需简单的用自然语言表达希望网络完成什么,网络就能将上述意愿转换成具体策略,并自动根据相应策略在复杂和异构环境下完成跨网跨域的网络配置,实现应用层的商业目的。“随愿网络”可以加速数字转型、云化进程、物联网发展,同时更好应对网络面临的各种挑战。业界期望使用“业务意愿”作为网络和 IT 基础设施生命周期管理的驱动因素,通过自动化方式将业务需求即时转化为网络和 IT 基础设施的执行,实现两者的快速适配,从而产生真正的商业价值。 中国联通于 2020 年发布了 中国联通 自动驾驶网络 白皮书 13首次提出网络 智能化 “分级评估体系” , 该体系基于网络全生命周期活动 , 定义分级评估标准、评估方法和关键指标 , 明确了网络 智能化 演进方向 , 指导并牵引网络自动驾驶水平迭代提升。 2021 年 12 月,中国联通又正式发布了 中国联通自智网络白皮书 2.0 16, 提出了中国联通自智网络“ 1+3+X”发展思路,明确了“应用层-平台层 -网络层”的分层目标架构,总结了“三位一体”实施方法体系,还分享多个领域多个流程的创新场景以及未来架构演进的 5 个关键技术。 中国联通结合分级评估体系、产品研发流程和达标赋能活动 , 构想了三位一体的方法论 , 初步实现和部署了相应的应用平台。一是 自智网络 分级评估 , 打开一线作业流程 , 识 10 / 64 别出关键任务 。 对省分公司的现状进行评估 , 识别短板 , 明确改进方向。二是网络产品研发 , 依据分级评估输出 , 有策略有计划进行网络运营智能化产品研发规划 , 迭代实现 自智网络 目标能力。三是推行达标赋能 , 通过达标赋能活动 , 对各省分公司智能化 /自动化产品应用进行考核牵引 。 推动产品进入生产流程中 , 提升自智网络 能力 。 5G 时代,通信网络基础 设施逐步从专用硬件平台向通用硬件平台迁移 ,基于 x86、 ARM 等架构的 基础硬件被广泛采用。 Intel 为了满足移动通信网络人工智能应用对底层软硬件计算平台的需求,一直以来都致力于能够通过软硬协同来推动人工智能和数据分析的创新 。 从制程和封装、架构、内存和存储、互连、安全和软件等方面 助力 产业计算性能 提升 。 在 AI 领域, Intel 以内置 AI 加速的至强可扩展处理器为基础,提供全面的 XPU 芯片平 台。而在软件层面 Intel 打造了从 oneAPI 到 OpenVINO、 BigDL、 Analytics Zoo 等众多软件工具。 为实现 自智网络 的等级提升提供了一整套 基础 解决方案。 11 / 64 图 1-1 Intel 人工智能关键 产品 组合 1.4 网络管理系统 自智 等级分级总体方法 目前整个产业界已经对网络管理运维系统的 自智 等级分级方法达成初步共识,根据专业技术人员、 OSS 系统不同的参与程度, 按照下文所述的 实施路径 五步法的顺序将 整体分级方法 整理为 下表: 其中: “人工”表示相应工作由网管系统专业技术人员完成 “人工 +系统”表示相应工作由网管系统辅助专业技术人员完成 “系统”表示相应工作由网管系统自动完成 12 / 64 自智网络 分级 工作流程 意图管理 数据采集与感知 分析 决策 执行 0 级 人工 人工 人工 人工 人工 人工 1 级 系统辅助人工 人工 人工 +系统 人工 人工 人工 +系统 2 级 部分 自智网络 人工 人工 +系统 人工 +系统 人工 系统 3 级 有条件 自智网络 人工 系统 人工 +系统 人工 +系统 系统 4 级 高级 自智网络 人工 +系统 系统 系统 系统 系统 5 级 全 自智网络 系统 系统 系统 系统 系统 表 1-1 自智网络 等级 L0-人工:系统提供辅助监控能力,人工进行所有任务处理 。 L1-系统辅助人工:系统根据提前配置的规则执行某些子任务用以提升运维效率。 L2-部分 自智网络 :在部分环境下部分运维子系统能够实现闭环管理 。 L3-有条件 自智网络 :基于 L2 的能力,在某些网络领域,系统能够自主感知环境变化,不断自我调整优化从而支持基于意图的闭环管理。 L4-高级 自智网络 :基于 L3 的能力,在一些更为复杂的跨域环境中,系统能够基于预测以及主动的闭环管理实现自动分析 及 决策。 L5-全 自智网络 :电信网络的终极演进目标,系统在网络全生命周期中能够实现复杂的跨域完全自动化。 1.5 自智网络 实施路径 五步法 按照 自智网络 等级定义, 运营商 网络智能化演进目标是: 主动感知、主动学习、自主决策的 L5 级全 自智 网络 。为了实现这一目标,需要对 日常繁杂的工作进行有效的分解。下图所示的 5 步分解方法 是 提炼 各项 工作的核心内容 的 通用工作流程。 13 / 64 图 1-2 自智网络 任务流程 意图管理 :若干将来自运营商以及客户的服务意图翻译成一系列的管理运维行为的任务,意图管理将影响到后续的环节,同时将得到执行端的反馈形成闭环 。 数据采集与感知 : 若干用于监控网络的任务(包括网络性能、网络异常情况、日志等) , 并将数据进行初步处理 。 分析 : 若干用于分析网络的任务,或者基于网络的历史数据对未来趋势进行预测,并给出决策的建议。 决策 : 若干经过评估后对网络进行必要的管理操作的决策任务,例如网络配置或调整 。 执行 :若干对决策确认的操作 进行 执行的任务 。 对于日常工作流程的任务拆解参考 TMF 的相关研究报告 9,遵从 以下 三个原则: 完整性:所有操作维护动作必须要能拆解到上述的五个步骤中 平衡性:各个任务的大小和粒度必须基本一致 14 / 64 互不重叠性:各个任务需为原子粒度,承载的功能互不交叠 二、 自智 网络 实现框架 与 实施 路径 移动通信与人工智能技术的发展已各自走过了 37 年与 64 年的历程,两者在各自的早期阶段有着鲜明的、各自独立的发展路线。移动通信技术从 2G 到 5G的发展,工业界基本以 3GPP (The 3rd Generation Partnership Project) 作为事实技术标准的一条主线进行演进,以 ETSI (European Telecommunications Standards Institute), ITU (The International Telecommunication Union), O-RAN (Open RAN Alliance) 等其他技术标准作为旁线补充 15。从 2008 年,以自组织网络 SON (Self-Organizing Networks) 技术作为一个显著标志, 3GPP 开始逐渐将人工智能理念引入移动通信网络的技术标准中。 2017 年,随着 5G 核心网的智能化网元 NWDAF (Network Data Analytics Function)的研究启动, ETSI 体验式网络智能 ENI (Experiential Networked Intelligence)工作组 的成立, CCSA 人工智能在电信网络中的应用课题研究启动等事件,通信人工智能进入了飞跃性发展的阶段,通信人工智能已被业界视为最新的 一组通用目的技术组合,对百行千业的发展起到提振生产力与赋能作用。 2019 年, TMF、 GSMA、 ETSI、 3GPP 等国际标准组织定义 自智网络 并设定分级,其 实施 的路径与方法论并不是简单的堆砌网络智能化软硬件产品。为实现并不断提升网络自动化智能化水平,需 明确 自智网络 的 实施 路径与方法论,即坚持一个核心方法主旨,以通信领域知识 +AI 专业知识为基础,构建网络人工智能中台 ; 以数据中台的网络大数据为燃料围绕网络生命周期中的规、建、维 、优 、营 等场景,不断构建、推理、发布、沉淀出网络 AI 算法模型,为 4/5G 网络提供包括异常检 测、容量预测、网络优化、根因分析、告警预测、故障自愈、业务编 15 / 64 排、感知优化等网络 AI 功能,全面提升网络自动化与智能化能力。 本白皮书明确提出了 自智网络 的 实施 路径与方法,将通信运营商规划、建设、维护、优化、运营全生命周期管理流程与 OSS 系统以及自动化等级三者有机结合,形成了基于国际标准的一套可度量、可实施、可追溯的 自智网络 体系框架 。 白皮书聚焦于通信人工智能技术赋能自智网络,旨在帮助运营商明确下一代OSS 系统在网络生命周期中实现全面智能化的演进目标、实现框架和实施路径,从而有力支撑运营商的自智网络从概念设计向实际落地 不断 迈进 。 2.1 网络 运营 管理生命周期 运营商的网络 运营管理 工作伴随着网络和业务的各个发展阶段。主要包括:规划 、 建设、维护 、优化、运营 5 个主要环节 。 规划:支持规划目标建立、规划方案设计、规划仿真 的 全流程 管理工作 。支持从网络整体表现、产品运营战略、业务使用体验提升等角度建立规划目标 。 通过连通规划目标和规划方案的能力(包括拉通环境数据、业务需求数据、资源数据的多维度分析能力),实现业务覆盖、容量、 带宽 等规划目标 。 通过仿真能力,实现规划目标的仿真验证。 建设:支持建设项目的立项、设计、验收 的 全流程 管理工作 。根据规划设计完成交付、配置、以建设目标为基准完成网络能力、可用性等具体指标的验收。除以上整体流程外, 相关 环节也可以通过自动化工具实现能力提升,包括自动化交付配置、自动化验收测试和闭环调整。 维护:对网络整体表现、产品运营表现、业务使用体验、资源健康度进行管理、监控、分析。通过被动的监控和处理,或者通过对故障告警和性能劣化的主动感知分析以及自动化的资源调整实现网络、业务的恢复。通过售前、售中、售 16 / 64 后的端到端支撑能力,提供贯穿于运维各项生产环节的自动化运维感知和决策信息的流转能力。 优化:支持根据规划部门、市场部门、服务部门、运维部门的需求建立优化目标、输出优化方案、执行优化流程。支持基于网络整体表现、业务使用体验、资源健康度等不同维度设定优化目标 。主要手段包括 通过优化方案设计能力输出常态化或专题类优化方案 、 通过优化分析工具执行优化方案 等 。 运营: 支持市场部门设定的优化市场战略,支持产品设计、订单接收、流程分析以及业务在网络中的配置、激活、上线、扩缩容以及变更等全生命周期管理业务工作,同时也包含业务上线、变更带来的业务保障、端到端测试、质量监控、投诉预处理、客户服务、用户满意度保障等工 作内容,保障网络资源对业务的诉求提供可靠的能力支撑 。 2.2 运营商 OSS 体系 运营商为了在 5G时代进一步提升 OSS系统对于庞大网络的 运营管理 能力,纷纷提出了新一代 OSS 体系(各运营商的规划架构略有不同,下图是典型架构)。新的 OSS 体系中以网络数据中台、网络 AI 平台作为主要基础技术 支撑 平台,支撑 OSS 各类能力中心,主要包括: 设计编排系统:为了适应 5G 应用场景多样,业务需求多变的实际情况,设计编排系统提供通用设计工具,支持快速完成业务功能、网络能力、资源关联、调用接口等设计工作。同时基于设计结果快速的完成业务、网络、资源的组合和生命周期流程编排。实现灵活的业务发放和网络资源调用。 资源管理系统: 通过实现通信网络全专业网络资源数据管理、资源入网、 17 / 64 调度、分配、核查、变更,端到端网络资源拓扑视图等应用,提供数据服务能力统一封装开放 。 故障管理系统 : 实现网络集中监控,包括网络与业务端到端监控和故障闭环管理等应用,提供网络监控开放能力 。 性能管理系统: 实现网络与业务质量的端到端分析,实现各类容量、质量、效率、效益主题分析应用 。 运维调度系统:实现运维人员和任务、网络割接、运维等统一集中调度管理,流程管理。提供自动派单、知识推送等服务,通过统一流程引擎实现进度可视。 网络规划优化系统: 基于网络数据中台, 集中于网络规划与质量优化,开放分析和优化能力,闭环注智生产流程 。 网络数据中台: 通过统一数据采集、处理与共享, 打破 系统间的信息壁垒,实现网络域及外部数据的融合、汇聚、存储,为网络应用提供统一、高效、低成本的数据服务 。 网络 AI 平台:通过网络数据中台从各网元或网络系统统一收集数据信息,基于 自智网络 的各领域模型按需进行 AI 训练,实时及离线推理,向各网络智能化应用注智赋能。 18 / 64 图 2-1 运营商 OSS 体系与 自智网络 核心技术组合 2.3 自智网络 立方体 通信网络已经成为社会 生产 和 生活 不可或缺的基础设施,运营商在确保通信网络平稳运行的基础上需要更多的关注网络自身的安全性以及客户体验 。 需要彻底改变传统的基于故障监控、性能指标分析的人工式、粗放式运维模式,转向融入大数据分析、人工智能技术,特别是基于业务场景体验的智能化、精细化 运维模式 ,从而 满足客户的不同需求。 如何通过自动化、智能化的手段提升网络效率以及业务效率成为全球运营商关注的焦点。为了实现 自智网络 L5 等级网络高度自治、意图驱动的终极目标,首先运营商需要精确细分网络 运营管理 工作中的具体场景和任务,进而全面评估当前全量运营运维场景、任务的 自动化程度,最后通过对高等级 自动化 网络的 演进 路径 的 准确刻画,清晰有效的指导网络 运营 管理,从而实现网络自动化、智能化演进的蓝图。 面对运营商 种类繁多 的网络运营运维场景, 亚信科技联合合作伙伴首次提出 了 自智 立方体 的体系架构,用于定义网络全生命周期各个细分的运维场景和任务、评估其智能化能力、并 明确 相关的演进路径。该体系架构参考了国际标准组织的业务场景分类方法,如 ITU-T 的 FCAPS 模型, 19 / 64 TMF 的 eTOM SIP-FAB( S)模型,同时结合了国际运营商的业务管理流程,如 AT&T 的 COMP 模型,围绕运营商网络运维管理全生命周期业务流程,按照 自智网络 的分级进行业务功能的定义,涵盖网络数据中台、网络AI 平台、设计编排系统、资源管理系统、故障管理系统、性能管理系统、运维调度系统、网络规划优化系统等主要支撑系统的分级演进规划。 图 2-2 自智 立方体 自智 立方体 由 3 个维度组成: 网络运维生命周期:运营商网络运维管理生命周期分为 “规划、建设、维护、优化、运营 ”五个环节。 自智 立方体 将网络运维管理生命周期作为一个坐标轴,每个环节对应该坐标轴的一个刻度区间。 OSS 系统:运营商主要的 OSS 系统包括 “网络 数据 中台 、 网络 AI 平台 、 设计 编排系统、资源管理系统、故障管理系统、 性能管理系统 、运维 调度 系统、网络规划优化系统 ”等,各个系统是网络运维生命周期中各项自动化、智能化能力的软件载体。 自智 立方体 将 OSS 系统作为一个坐标轴,每个具体系统对应该坐标轴的一个刻度区间。 20 / 64 自智网络 等级: 自智网络 L1-L5 分级作为 自智 立方体 的一个坐标轴,每个级别对应该坐标轴的一个刻度区间。 L0 级不涉及自动化 /智能化操作,所以在该坐标中不体现。 如上三维体系构建了 5( 5 个网络运维生命周期环节) x 8( 8 类 OSS 系统) x 5( 5 个 自智网络 等级) 的立方体集合,其中每个立方体单元代表网络运维生命周期各环节,与承载相关自动化 /智能化功能的 OSS 系统,及其能达到的 自智网络 等级三者之间的明确对应关系。 图 2-3 自智网络 运维生命周期展开 2.4 自智网络 功能与场景全集 基于 自智 立方体 ,进一步将每个立方体单元中涉及的具体工作环节进行细化,将运营商 “规建维优营 ”细化为 48 个子场景。每个子场景按照 2.3 节归纳的 5 步法,再细分为共计 551 个工作任务。每个工作任务与承载相关功能的 OSS 系统一对一对应。并明确每个工作任务在 L1-L5 等级中的自动化 /智能化实现目标。即 帮助 运营商 明确 具体工作任务与实际 承载 系统之间的关系,及自动化 /智能化演进路径。 上述子场景及工作任务 也 可以 依照运营商自身特点灵活创建。 21 / 64 图 2-4 自智网络 任务 分解 在 自智网络 各等级中,每个子场景对应多个工作任务,对 OSS 系统提出不同的自动化 /智能化需求。通过在 自智 立方体 中选择某个具体的子场景和对应的等级, 即可 清晰的呈现 OSS 系统 要 实现的具体功能和自动化 /智能化水平。 此时工作任务中将呈现具体的工作内容,可以帮助运营商快速发现该任务的自动化水平,这样可以追溯到未达到高阶 自智 的原因,为后续 OSS 能力提升提供依据。 图 2-5 自智 网络具体任务分析 通过上述方法,运营商可以有序的将日常工作进行分解,并迅速定义其自 22 / 64 动化能力,从而完成全局演进的精准洞察。 2.5 OSS 智能化 能力提升支撑 自智网络 等级演进 通过 自智 立方体 体系框架 ,运营商可以对网络全生命周期工作分解细化,并确定其自动化 /智能化演进情况,有效指导 OSS 系统建设,使能网络 自智 水平不断提升。 图 2-6 自智网络 等级 演进 与 OSS 系统功能对应关系 上图中 自智网络 由低到高的等级演进过程中,人工操作完成的工作逐渐减少,系统自动化完成(由各类 OSS 系统承担 的自动化、智能化功能 )的操作逐渐增多 。在这个过程中,各类 OSS 系统覆盖的自动化功能数量变化趋势不同 : 网络数据中台:初期建设阶段( L1),主要工作是通过数据统一接入与共享来满足规、建、维、 优 、 营 等 对数据采集与感知方面的需求,主要工作体现在打造数据共享平台基础功能、数据接入、模型建设和数据共享,平台自身运维和业务对接,还是系统伴随手工结合的方式进行;中期阶段( L2-L3),数据共享平台功能进一步完善,数据基本可以全面覆盖 ,结合自身功能以及 AI能力,系统运维和数据相关功能具备一定的自动化和智能化;后期阶段( L4- 23 / 64 L5),配置和数据操作全面自动化,平台与先进的 AI 算法紧密结合,为全网络全专业提供全自动化智能数据服务。 网络 AI 平台: 初期建设阶段( L1-L2),建设 AI 基础平台,针对网络规划、运维、优化等领域进行专题化 AI 能力支撑与 能力初步 积累,打造针对网络域各系统的 AI 服务与数据对接能力,利用 AI 推理服务支撑部分系统应用;中期阶段( L3-L4),继续增强 AI 平台功能,全面支持在线分析能力,结合全域数据支撑,依照网络 AI 信令标准完成对网络域系统的自动化注智;后期阶段( L5), AI 平台能力完全体系化、标准化, AI 算法成熟稳定,全面支撑网域各系统的高度智能化自治。 设计编排系统 : 设计编排系统致力于解决原有 OSS 系统中分散的业务开通能力,希望通过对网络资源、服务和业务的逐层建模,以及对业务流程模板的设计,实现集中化的业务开通以及低代码或零代码的新业务扩展。 L1-L3级的设计编排系统可以根据设计输出的业务流程包,在完成订单匹配后,自动化完成勘查开通流程的运行,但是流程 中存在 部分 人工介入环节,包括人工线下勘查、手工的方案设计、手工环节审批等。 L4-L5 级的设计编排系统,通过对网络设备的容量和状态数据进行采集,配合勘查算法,可实现自动化的资源勘查,通过对业务环节和审核算法制定相关的处理策略,可实现自动化的审核。引入人工智能算法,依据切片业务需求和网络现状,可实现复杂业务的自动化方案推荐,从而贯通自动化设计、自动化勘查和自动化开通 。 资源管理系统 : L1 级的资源管理系统实现空间、管线、设备数据的全量采集。基于网络数据的纳管, 构建 全网资产数据 的 管理能力,从而让资产更直观、管控更及时。 L2 级的资源管理系统 基于 GIS 能力 提供 全网 资源 及网络拓扑 的可视化呈现 ,支持网络 /业务覆盖的可视化等应用能力。 L3 级的资源管理系统通过统一 24 / 64 的模型和接口为故障管理、性能管理等 网络能力中心 提供资源数据服务 ,如资源查询服务,入网资源、割接资源、故障处理等资源变更服务 。 L4 级的资源管理系统实现资源的自动 识别、 核查 和智能分配,支持包括资源勘查、资源配置、故障定位的资源全生命周期管理 。 L5 级的 资源管理系统基于网络数字孪生 打造 虚实互动的网络资产, 通过智能化孪生体的构建实现 透明、全息的网络资源 ,支撑网络自治愈等应用场景 。 故障管理系统: L1 级的故障管理系统支持基于人工指定的过滤规则,分析过滤无效告警、冗余告警、 进行 告警归一化、告警压缩、告警与资源关联、告警派单 ; 执行告警清除、故障恢复验证测试等操作。 L2 级的故障管理系统在L1 级基础上支持人工设定的故障恢复方案并自动执行、基于人工指定的故障定界规则发现网络设备的故障、基于人工指定的分析规则自动分析实现故障定界。 L3 级的故障管理系统在 L2 级基础上支持 AI 驱动的告警过滤、基于人工指定规则的端到端业务 SLA 恢复方案生成、基于故障定界结果以及故障相关数据进行故障根因判断、 AI 驱动与人工审核 相结合实现 告警恢复方案生成 与执行 。 L4-L5 级的故障管理系统在 L3 级基础上支持基于人工指定的意图管理策略实现故障管理策略生成、基于 AI 驱动告警策略生成自动化、常规原因 SLA 故障恢复自动化、客户意图的业务 故障预警与端到端网络自动调整、基于 AI 驱动的故障管理意图达成评估自动化。 性能管理系统: L1 级的性能管理系统以手动收集数据、进行表格化的粗粒度统计为主,在部分场景里融合少量的人工分析; L2 级的性能管理系统可以基于部分固定的业务场景(如 4G 业务网元质差定界)进行半自动化的流程分析,能够按照配置好的分析流程输出能力结果,但无法自动对外界的信息变化(如业务变更、网元故障下线等)作出分析流程和维度的优化和调整; L3 25 / 64 级的性能管理系统可以感知系统的外界条件变化进行对分析和执行策略作出一定程度的改变(如性能动态阈值); L4 级性能管理系统支持复杂的网络问题根因溯源和投诉处理等,自动化的分析网络运维的短板,根据网络基础能力制定个性化维护策略并自动化下发到相应的动作执行单元,实现事前事后的主动闭环管理; L5 级性能管理系统可以支持全部性能闭环管理工作的自动化,包含日常网络性能降质分析、问题定界、故障修复以及客户投诉预处理等,完整的实现意图采集、数据感知、分析、决策,以及动作全生命周期自动化执行。 运维调度系统 : L1 级的运维调度系统支持基于人工定义的工作流方式的运维流程,支持网络维护、网络排障、上门施工等系统自动工单和人工工单流程。满足网络运维流程自动化的基本需求。 L2 级的运维调度系统支持基于规则模板定义的流程派发业务逻辑,基于任务上下文由流程编排人员自定义流程分支,实现基于规则的自动化的派单流程。 L3 级的运维调度系统引入 RPA 增强流程自动化和外部对接能力,针对人工类工单为执行者提供智能工具集。L4 级运维调度系统支持全自动化的闭环运维流程处理,基于人工智能训练的规则输出,并实现和人工智能推理对接,实现智能化的流程分支和 环节处理。L5 级运维调度系统可以支持全部运维环节自动化,并实现运维的意图采集、数据感知、分析、决策,以及运维动作的执行。 网规网优系统 : L1 级网规网优系统 所有工作任务 ,优化数据均以 OSS 系统
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642