资源描述
人工智能助力网络智能化中兴通讯人工智能白皮书 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第1页 人工智能助力网络智能化版本 日期 作者 审核者 备注V1.0 2018/2/6 ZTE ZTE 2018 ZTE Corporation. All rights reserved.2018版权所有中兴通讯股份有限公司保留所有权利版权声明:本文档著作权由中兴通讯股份有限公司享有。文中涉及中兴通讯股份有限公司的专有信息,未经中兴通讯股份有限公司书面许可,任何单位和个人不得使用和泄漏该文档以及该文档包含的任何图片、表格、数据及其他信息。本文档中的信息随着中兴通讯股份有限公司产品和技术的进步将不断更新,中兴通讯股份有限公司不再通知此类信息的更新。 中兴通讯人工智能白皮书 第2页中兴通讯版权所有未经许可不得扩散 目录人工智能助力网络智能化.11 前言.82 通信行业智能化趋势和挑战.8 3 中兴通讯人工智能解决方案.103.1 中兴通讯对未来智能网络的思考.103.1.1 AI 对基础设施层的影响.113.1.2 AI 对网络及业务控制层的影响.113.1.3 AI 对运营及编排层的影响.123.1.4 中兴通讯三级智能闭环建议.13 3.2 中兴通讯人工智能架构及端到端实现.143.2.1 中兴通讯 uSmartInsight 人工智能系统架构.153.2.2 基于 uSmartInsight 的人工智能端到端实现.164 中兴通讯人工智能典型应用场景及价值.184.1 智能化 5G.19 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第3页 4.1.1 5G 网络智能.194.1.2 5G 智能垂直应用.214.2 智能运维.224.2.1 智能故障溯源.234.2.2 智能健康度预测.244.2.3 智能工单管理.26 4.2.4 智能 DevOps.274.3 智能优化.284.3.1 无线覆盖智能优化.284.3.2 有线智能流量预测及路径调优.304.4 智慧运营.314.4.1 多维价值智能分析.32 4.4.2 智能运营辅助.344.5 智慧家庭.354.5.1 智控机顶盒.354.5.2 智能摄像头.365 网络智能化建设展望.36 中兴通讯人工智能白皮书 第4页中兴通讯版权所有未经许可不得扩散 6 缩略语.38 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第5页 图目录图 3- 1 人工智能对未来网络架构各层级的影响.10图 3- 2 中兴通讯网络智能三级闭环.13图 3- 3 中兴通讯 uSmartInsight 人工智能架构.15图 3- 4 人工智能端到端实现流程.17 图 3- 5 分布式训练引擎的并行训练加速比.18图 4- 1 智能化 5G 网络切片.19图 4- 2 5G 智能波束赋形.20图 4- 3 故障溯源方案示意图.23图 4- 4 故障预测方案示意图.25图 4- 5 智能工单管理方案示意图.27 图 4- 6 无线覆盖智能优化方案示意图.29图 4- 7 智能流量预测及路径调优方案示意图.30图 4- 8 智慧运营多维价值智能分析示意图.32图 4- 9 智能客服 iQA 系统示意图.34图 4- 10 小兴看看智能监控示意图.36 中兴通讯人工智能白皮书 第6页中兴通讯版权所有未经许可不得扩散 表目录表 3- 1 三级智能闭环特点及选择策略.14 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第7页 中兴通讯人工智能白皮书 第8页中兴通讯版权所有未经许可不得扩散 1 前言人工智能 AI(Artificial Intelligence),作为未来十年最具冲击力的科技发展趋势之一,将为各行各业带来巨大变革。随着计算力的进步,算法的精进和创新,以及移动互联网发展下的海量数据积累,在历经六十载沉浮之后,人工智能技术在近十年焕发出新的活力。当前,人工智能在图像、语音、文本处理等领域的应用日趋成熟,对生产效率的提升能力和商业价值正被越来越多的行业所重视,比如:语音识别、人脸识别、计算机视觉、自然语言处理等人工智能基础技术,越来越多地被相关领域产品所集成。同时,在垂直行业应用方向上, 比如信息和通讯、工业制造、安防、金融、自动驾驶、医疗健康等众多领域,人工智能也正在带来生态和商业模式的全新变革。中兴通讯高度重视人工智能技术在多个行业领域的研究和创新,在人工智能基础技术领域,已持续多年投入,并在电信、公共安防、智慧交通、智慧金融、机器人运动智能等多领域开展应用创新和实践。基于对电信领域的深刻理解和多年经验积淀,中兴通讯推出 uSmartInsight 人工智能解决方案,依托自研的 uSmartInsight 平台,提供完备的大数据、大算力、大算法能力,助力电信 运营商构建面向未来的、高度自治的智能网络演进蓝图。2 通信行业智能化趋势和挑战在电信领域,随着 ICT 产业链架构融合的逐步深入、网络云化重构转型的加快以及更多新制式和技术的演进,电信运营商在网络运营方面将面临越来越大的压力和挑战,尤其是在如何 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第9页 有效降低运营成本、提升网络运维效率及便捷性、提升业务和资源编排精准性等方面,以人工方式为主的模式已不足以支撑未来网络对高效运营的需求。近年来,电信运营商在提升网络智能化建设方面持续投入,积极探索和实践包括大数据等在内的高效、智能的分析手段和技术。人工智能在越来越多的复杂场景下可以做出比人类更优的决策,无疑让网络智能化建设开拓了新的视野,给网络的发展带来了前所未有的新机遇,也为电信网络重构转型过程中遇到的众多困难和挑战,提供了高效的加速路径,比如:5G 宏微站、高低频、4G/5G 协同,无线覆盖和容量的自动调优,云化分层解耦架构下的故障分析、RCA 定 位、自愈与预测,按需网络的资源智能化编排和管理,智能化能耗管理等等。国内外主流运营商在人工智能应用的探索上,也纷纷实践各自独特的思路和想法,积极投入跨界创新,通过人工智能、大数据、无人机及 IoT 等技术的碰撞寻找切入点。国内三大运营商积极探索 AI 在 5G 智能化、故障预测、网络优化、智能客服等领域的应用。国际运营商方面,AT&T 采用创新的 UNI(UAS Network Inspection)应用,将无人机同智能运维结合,通过计算机视觉和图像识别技术,利用无人机实现塔台天馈系统的智能巡检和运维派单。德电将智能客服 Amelia 与 T-System 相结合,为行业客户提供更便捷的咨询服务等。Vodafone 为其网络 智能化,提出了智能排障、参数优化、业务预测、射频指纹等重要研究方向。智能化网络是未来网络发展趋势,网络运营和运维模式将发生根本性变革,网络将由当前以人驱动为主的人治模式,逐步向网络自我驱动为主的自治模式转变。未来,智能化网络将通过网络数据、业务数据、用户数据等多维数据感知,基于大数据、大算力和大算法三大基础能力,实现高度自治。同时,人工智能技术在电信领域的应用是一个长期的系统性工程,需要结合网络现状、云化转型进度、5G 及 IoT 等新技术引入进程、以及运营商网络演进策略等,分阶段逐步推进。 中兴通讯人工智能白皮书 第10页中兴通讯版权所有未经许可不得扩散 中兴通讯作为全球领先的综合通信解决方案提供商,5G 领先者,高度关注 ICT 融合以及云化背景下的电信运营转型和技术演进,积极参与标准规范制定以及开源技术研究。依托于uSmartInsight 人工智能解决方案,提供完备的大数据、大算力、大算法能力,助力电信运营商顺应趋势、迎接挑战,打造网络自治、预见未来、随需而动、智慧运营的智能网络。3 中兴通讯人工智能解决方案3.1 中兴通讯对未来智能网络的思考 未来网络的人工智能能力是泛在化的,可以根据不同的建设需求,在网络的不同层面,逐步分层引入 AI 能力。如图 3-1 所示,中兴通讯认为,网络的几大层面,如基础设施层、网络及业务控制层、运营及编排层,都将根据对智能能力的细化要求,逐步使能 AI。 图 3- 1 人工智能对未来网络架构各层级的影响对不同层级而言,越上层、越集中化,跨领域分析能力越强,通常对计算能力要求也越高,需要的数据量也越丰富,更适合对全局性的策略和定义集中进行训练及推理,这类场景对实时 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第11页 性要求一般敏感度较低;越下层、越接近端侧的,专项分析能力越强,这类场景通常对实时性有较高要求,但计算能力要求满足业务需求即可,一般适合引入 AI 的推理能力,或具备实时性能力的轻量级的 AI 训练能力。3.1.1 AI对基础设施层的影响基础设施层,主要包括:DC 云基础设施硬件,如服务器、存储设备、网络设备等;以及其他非虚拟化的基础设施,如无线接入设备等。 对于该层面的人工智能使能策略,主要是硬件设施本身,按需引入 AI 加速器,实现不同级别的训练及推理能力,比如核心 DC 的基础设施可以优先引入 AI 加速器,从而快速具备 AI 训练及推理能力,满足全局性的策略或算法模型的集中化训练及推理需求;接入侧设备,可随着5G 建设逐步叠加 AI 加速器,比如无线基站设备内嵌 AI 加速器,可支撑设备级嵌入式 AI 策略及应用的执行。AI 加速器的表现形态可以是多样的:可以是独立部署的 GPU/FPGA 的集群,可以是现有服务器的升级,比如单机内部按一定配比集成 CPU/GPU/FPGA,也可以是支持 AI的 ASIC 硬件等。 3.1.2 AI对网络及业务控制层的影响网络及业务控制层主要汇集了多维度的融合智能管控,实现对传统网络和 SDN/NFV 云化网络的统一管控,主要包含传统的 EMS、虚拟化的 EMS 及 VNFM、SDN 控制器等。对于该层面的人工智能使能策略,可以优先集成 AI 推理能力,对网络和业务实现智能管控,比如: 网络智能运维及智能调优,包含 RCA(根因分析)、网络优化、参数自动配置、传输路由智能调优等。 中兴通讯人工智能白皮书 第12页中兴通讯版权所有未经许可不得扩散 网络安全,包含通过机器学习实现快速的跟踪和过滤,规则提取,识别并拦截恶意行为、预防攻击等。同时,在该层面也可以考虑叠加轻量级的 AI 训练能力,用来满足变化快、实时性要求高的业务策略的控制需求。该层面的 AI 使能,可以大幅度降低网络的运维成本,并显著提升网络运维的效率和便捷性。3.1.3 AI对运营及编排层的影响 运营及编排层主要包括:业务和资源的设计、调度及管理,如全局业务编排(编排、激活、生命周期管理等),全局资源编排(NFV 资源编排、SDN 资源编排等),以及运营支撑相关的组件,如外部门户、工单系统、客户服务系统等,同时也包括专用的数据集中管理平台,如大数据系统,负责数据统一采集、统一存储、数据智能挖掘分析等。对于该层面的人工智能使能策略,如果运营商网络先期已经部署了成熟商用的大数据平台,可优先在大数据系统引入 AI 引擎,对 OSS 侧和 BSS 侧数据做更深度、智能化挖掘,从而指导运维和运营;如果还未部署大数据系统,可以优先考虑部署融合的大数据和人工智能平台产品, 实现设备层面、网络层面、业务层面、用户终端层面、运营层面及异厂家跨制式的全方位数据感知和分析,从而提升运营智能化。同时,随着 5G 及虚拟化网络的建设,编排系统可逐步叠加 AI 能力,提升产品编排、业务编排、端到端资源编排的自动化、智能化,通过动态的、智能的策略来实现网络的随需而动,同时对业务量的变化做前瞻性的智能预测,并动态规划、管理配套资源。另外,对于部分运营支撑系统,可按需引入 AI 基础技术和通用算法,提升运营效率,如智能工单及调度系统、智能语音客服系统等。 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第13页 3.1.4 中兴通讯三级智能闭环建议未来电信网络的人工智能能力泛在化,除了体现在各层级自身的人工智能能力使能外,还体现在跨层级的协同实现上。根据不同的成本规模、是否涵盖多系统多制式、是否端到端策略、数据量的大小、实时性要求高低等等,可以选择部署不同级别的智能闭环策略,灵活实现多维度的网络智能化。中兴通讯提出基于不同网络层级的网络智能三级闭环:智能自环、智能小环和智能大环,如图 3-2 所示。 图 3- 2 中兴通讯网络智能三级闭环 自环:基础设施自身的实时推理,比如基站,是由个体内部自主自动完成,不涉及外部模块调用。实现自环需要基础设施引入内置的人工智能能力。 小环:智能化过程中,数据训练主要由网络及业务控制层或运营及编排层完成,无论推理、实际 下发控制和执行由哪方完成,均称为小环。实现小环需要网络及业务控制层、运营及编排层引入人工智能能力。 中兴通讯人工智能白皮书 第14页中兴通讯版权所有未经许可不得扩散 大环:智能化过程中,数据训练主要由大数据或人工智能平台完成,实现基于全网数据的网络智能化,无论推理、实际下发控制和执行由哪方完成,均称为大环。实现大环需要部署大数据和人工智能平台。不同级别闭环的特点及选择策略对比,见下表 3-1。表 3- 1 三级智能闭环特点及选择策略 级别 成本 数据量 数据维度 实时性 多制式 端到端或异厂家 引入方式及对网络的影响自环 低 较低 网元级 高 N/A N/A 网元功能改造或网元硬件升级小环 中 大规模 网络级 中 支持 N/A 网管和控制器改造,或部署新型网管和控制器大环 高 超大规模 整网级多维度 低 支持 支持 部署大数据&人工智能平台此外,三级智能闭环涉及到基础设施、业务控制、编排管理以及大数据、人工智能平台之间的数据采集传递、策略下发实施、策略实施后效果的监控、策略的自动升级迭代等多种交互 需求,目前还缺乏统一的标准接口定义,中兴通讯将与运营商一起,共同探讨定义相关的标准接口。3.2 中兴通讯人工智能架构及端到端实现中兴通讯 uSmartInsight 人工智能解决方案,专注于为全球电信运营商和企业客户提供先进的数据管理和智能应用能力,满足全球运营商和企业客户的快速创新、数字化转型、智能化转型需求。 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第15页 3.2.1 中兴通讯uSmartInsight人工智能系统架构uSmartInsight 人工智能平台,同时融合大数据能力,是中兴通讯基于开源技术,同时整合多年项目实践经验和技术沉淀,提供的成熟商用平台,涵盖了数据采集、存储计算、分析挖掘、机器学习及深度学习算法框架、算法建模及评估发布、可视化展现、运维管理等全方位能力。并以此为基础,针对各行业应用,提供专业的、定制化的解决方案和技术服务。如图 3-3 所示,中兴通讯 uSmartInsight 人工智能系统架构,包括基础设施层、存储计算层、服务支撑层、应用层、及系统管理等多个层次。 图 3- 3 中兴通讯 uSmartInsight 人工智能架构 基础设施层支持 CPU/GPU/FPGA 等异构的基础设施,支持裸机、基于虚拟化的虚机、容器化等多种部署方式,可以帮助运营商根据自身需求,灵活选择部署方式。 存储计算层支持多种数据采集方式,提供完善的大数据 ETL 解决方案; 支持 HDFS 分布式文件系统,分布式数据库 RDBMS,集群资源管理; 中兴通讯人工智能白皮书 第16页中兴通讯版权所有未经许可不得扩散 支持批处理、流处理、交互 SQL、OLAP、分析挖掘等;支持 Hadoop, Spark,支持 Spark ML 和 MLlib 以及 deeplearning4j,Caffe on Spark,TensorFlow on Spark 等深度学习框架;支持主流的 TensorFlow、Caffe 等深度学习开源框架,并对开源框架做了大量自研的优化增强。 服务支撑层支持数据驱动的数据治理、实时数据生产和质量监控、完善的元数据管理、统一高效管理 数据、算法和任务;支持基于 OpenAPI 的数据开放、多租户管理;支持一体化可视化建模工具,支持模型探索、开发、部署,集成种类丰富的算法库,支持硬件加速;丰富的组件能力,提供丰富的基础技术组件,实现多应用方向的支持。 应用基于丰富的技术组件,支持面向各行业及垂直领域的丰富的应用集成。比如,以电信行业 为例,支持智能网络运维、智能网络优化、智慧运营、智能客服、智慧家庭等具体应用。 系统管理提供面向人工智能平台的系统安全管理和维护管理。3.2.2 基于uSmartInsight的人工智能端到端实现人工智能端到端工作流程,总体分为三大部分:数据处理阶段、AI 训练阶段和应用推理阶段,参见图 3-4 所示。中兴通讯 uSmartInsight 人工智能方案,基于大数据和人工智能融合平 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第17页 台,支持人工智能的端到端工作流程。 图 3- 4 人工智能端到端实现流程 数据处理阶段通过数据采集工具进行数据采集,并对采集到的原始数据如文本、图像或者应用数据进行清洗和预处理,清理异常数据,对数据进行标准化,最终生成高质量的数据供后续模型训练使用。 AI训练阶段 使用中兴自研的分布式训练引擎,可以高效完成超大规模的 AI 模型训练。引擎根据模型计算图特征、异构计算设备网络拓扑结构、参考历史性能数据,自动规划最优分布式计算方案,实现高效的自动化分布式训练。通过对异构计算模型、数据流水线的优化,达到较高的并行训练加速比。 中兴通讯人工智能白皮书 第18页中兴通讯版权所有未经许可不得扩散 图 3- 5 分布式训练引擎的并行训练加速比 应用推理阶段支持在云侧、单机和端侧内嵌等多种部署方案,满足客户多场景需求。比如:针对中心 DC,提供 GPU 加速方案,提供强大的处理能力;针对边缘 DC,提供 FPGA 加速方案,降低能耗,降低运营成本;针对端侧,实现模型在嵌入式设备上运行等。支持电信网络不同应用场景的推理平台部署,比如:支持大数据推理平台,实现智能运维 和运营支撑;支持网管单机推理平台,实现准实时推理;支持网元内嵌的实时推理等。4 中兴通讯人工智能典型应用场景及价值人工智能技术的优势,如何在电信领域得以真正切实的体现,需要以合适的落地场景为抓手。中兴通讯基于在电信领域的长期积累、对行业的深刻理解以及丰富的全球合作经验,并依托中兴通讯 uSmartInsight 人工智能系统的端到端能力,为电信领域的人工智能应用落地,提 供完善的支撑。本章节选取部分典型应用场景加以介绍。 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第19页 4.1 智能化5G4.1.1 5G网络智能5G 时代,通讯网络的演进日益智能化,网络各层都将具备智能化和自动化的能力,这对于网络的整体性能、网络效率以及维护和运营效率的提升都将起到至关重要的作用。5G 网络智能化的典型场景如下。 4.1.1.1 5G智能网络切片5G 网络切片是由针对特定的应用场景或商业模式的一组 5G 网络功能和专用的 RAT 集合构成。切片是 5G 网络基本运营单位,需要依托云化网络才能够做到灵活、按需配置,满足不同的应用场景。对基于切片的云化网络管理显得极为关键,这涉及到云化网络中的虚拟资源和业务资源的管理。为了能够最大程度的满足业务需要和最大化的提升资源利用率,对切片的管理需要引入敏捷、自动化、自优、自治和自愈等多种智能化管理方式,从而解决切片内部资源自动调整,来满足 SLA 问题以及解决切片间的资源竞争等问题。采用智能化的方式对切片进行 管理主要从三个方面考虑:采用敏捷和自动的方式对切片进行规划编排部署;采用监控和策略等方式对切片进行资源的自优调整;采用故障分析定位和预测方式对切片进行自愈的管理。 图 4- 1 智能化 5G 网络切片 中兴通讯人工智能白皮书 第20页中兴通讯版权所有未经许可不得扩散 4.1.1.2 5G Massive MIMO波束赋形5G 的大规模天线技术,可以有效提升网络覆盖、降低干扰、增强系统性能,其在 Pre-5G LTE系统中已经得到了很好的验证。5G Massive MIMO 的波束赋型,通过 AI 辅助,采用基于射频指纹库,结合数据地图,通过规则训练,能够在波束跟踪、高频定向、联合波束管理、基站定位、LBS 增强、室内外判决、高低速判决等领域发挥至关重要的作用。 图 4- 2 5G 智能波束赋形4.1.1.3 5G基于射频指纹技术预测的MLB随着网络用户数的快速发展,网络用户业务类型也更加变化多端,在 5G 时代,网络向着更加复杂多样的异构化方向发展,部分小区的用户数或 PRB 利用率接近容量极限而另一部分小区的资源使用率相对较低的不均衡状况愈加严重,5G 时代的 MLB 肩负着平衡异频或异系统之间负载均衡的重任。 5G 基于射频指纹技术预测的 MLB,是利用射频指纹库,协同负荷预测算法,通过提前预测,使得负荷均衡策略启动更及时,通过持续预测,有效防止突发性高负荷死灰复燃,通过精选切换用户和目标小区,使得负荷快速降低并达到均衡状态。 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第21页 4.1.2 5G智能垂直应用万物互联时代,增强的移动互联网业务和物联网业务将成为未来移动通信发展的主要驱动力。围绕 5G 三大应用方向:移动宽带增强(eMBB)、大规模物联网(mMTC)、超高可靠超低时延通信(uRLLC),在包括 VR/AR、M2M、智慧城市、智慧家庭、自动驾驶、工业自动化等在内的典型应用场景下,5G 将满足人们在居住、工作、休闲、交通等方方面面多样化的业务需求,提供超高流量密度、超高连接数密度、超低延迟的极致业务体验。同时,连接类型的泛化、业务的多样性、数据的海量增长,也为人工智能在 5G 垂直方向 的应用提供了天然土壤。人工智能和 5G 的垂直应用,在未来的发展是密不可分的。 自动驾驶未来车联网的普及将彻底改变人类的出行方式和城市交通管理方式。车联网是一张由车辆的各种动态信息,如传感、定位、导航、无线通信等构成的巨大的 V2X 交互网络。一方面,依托 5G 网络的高吞吐、低时延能力,所有自动行驶的车辆随时与云调度平台保持高速互通;另一方面,依托灵活的车辆间数据交换技术,比如 D2D、车与车之间实现实时的互动反应。自动驾驶本身要求感知、决策与控制三大系统缺一不可,而环境识别能力是感知系统智能 水平的关键所在,这也是基于深度学习的人工智能技术在自动驾驶领域的关键应用。决策与控制一方面依赖于 5G 网络的低时延交互技术,如 D2D、边缘计算等,另一方面依托于车辆内嵌的强大的人工智能推理加速能力;同时,云平台的统一调度、实时策略等也需要依赖人工智能的跨域分析和推理判决能力。 VR/AR5G 对于 AR/VR 的优势主要体现在三个方面:更大的容量、更低的延迟以及更好的网络均一性,这些指标的提升能够极大满足大众对于 VR/AR 极致体验的需求,VR/AR 的应用会得到 中兴通讯人工智能白皮书 第22页中兴通讯版权所有未经许可不得扩散 进一步的发展。VR/AR 整个产业链涉及较多的模块或功能组件,比如:显示屏、摄像头、传感器、体感设备、语音识别、定位、硬件、平台、内容制作等,其中大部分都可以利用人工智能技术提升用户体验和自身价值,比如语音识别、摄像头图像识别、内容推送等。 工业自动化工业自动化的主旨就是工业能够进行自动生产,通过人力的极少参与,实现生产过程中的各种自动化的过程控制。5G 网络可以为工业自动化提供针对智能设备的宽带数据、针对自动化 过程的超高可靠低时延通信以及提供针对大量连网设备的机器类通信,5G 是工业自动化的基础设施。人工智能将会进一步提升工业自动化的智能水平,比如基于计算机视觉技术的智能化产线物料纠错、基于运动智能的智能 AGV、高实时性的智能机器臂等。4.2 智能运维随着 ICT 融合和电信网络云化转型日益加快,加上 IoT、5G 等新技术及配套设施的引入, 电信系统的规模和复杂度与日俱增,运营商在网络运维方面将面临越来越大的压力和挑战。以人工为主的传统运维模式和网络本身的先进性已经产生差距,运维方面的困难和挑战也会日益凸显,比如:云化分层解耦架构下故障分析定位、根因追溯困难,现有的响应式运维模式效率低、客户体验差。依托人工智能的机器学习、深度学习能力,可以在海量的运维数据中抽取隐含的关联特征和规则,追溯事件根因、指导故障分析和定位;同时可以通过共性特征的提取总结,对未来事件进行预测。 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第23页 4.2.1 智能故障溯源故障原因分析是网络运维的重点,网络中的故障通常表现出多样性,比如告警、KPI 异常或业务不通等,单个故障告警很多时候已经不能反应出准确的故障信息,运维人员也难以通过经验判断和快速准确定位。能否直接解决源告警决定了运维效率和用户体验。通过引入智能分析的手段,可以在多样性告警中提取共性特征、快速导向共性的故障点,优先解决、降低运维难度,提升处理效率。中兴通讯智能运维故障溯源方案,基于大数据分析和人工智能特征挖掘,根据系统中网络 及业务上下游关系,并综合多维度历史数据分析,如:KPI、告警、性能、配置数据、操作日志、故障解决历史记录、工单系统历史数据等,挖掘出依靠人工经验很难总结归纳的潜在特征和规则,输出故障事件和特征的匹配规则库。在实际网络运维中,根据故障特征自动匹配规则进行诊断,给出判决和处理建议。同时可以和运营系统配合,实现故障的精准定位并触发工单派发和规划。如图 4-3 所示。 图 4- 3 故障溯源方案示意图智能故障溯源诊断,主要包含如下两大部分: 中兴通讯人工智能白皮书 第24页中兴通讯版权所有未经许可不得扩散 基于AI学习生成诊断规则库包括多维度历史数据获取,以及基于历史数据,通过人工智能模型算法实现的特征及规则挖掘。 诊断规则的运行包括:现网监控,获取实时故障及告警信息;匹配规则库,根因分析,进行故障智能诊断,并关联工单系统下发维护需求;运维结束,运维的有效性反向修正、强化现有规则系统,进行自学习和自优化。 智能故障溯源诊断,可用于提升如下典型场景的告警处理和故障诊断效率,如:大量的瞬断告警、告警频发、同网元内故障关联分析、同专业网上下层业务故障关联分析、跨专业网故障分析、综合故障诊断等。4.2.2 智能健康度预测传统运维关注的重点,一般在于发现异常以及异常的原因,通过运维手段进行异常处理并恢复网络和设备运行,保障最终用户良好的网络服务体验。但在运维过程中,通常网络质量和 用户体验会受到不同程度影响,如需涉及到设备调配,则需花费更长时间。为了保障故障处理的及时性,运营商通常需要增加冗余资源、提高运维人员知识技能和经验、提高成本委托高水平代维公司等。如果将运维事后的被动处理转化为事前主动预测和预防,整个运维的成本结构和用户体验,将会得到大幅度提升。中兴通讯智能健康度预测方案,依托人工智能的机器学习、深度学习能力,利用海量的运维数据分析,通过对故障事件发生前阶段时间内的隐形特征、共性特征、突变特征等的抽取、总结,有效地对事件监控、对故障的发生进行预测和预防。 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第25页 如图 4-4 所示,通过线下历史数据的训练得到预测网络模型;线上部署后,通过定期数据采集,进行健康度检测,同时用训练好的模型进行故障预测推理;如果有未能预测到的故障发生,则汇总该故障时间点前的阶段数据作为训练输入,重新训练预测模型,不断迭代优化。 图 4- 4 故障预测方案示意图预测方案使用的几种典型场景,比如:指标趋势及指标异常预测;设备关键模块故障预测等。 指标趋势及指标异常预测线下通过对历史数据分析挖掘网络健康度指标趋势和客观数据的深层次关联特征,如运行环境、设备折旧、业务量突发事件、重大节假日、备件储备量等。线上通过对网络健康度和关联指标的实时监测,利用训练出的特征规则进行匹配推理,分 析健康趋势走向,对网络健康指标趋势进行及时预测。根据预测出的中长期健康走势,可以评估未来健康度落入健康阈值以下可能时间点,提前 中兴通讯人工智能白皮书 第26页中兴通讯版权所有未经许可不得扩散 实施资源预留和定位处理。指标趋势预测可以用来弥补网络规划的不足,或指导网络扩容、备品备件储备等。根据预测中短周期范围内下一步的指标状态,并通过判断预测值是否会超过阈值来判断故障是否会发生,从而实现前瞻式故障预防和处理。 关键模块故障预测设备关键模块的稳定性非常重要,比如业务处理芯片、关键传输的光模块等,一个关键模块故障就会导致大量业务不正常。模块故障发生前,一般会存在一些代表性的异常或状态,而 代表性异常或状态可以通过对应的指标来表征,比如:芯片故障一般会跟寄存器异常相关、光模块故障通常伴有光功率异常。通过机器学习、深度学习,挖掘模块故障与伴随异常之间的深度关联特征,指导模块故障预测,提前预防。4.2.3 智能工单管理工单管理是实际运维的核心,需要通过工单将运维人员和组织有效的串联起来,形成以任 务为驱动的运维体系,运维人力高效合理的调度就成了工单调度的重点。中兴通讯 eFLOW 平台基于电子化的数据、准确的地理位置定位、丰富的交互能力以及接口能力,实现运维过程的全面可视化、可管可控,以及基于数据的可分析能力,帮助运营商主动运维。智能化运维调度,主要包括如下两个部分: 基于AI学习的故障工单预警从历史工单信息中提取与故障发生有关的特征向量,并借助 AI 经典预测算法如多项式拟合、 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第27页 神经网络等生成故障预警模型。通过该模型,eFLOW 可根据当前特征预判故障发生的可能性,为主动运维提供策略参考。 实时智能调度外线工单调度过程:根据工单类型、工单技能要求、人员资质、工单优先级、站点位置、车辆网获取的运维车辆上携带材料、车辆位置和油量等信息,使用遗传算法自动规划车辆行驶的最佳线路,安排外线高效运维。 图 4- 5 智能工单管理方案示意图4.2.4 智能DevOpsZTE Carrier DevOps 融合 AI 技术,帮助客户实现业务开发端的价值最大化,业务运维端的自动化,以及业务使用端的体验最优。在业务在线设计阶段,通过软件仓库的调用行为数据、网络实例运行数据,分析得到应用的价值分布。应用机器学习技术,结合流量趋势可以预测出未来市场热点所在,推测结果与 DevOps 的快速业务设计、自动化沙箱测试、敏捷部署功能相结合,可快速开发并上线符合市 中兴通讯人工智能白皮书 第28页中兴通讯版权所有未经许可不得扩散 场热点需求的应用,使得业务开发端价值最大化。在业务上线运营阶段,通过 AI 驱动的 RCA 技术,可快速实现问题根因分析及定位,结合DevOps 策略平台以及弹缩、自愈等相关技术,可实现基于策略的自动化运维闭环。同时,通过学习业务实例及资源的动态数据,可以预测出与业务需求最佳匹配的资源分配,结合 DevOps的自动编排功能,可实现最优选路、用户面资源适时下沉等功能,满足用户体验最优。4.3 智能优化 网络优化,也是运营商需要投入大量人力的重点工作之一,同时也是提升网络 KPI,保障用户体验的关键环节。网络优化涉及多个方面,既包括无线网络优化,比如:覆盖优化、容量优化、负载均衡、干扰识别、Massive MIMO 优化等;也包括广义上网络各层级的 KPI 优化、传输的路由优化、网络策略优化等等。中兴通讯 uSmartInsight 人工智能解决方案,为运营商提供多场景的、智能化的网络优化能力。4.3.1 无线覆盖智能优化 移动通信网络的无线覆盖质量一直是导致用户投诉的关键因素之一。网络中的弱覆盖、过覆盖、覆盖空洞等问题,会直接影响用户体验。同时无线小区的参数设置同小区内部、周边环境、周边小区参数,也需要合理协同,保障网络质量。传统方式下,对覆盖问题挖掘、分析定位和解决,通常需要依托于路测、呼叫跟踪、人工经验判断、投诉处理等手段来解决,一般处理周期长,投入成本高,且优化效果差异化较大,难以精准控制。基于人工智能的无线覆盖智能优化,可以利用大数据和人工智能,通过历史覆盖数据、关 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第29页 联数据进行学习,训练生成优化控制模型,自动输出无线参数规划和调优建议,实现无线覆盖的智能优化。 图 4- 6 无线覆盖智能优化方案示意图如图 4-6 所示,整个流程主要包含如下步骤: 网络数据采集现网提供包括 KPI 指标、工程参数、性能管理、配置管理、测量报告、呼叫跟踪、DPI 等在内的综合性历史数据给大数据系统; 数据处理大数据系统对多维度原始数据进行数据收集、存储、基础分析和预处理; 人工智能模型训练和输出中兴通讯 uSmartInsight 人工智能平台,利用大数据系统预处理后的数据进行模型训练、模型生成,同时提供预测和决策的推理能力,给出优化建议,如:天线下倾调整建议、功率参数建议、专用优化参量建议、邻区建议、工程实施建议等; 参数优化实施 中兴通讯人工智能白皮书 第30页中兴通讯版权所有未经许可不得扩散 根据大数据和人工智能平台输出的调优建议,运营商实施优化调整。可以是自动的优化参数下发执行,也可以是人工执行物理调优,如调整下倾角、方位角、挂高等。4.3.2 有线智能流量预测及路径调优随着未来网络规模和复杂度的持续增长,尤其是物联网、网络切片等新技术和场景的加入,在路径规划和流量调度方面,未来网络需要能够满足高吞吐、低时延、随需而动的需求,使用传统的路径规划方法很难根据链路的动态情况,实时地给出最优的流量调度和路径优化方案。 基于人工智能,可以利用众多项目和场景所积累的多维历史数据,进行数据分析和算法探索,并结合某个实际网络的需求,进行流量预测和路径优化推理,比如:中长期流量增长预测、短期峰值评估、区域仿真、路径策略优化、动态资源调度等。中兴通讯智能流量预测及路径调优方案示意图,如图 4-7 所示: 图 4- 7 智能流量预测及路径调优方案示意图 中兴通讯人工智能白皮书 中兴通讯版权所有未经许可不得扩散第31页 流量预测可适用于中长期流量增长预测、短期峰值评估、区域仿真等,进行扩容支撑、规划支撑、主动运维。算法探索阶段,利用各地网络的可用历史数据,对多种算法模型进行训练和探索,得到效果较好的算法模型加入算法库。现网应用阶段,对现网历史数据进行预处理, 按地域、业务分组等做初步分析预处理,得到训练数据,对算法库多种预测算法进行进一步训练,获得当前网络各区域各业务最佳预测算 法。根据需要预测的区域、业务,选择最佳算法进行推理预测,同时考虑叠加节假日修正因子,得到最终的预测结果。 路径优化根据网络状况,动态优化路由策略,提高传输效率,同时动态调度资源,提高网络使用效率。对网络状态数据进行采集,实时监控,如流量、性能、拓扑、路由等信息,并结合负载、 冗余、业务等策略定义信息,以及流量预测的结果信息,共同作为路径选择算法和资源调度算法的输入项,进行推理,得到路径优化推理结果,在网络执行。同时,对优化执行结果进行监控反馈,实现算法的进一步迭代优化。4.4 智慧运营依托大数据资源和数据挖掘能力进行业务创新、提升用户体验,是目前电信运营商实现运营能力提升的有效手段。基于机器学习、深度学习的人工智能技术,在海量数据分析、关联特 中兴通讯人工智能白皮书 第32页中兴通讯版权所有未经许可不得扩散 征挖掘、共性特征抽取方面具备原生的优势,将为网络的全业务精细化运营,提供更加全面深度支撑。中兴通讯 uSmartInsight 人工智能方案,基于大数据和人工智能技术,立足于从客户角度去感知和分析网络及业务信息,通过对海量数据灵活的挖掘和分析,实现对网络质量、业务质量、用户体验、用户行为和终端应用等全方位的可视化;同时,在运营支撑方面,提供基于人工智能基础技术的应用,增强主动关怀,提升交互体验,为智慧运营提供 360 度支撑。4.4.1 多维价值智能分析 多维价值分析系统,提供面向用户的端到端的运营分析能力,立足于从客户角度去感知和分析网络和业务信息,通过对海量数据灵活的挖掘和分析,从网元、用户、终端、业务等多个维度,对业务使用过程中的质量和特征进行全方位的分析挖掘。如图 4-8
展开阅读全文