资源描述
网络人工智能应用白皮书 Whitepaper on Network AI Applications (Rev. 20190626 ) 中国联通 中兴通讯股份有限公司 2019 年 6 月 网络人工智能应用白皮书 (Rev. 20190626) iii 目 录 第一章 人工智能技术简介与前沿进展 . 7 1.1 人工智能发展历史 . 7 1.2 人工智能前沿进展 . 8 1.3 网络人工智能(Network AI) . 8 第二章 标准组织与开源组织进展 . 10 2.1 标准组织 . 10 2.1.1 3GPP . 10 2.1.2 ETSI . 10 2.1.3 ITU-T . 1 1 2.1.4 CCSA . . 1 1 2.1.5 O-RAN . . 1 1 2.2 开源组织 . 12 2.2.1 Linux 基金会(Linux Foundation) 8. 12 2.3 产业联盟 . 14 2.3.1 中国人工智能产业发展联盟(AIIA) . 14 第三章 人工智能在通信网中的主要应用场景 . 15 3.1 网络规划 . 15 3.1.1 智能化容量评估 . 15 3.1.2 自动站址规划及覆盖效果评估 . 15 3.2 网络运维 . 15 3.2.1 智能故障溯源 . 16 3.2.2 智能健康度预测 . 17 3.2.3 智能工单管理 . 18 3.2.4 智能 DevOps . 19 3.3 网络优化 . 19 第四章 人工智能在运营商业务创新中的应用 . 22 4.1 边缘智能 . 22 4.1.1 无线感知服务 . 22 4.1.2 应用使能服务 . 23 4.2 物联网 . 24 iv 4.3 创新业务 . 25 4.3.1 自动驾驶 . 25 4.3.2 VR/AR . 25 4.3.3 智慧家庭 . 26 第五章 面向 5G的人工智能应用 . 27 5.1 5G网络编排 . 27 5.2 5G网络节能 . 27 5.2.1 基于人工智能的网络节能 . 27 5.3 5G基站调优 . 28 第六章 网络 AI 能力平台 . 29 6.1 中国联通 AI 人工智能平台系统架构 . 29 6.2 基于人工智能网络平台的应用实现流程 . 31 总结 . 33 缩略语 . 35 参考文献 . 36 致 谢 . 37 网络人工智能应用白皮书 (Rev. 20190626) v 图 目 图1 网络故障溯源方案示意图 . 16 图2 网络故障预测方案示意图 . 17 图3 智能工单管理方案示意图 . 19 图4 无线覆盖智能优化方案示意图 . 20 图5 智能流量预测及路径调优方案示意图 . 21 图6 异系统频谱资源共享示意图 . 22 图7 TCP 跨层优化示意图 . 24 图8 网络人工智能平台参考架构 . 29 图9 智立方平台功能架构(截至 2019年 6月 27日) . 30 图10 人工智能端到端实现流程 . 31 网络人工智能应用白皮书 (Rev. 20190626) 7 第一章 人工智能技术发展与前沿进展 1.1 人工智能发展历史 1955年,麦卡锡(John McCarthy) 、明斯基(Marvin Minsky) 、罗切斯特(Nathaniel Rochester)和香农(Claude Shannon)等科学家在美国达特茅斯学院开会研讨“如何用 机器模拟人的智能” ,首次提出“人工智能”这一概念,标志着人工智能学科的诞生 1 。 维基百科将人工智能(AI: Artificial Intelligence)定义为由人制造出来的机器所表现 出来的智能,一般情况是指通过普通计算机程序来呈现人类智能的技术 1 。 人工智能 60余年的发展历程划分为以下 6个阶段: (1) :1956 年至 20 世纪 60 年代初期:人工智能概念在 1956 年首次被提出后,涌 现出系列研究成果,如机器定理证明、跳棋程序、LISP 表处理语言等,掀起了人工智 能发展的第一个高潮。 (2)20 世纪 60 年代至 70 年代初期:科学家们尝试更具挑战性的任务,并提出了 一些不切实际的研发目标,从而导致目标难以达成,使人工智能的发展走入了低谷。 (3)20 世纪 70 年代初至 80 年代中期:此阶段出现了专家系统,通过模拟人类专 家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用的重大 突破。专家系统在辅助医疗、商业决策等领域取得成功。 (4)20 世纪 80 年代中期至 90 年代中期:随着应用规模不断扩大,专家系统内在 的知识获取困难、推理方法单一等问题不断显露,从而限制了基于专家系统的人工智能 应用发展。 (5)20 世纪 90 年代中期至 2010 年前后:伴随高性能计算、分布式计算技术的发 展, 人工智能应用所需的算力水平得到提升, 推动人工智能技术进一步走向实用化。 1997 年, IBM 公司的深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,向全世界证明对 于特定问题,机器在单一领域的“智能”能够达到或者超过人类的最高水平。 (6) 2011年迄今: 经过 60多年的演进, 特别是在移动互联网、 大数据、 超级计算、 传感网、脑科学等新理论、新技术以及经济社会发展强烈需求的共同驱动下,人工智能 技术也正在加速发展,呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等 新特征。受脑科学研究成果启发的类脑智能蓄势待发,芯片化、硬件化、平台化趋势更 加明显,人工智能发展进入新阶段。当前,新一代人工智能相关学科发展、理论建模、 技术创新、 软硬件升级等整体推进, 正在引发链式突破, 推动经济社会各领域从数字化、 网络人工智能应用白皮书 (Rev. 20190626) 8 网络化向智能化加速跃升。 同时,通过开源组织、公有云服务商的努力,人工智能应用的构建变得日趋简单。 人工智能技术在信息和通讯、工业制造、安防、金融、自动驾驶、医疗健康等众多领域 取得切实应用,人工智能赋能的产品、业态创新带来生态和商业模式的全新变革。 1.2 人工智能前沿进展 全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发 展战略。 比如, 在其 2017年的年度开发者大会上, 谷歌明确提出发展战略从 “Mobile First” (移动优先)转向“AI First” (AI优先) ;微软 2017财年年报首次将人工智能作为公司 发展愿景。 人工智能当前前沿的发展方向包含数据平台、开源算法、计算芯片、基础软件、图 形处理 GPU 服务器等技术生态系统和智能制造、智能医疗、智能安防、智能零售、智 能家居等商业和应用生态系统。 在技术生态方面,人工智能算法、数据、图形处理器(Graphics Processing Unit,简 称 GPU) /张量处理器 (Tensor Processing Unit, 简称 TPU) /神经网络处理器 (Neural network Processing Unit,NPU)计算、运行/编译/管理等基础软件已有大量开源资源,例如谷歌 的 TensorFlow第二代人工智能学习系统、 脸书的 PyTorch深度学习框架、 微软的 DMTK 分布式学习工具包、 IBM 的 SystemML 开源机器学习系统等; 此外谷歌、 IBM、 英伟达、 英特尔、苹果、华为、中国科学院的寒武纪等积极布局人工智能领域的计算芯片。在人 工智能商业和应用生态布局方面, “智能+X”成为创新范式,例如“智能+制造” 、 “智 能+医疗” 、 “智能+安防”等,人工智能技术向创新性的消费场景和不同行业快速渗透融 合并重塑整个社会发展,这是人工智能作为第四次技术革命关键驱动力的最主要表现方 式。 1.3 网络人工智能(Network AI) 电信运营商作为信息与通信产业生态的主体之一,坚持推进人工智能技术与网络运 营和业务创新相结合,使得通信产业成为人工智能技术落地应用的主要领域之一。 在信息通信向人类生产、 生活方方面面渗透的过程中, 电信运营商一直扮演着 “水” 的角色,在 AI 向各行各业渗透时亦如是,不可或缺。 “上善若水,大有可为” 。在 2017 年 12 月乌镇世界互联网大会人工智能分论坛上,中国联通总经理陆益民将中国联 通在人工智能中的作用定位为:不仅仅是网络基础设施的提供者、数据管道的提供者, 网络人工智能应用白皮书 (Rev. 20190626) 9 也是人工智能计算能力的提供者、海量数据的提供者。 2019年 6月 6日,工业和信息化部向中国联通办了 5G牌照;如果说 3G、4G 开启 了移动互联网时代,那么 5G将开启人工智能时代。因此, 5G网络与人工智能的结合将 成为必然命题,运营商应紧紧抓住国家人工智能发展规划带来的历史性机遇,充分利用 各方技术、产品、运营实力,促进通信行业向网络智能化、业务个性化、行业应用智慧 化和管理智能化转型。通过人工智能技术,提高网络规划、建设、维护等效率,增强网 络智能组网、灵活运作、高效支撑业务等能力,降低网络建设维护成本和管理成本,提 升用户体验和行业、个人、家庭业务的竞争力,实现网络智能化的转型。 从学科分类来看, 人工智能技术是计算机科学的一个分支, 致力于了解智能的实质, 并生产出一种新的能以人类智能相似的方式做出反应的智能机器,感知环境并采取行动 以最大限度地实现目标。 网络人工智能(Network Artificial Intelligence)是指将人工智能技术应用在运营商网 络中,通过网络的智能化或智能子系统替代或优化目前依靠人工进行的工作,使运营商 能够更加便捷、高效的提供更加优质的网络服务 2 。 网络人工智能化演进是个分阶段实现的长期过程,基于人工智能技术应用的不断深 度,大体可分三个阶段: 第一阶段主要是实现网络资源的统一部署、控制和管理,实现软件定义的业务敏捷 部署,释放大量重复、低效的手工劳作和人工交互; 第二阶段引入大数据分析和机器学习等 AI 技术,提供网络预测性感知和前瞻性的 保障能力,确保网络可靠、平稳运行并提供优化建议; 第三阶段需要匹配高层次运营意图和策略,网络在自动管控、深度感知基础上,通 过对这些意图的持续验证和综合优化,实现运营意图驱动的智能闭环自治,在极大降低 OPEX的同时最大释放网络潜能和效益。 网络人工智能应用白皮书 (Rev. 20190626) 10 第二章 标准组织与开源组织进展 2.1 标准组织 2.1.1 3GPP 3GPP SA2在 2017年 5月的杭州会议上成立了关于 5G网络智能化的研究项目 “Study of enablers for Network Automation for 5G(eNA) ” 3 。该项目是 3GPP Rel 16的项目, SA2 已在 2018年 1月的哥德堡会议上正式展开项目讨论。 该项目的立项背景是 3GPP SA2 在 Rel 15 的 5G 核心网中引入了一个 NWDAF (Network Data Analysis Function)的网络功能。目前该功能主要应用于部署了网络切片 的场景,通过对网络切片相关的网络数据的自动化分析,向 PCF 和 NSSF 提供网络切片 状态分析结果。 另一方面, 在 Rel 15的 5G网络架构研究中, SA2 引入了一些新的需求, 例如按需移动性管理、非标准化 QoS、流量分流和卸载等,在没有网络数据分析的情况 下,这些需求难以实际部署和运行。因此,为了让 5G 网络能够更灵活更智能的提供服 务,华为在 SA2 牵头成立了 eNA项目。 eNA 项目的研究目标是,通过 NWDA 对网络数据的收集和分析,生成分析结果, 然后利用分析结果进行网络优化,包括定制化的移动性管理,5G QoS 增强,动态流量 疏导和分流,UPF 选择,基于 UE 业务用途的流量策略路由,业务分类等。 在 2018年 6月的 RAN#80全会上通过了 “RAN-centric Data Collection and Utilization SI”立项,研究面向网络自动化与智能化的无线大数据采集与应用,并且探索在 RAN 侧引入数据分析的潜在影响。 在 2018年 9月的 SA WG5#81 会上通过 “Intent driven management service for mobile networks” 立项, 调查意图驱动的移动网络管理场景, 研究可用于实现移动驱动目标的、 包括 SON 在内的自动化机制,以及描述意图的适当机制。 2.1.2 ETSI 2017 年 2月欧洲电信标准化协会 ETSI 正式批准成立了新的行业标准组 ENI(全称 “Experiential Networked Intelligence” ) 4 。该工作组的工作目标是就网络智能化的场景 和需求达成一致并定义基于“观察-判断-决策-行动” 这种模拟人脑决策的闭环控制模 型,通过对网络环境持续学习和决策结果的持续优化等手段来有效应对复杂的网络管控 挑战、提升网络运营管理效率和体验。研究范围包括分析运营商传统网络和 SDN/NFV 网络中运营运维需求,引导构建包括自适应感知、支撑灵活策略定义以及智能化决策和 执行的体系架构。该体系架构应能充分支撑运营商灵活的业务策略和自动化、自优化、 网络人工智能应用白皮书 (Rev. 20190626) 11 自治的智慧网络理念。同时,该架构还将推动创新的遥测遥感、合理的大数据采集和管 理、机器学习算法等技术来支撑智能分析和决断,统一的策略模型。 2017 年 12 月欧洲电信标准化协会 ETSI 正式批准成立了新的行业标准组 ZSM(全 称“Zero touch network & Service Management” ) 。ZSM 最初将专注于 5G端到端网络和 服务管理,如网络切片管理,并将扩展未来网络世代的管理。 目标是让所有操作流程 和任务 - 交付,部署,配置,保证和优化 - 自动执行,理想情况下 100自动化。该 小组将定义一个新的,面向未来的,横向和纵向的端到端可操作框架,以实现新兴和未 来网络和服务的灵活,高效和定性管理和自动化。 横向端到端是指跨域,跨技术方面。 垂直端到端是指跨资源方面,从面向资源的层到面向客户的层。 ZSM 小组还将促进相 关标准化机构与开源项目之间的协调与合作。 2.1.3 ITU-T 在 2017年 11 月召开的 ITU-T SG13 会议期间,来自德国、韩国、中国、突尼斯、 非洲等不同国家地区建议成立机器学习-网络焦点组,经 SG13 全会讨论正式批准成立。 焦点组正式名称为 Machine Learning for Future Networks including 5G, 简称 FG-ML5G 5 。 FG-ML5G 是一个对 ITU成员和非 ITU成员都开放的工作平台,目标是分析如何在 未来网络特别是 5G 网络中应用机器学习来提升网络性能和用户体验,包括分析目前业 界标准组织相关工作并与之合作,研究机器学习在未来网络的应用场景、潜在需求、架 构,以及具体接口、协议、算法、数据结构和个人信息保护等方面,并分析机器学习对 自主网络控制和管理方面的影响。 FG-ML5G目前作为 SG13下设的焦点组, 研究期为 1年, 如果有必要也可以由 SG13 决定是否延期。FG-ML5G 输出的研究报告和标准草案可以作为后续 SG13 相关研究的 输入。 2.1.4 CCSA 已经在多个应用领域展开相关研究工作,在 2017 年 7 月的 TC1-WG1#58 会上讨论 通过了“人工智能在电信网络演进中的应用研究”课题立项。 2017年 12月的 TC5-WG6 #47会上通过“人工智能和大数据在无线通信网络中的应用研究”课题立项。 2017年 12 月的 TC5-WG12#2会上通过“智能化 5G核心网络切片技术研究”课题立项。2018年 8 月的 TC5-WG6#49次会议上通过“移动通信网络智能化能力分级研究”课题立项 6 。 2.1.5 O-RAN 2018 年 2 月,中国移动、美国 AT & T、德国电信、日本 NTT DOCOMO 以及法国 网络人工智能应用白皮书 (Rev. 20190626) 12 Orange 等 5 家电信运营企业宣布联合成立开放无线接入网络(O-RAN)联盟,目标是 使无线网络实现标准化、通用化、开源化、智能化。该联盟计划引入 RAN 智控平台, 通过实时数据分析、机器学习及人工智能技术,让网络更具智慧性 7 。 2.2 开源组织 2.2.1 Linux基金会(Linux Foundation) 2.2.1.1 Linux 人工智能基金会(Linux F o undation A I) 2018 年 3 月,Linux 基金会下成立了专门研究人工智能技术的深度学习基金会 (LFDL: Linux Foundation Deep Learning) ,以支持人工智能、机器学习和深度学习方面 的开源创新,如 Acumos AI、Angel ML等 8 。 2019 年 5 月,Linux 基金会正式宣布将 Linux 基金会深度学习基金会更名为 LFAI 基金会(LF AI Foundation),以支持开源 AI,ML和 DL,并创建可持续的开源 AI 生态系 统, 使用开源技术轻松创建 AI 产品和服务, LFAI 的成员包含 AT & T、 Orange 等运营商、 华为、中兴、爱立信、诺基亚等设备商以及腾讯、百度、滴滴、红帽等互联网企业和 IT 企业。 截至 2019年 6月,Acumos AI 是 LFAI 首个和唯一的孵化晋级的开源项目,该项目 的初期源代码由 AT & T 和 Tech Mahindra联手研发并贡献给 Linux深度学习基金会。该 项目旨在针对现代企业引入 AI 技术的共性需求,提供一个共同的架构和平台,以帮助 建立和管理人工智能平台。 2018 年 11 月 7 日,Acumos AI 的首个版本 Athena 发布,提供编辑、集成、组合、 包装、培训和部署 AI 微服务,基于平台提供的微服务,开发人员能够连接各个应用程 序来创建 AI 和机器学习产品。 截至 2019年月,LFAI 还有 4个开源项目在孵化中 9 ,分别是: (1)Angel-ML 该项目旨在提供基于参数服务器(Parameter Server)理念开发的高性能分布式机器 学习平台。Angel-ML 由腾讯和北京大学联合开发,由腾讯贡献给 Linux 深度学习基金 会,基于腾讯内部的海量数据进行了反复的调优,并具有广泛的适用性和稳定性,模型 维度越高,优势越明显。 Angel 的核心设计理念围绕模型。它将高维度的大模型合理切分到多个参数服务器 节点,并通过高效的模型更新接口和运算函数,以及灵活的同步协议,轻松实现各种高 网络人工智能应用白皮书 (Rev. 20190626) 13 效的机器学习算法。 当前,Angel 基于 Java 和 Scala 开发,能在社区的 Ya r n 上直接调度运行,并基于 PS Service,支持 Spark on Angel,集成了部分图计算和深度学习算法。 (2)Elastic Deep Learning (EDL) 该项目将基于百度开发的 PaddlePaddle 框架的开发的 AI 模型和应用与 Kubernetes 提供的资源管理、作业调度相结合,通过 Kubernetes controller, PaddlePaddle auto-scaler 组件实现优化的作业调度,从而实现集群硬件资源利用率的最大化。 (3)Horovod 该项目旨在为基于 TwnsorFlow 的模型训练提供分布式训练的加速方式,该项目的 初期源码由 Uber 贡献给 Linux深度学习基金会。 (4)Pyro Pyro是基于 Python和 PyTorch实现的深度概率建模工具库,帮助开发人员为 AI 研 究创建概率模型。该项目由 Uber 贡献给 Linux深度学习基金会。 2.2.1.2 LFN(LF N e tw orking F und) 2018 年 1 月,Linux 基金会为整合产业资源,平衡不同网络开源项目的生态系统, 消除不同项目之间的重叠或冗余,创建更高效的流程,加快网络开源发展进程,成立了 网络基金组织 LFN(Linux Foundation Networking Fund) ,旨在通过统一的董事会管理, 协调网络相关的开源项目。 截至 2019年 6月,LFN管理的开源项目报告:ONAP、Open Daylight、OPNFV、 FD.io、PNDA、SNAS、Tungsten Fabric等 7个网络相关的开源项目。 ONAP目前是全球最大的 SDN(Software Defined Networks,软件定义网络)/NFV (Network Function Virtualization,网络功
展开阅读全文