自智网络:网络自身的数字化转型
前言:
随着 5G 的蓬勃发展,高带宽、大连接、低时延、高可靠的网络能力和大数据、人工智能不断融合,赋能千行百业的数字化转型。
与此同时,网络自身作为这场变革的策源地,也在进行着自身的数字化转型。这就是近期各大运营商提出的发展目标:自智网络。
本期,蜉蝣君将和大家一起探讨自智网络的那些事。
一. 依赖人工的复杂系统
无线通信,是一张由成千上万基站组成的煌煌大网,而维系这万千基站之间联系纽带,竟然是低效的人工配置?
在我刚刚入行之际,面对逐渐日薄西山的 2G 网络困惑不已:
复杂的无线通信系统拥有海量的参数设置,这些都需要人工规划、配置并优化,效率真是低得可以!
切换作为移动性管理的核心,网络连哪些基站可以作为切换目标集合都不知道,必须要手动配置邻区才可以!
想要基站省电,就得大费周折,分析半天话务量和网络指标,然后战战兢兢地用最保守的参数小规模先试试。唯恐省了电却让用户上网慢!
那时的网络,就像一架异常复杂的机器,一切功能的运转都完全依赖于人工指令。
人工,在高强度、单调重复性工作中,是低效而易出错的,结果大家就只能在盲人摸象中求索最佳的方案,一切的操作都如履薄冰,如临深渊。
网络运维,需要打破人工的桎梏,引入自动化、智能化操作才能破局。
二. 自组织网络的引入
终于,在 4G 时代,SON(Self Organized Network,自组织网络)的概念被引入。人们希望,网络的运转能尽可能地减少人工干预,通过自组织自主运行。
这是通过协议标准化的一系列方案,可以实现站点自配置、自优化、自愈这三大功能。
自配置:基站可实现快速开通,即插即用,包括传输自建立、参数自配置、系统自测试、资产自上报等一系列功能。
自优化:网络可根据用户分布,行为和话务量进行自我优化,包括自动邻区关系、自动负荷均衡、移动健壮性优化、随机接入优化等一系列功能。
自愈:某个基站故障了,可以自动识别并调整附近其他基站的参数,让这些基站的覆盖延展以消除故障站点导致的覆盖空洞,再对这个故障基站来个重启看看能不能修复。
SON 仿佛是一道光,把宝贵的人力从低效的参数配置、优化和性能提升中解脱了出来,拉开了网络管理自动化的序幕。
随后,2G 和 3G 网络也引入了一系列类似的 SON 功能,让网络管理自动化的尝试再深入了一步。
然而人类的惰性是无穷的,有了无线网络的 SON 功能,还是觉得差点意思。
下面我们先简单介绍下网络运维是什么,再来说 SON 的不足之处。
无线网络的生命周期一般分为规划、建设、维护、优化、运营,简称为:“规建维优营”。
规划:网络建设的目标是什么,要达到怎样的覆盖和容量需求,需要在哪些位置建设多少站点?
建设:怎么让纸面上规划出来的站点成为可发射信号,可以支撑用户打电话上网的实体?这就需要进行站点的安装、调试、参数配置、验收等一系列环节。
维护:网络建好后,难免会出现各种各样的问题,比如内部的硬件损坏,系统故障等等,以及外部的电力中断、自然灾害等等,这就需要通过网络维护来进行修复。
并且,网络也不是一成不变的,可能需要不时进行配置调整、扩容、新功能引入、版本升级等操作,这些也都需要网络运维来执行。
优化:针对特定网络的话务模型来针对性地调整站点的工程参数以及网络参数,让网络的容量、覆盖和性能达到最优。
运营:运营商花大价钱建设的网络,怎样评估用户感知,怎样提升 ARPU,怎样处理用户投诉,怎样防止体验不好的用户“用脚投票”?这些都是网络运营要做的事情。
一般我们常常说的“网络运维”,可以有狭义和广义的理解。狭义的网络运维就是指上面说的网络维护,广义的网络运维则是指“规建维优营”全流程。
好了,有了上面的这些铺垫,我们对着“规建维优营”运维全流程一看,SON 那一套“自配置,自优化,自愈”,也就解决了“建、维、优”里面很少的几个课题,且完全不涉及“规”和“营”。
这样,明显不够啊。
如今的网络 2345G 四世同堂,高中低频段五花八门,ToB / ToC 各种业务需求各异,形形色色的终端的能力差别万千,运维难度指数级增长。
面对这样复杂的庞然大物,唯有在全生命周期引入“智能”,让网络“自治”,才是根本性的解决之道。
三. 自智网络演进
5G,自 2019 年开始破土而出,迎来正式商用和飞速发展。
同年,TM Forum(简称 TMF)发起倡议并设立“Autonomous Networks(直译为:自治网络)”协作项目,探索并提供行业领先的端到端网络自动化方法论,并联合业界多家企业发布了《 Autonomous Networks 白皮书 1.0》。
注意,我在这里直接用了“Autonomous Networks”,是因为一开始发布的白皮书并没有中文版本。由于白皮书参考自动驾驶汽车的分级制定了网络运维的 6 级自动化级别,因此中文被翻译为“自动驾驶网络”。
此外,GSMA、3GPP、ETSI、IETF、CCSA 等组织也纷纷通过白皮书或者研究报告的形式来阐述对网络自治的目标和愿景,各方携手拉开了网络自动化、标准化、产业化的序幕。
2020 年,TMF 的《自动驾驶网络白皮书 2.0》发布。华为等多家设备商也发布了自己的自动驾驶网络解决方案白皮书。
个人觉得,自动驾驶网络这个名字很不好,很容易让人以为中国移动、华为等巨头要进军汽车自动驾驶领域,也确实曾误导过很多人。
2021 年,TMF 听取了多方专家的意见,正式发布了中文版的白皮书,“Autonomous Networks”的官方中文名称也正式确定为“自智网络”,该白皮书就是《自智网络白皮书 3.0》。
经过这几年的技术标准化和方案落地探索,业界对于推进网络自动化、智能化的大方向已经达成了共识,并成为了整个产业链为之努力的目标。
自智网络的愿景
如下图所示,自智网络的愿景是:通过完全自动化的网络和 ICT 的智能化基础设施、敏捷运营和全场景服务,为垂直行业和消费者用户提供良好的客户体验,利用前沿技术实现“将复杂留给供应商,将极简带给客户”。
这里说的网络,是一个端到端的概念,包含接入、传输、核心网、数据中心等多个领域,用同一套方法论让多个域协调工作。一句话,就是将整个网络自动化、智能化,从而为用户提供更好的服务体验。
总结起来,就是自智网络就是要实现“三零三自”。
这里面的“三零(Zero-X)”是指:零等待、零接触、零故障。
零等待:网络上各种业务的发布、交付、维护都极快,几乎不需要等待。
零接触:各种流程都可以自动化运行,最大限度地减少甚至完全不需要人工干预。
零故障:网络拥有强大的自愈能力,外界完全感受不到故障的存在。
要实现上面这“三零”,网络就需要具备“三自(Self-X)”能力:自服务、自发放、自保障。具体描述如下图所示。
不同的设备商和运营商,也可以根据自身的规划,对不同的网络域给出不同的关于“三零三自”的解释。
自智网络的框架
自智网络架构包含“三个层级”和“四个闭环”。
“三个层级”包含资源运营层、服务运营层和业务运营层,作为通用运营能力,可支撑所有场景和业务需求。
资源运营层:主要面向单个自治域提供网络资源和能力自动化。对于无线通信来说,无线接入网(RAN)可以算是一个自治域,和传输、核心网等其他自治域共同构成了资源层。
服务运营层:主要面向多个自治域提供 IT 服务、网络规划、设计、 上线、发放、保障和优化运营能力。
业务运营层:主要面向自智网络业务,提供客户、生态和合作伙伴的使能和运营能力。
这三个层级之间相互协同,形成了“四个闭环”,包括:
资源闭环:以自治域为粒度的网络及 ICT 资源运营间的交互,简单来说,就是:单域自治,跨域协同。以无线接入网为例,资源闭环就需要“规建维优营”全流程的自动化、智能化。
服务闭环:服务、网络和 IT 资源运营层之间的闭环。服务闭环可能会在其实现中触发相关的资源闭环。
业务闭环:业务和服务运营层之间的交互。业务闭环可能会在其实现中调用相关的服务闭环和资源闭环。
用户闭环:上述三个层级之间和其他三个闭环间的交互,以支持用户服务的实现。三个层级间通过意图驱动式极简 API 接口进行交互。
意图驱动的交互
在自智网络中,各个自治域、不同层级之间的信息交互是基于“意图驱动”的。
那么,什么是意图呢?简单来说,就是目的导向。
比如说,领导给下属分配任务时,一般只会说有个什么活要干,希望达成什么样的效果,并不会列出来一个个详细、具体的步骤。也即是说,只要能达成目的,过程是可以自由发挥的。
在自智网络中,最基础的单元就是自治域。既然人家都自治了,肯定没法手把手教人怎么做事,只要能传递意图。具体怎么干,自治域自己会搞定。
这样大家相互合作起来,不但降低了技术复杂度,也屏蔽了不同厂商实现方案的差异,从而支撑自智网络的端到端业务需求。
以无线接入网为例,想要在某栋大楼里面规划室内覆盖,我们啥具体的活都不用干,只需对系统说(字面意义的说,机器会语音识别并进行自然语言理解):
“这栋楼里的用户要达到良好的用户体验,应该怎样建网?”
机器会自己领悟你的意图,然后在分析、计算、决策之后,给出最优方案:建传统室分还是数字化室分,一共需要多少个,应该放在什么位置,以及建好之后能达到什么样的网络指标等等。
是不是很方便?人和机器这样交互,机器和机器之间也是这样交互的。这就是自智网络的目标。
自智网络的分级
参考自动驾驶的分级,自智网络的等级也分为从 L0 到 L5 这 6 个级别,网络的自动化程度依次增强。
L0:人工运维 —— 系统提供辅助监控能力,所有动态任务都需要人工执行。
L1:辅助运维 —— 系统可根据预先配置,执行特定的重复性子任务,以提高执行效率。
L2:部分自智网络 —— 在特定外部环境中,系统可以根据预定义的规则 / 策略,面向特定单元使能自动化闭环运维。
L3:条件自智网络 —— 在 L2 的基础上,系统可以实时感知环境变化,并在特定网络专业中进行自优化和自调整,以适应外部环境。
L4:高度自智网络 —— 在 L3 的基础上,系统可在更复杂的跨多网络领域环境中,实现业务和客户体验驱动网络的预测式或主动式的闭环管理,从而进行分析并做出决策。
L5:完全自智网络 —— 这个等级是电信网络演进的终极目标,系统具备面向多业务、多领域、全生命周期的全场景闭环自治能力。
目前绝大多数运营商网络的自智级别都在 L1 或者 L2。很多运营商都制定了达成高等级自智网络的目标,L5 目前来说还遥不可及,因此 L4 就成为了普遍的目标。
四. 结尾
网络自动化将大幅提升运营商的效率并使能全新的数字化业务,同时通过使能新业务,改变社会与千行百业。这已成为了业界的共识。
目前,自智网络正处于从理念到实现的关键阶段,很多的应用都还处于初始阶段,呈点状发展。在整个行业的共同努力下,这些自智网络的一朵朵浪花,必将掀起网络智能化的滔天巨浪。
因为,自智网络已不再是一个可选项,而是必由之路。
本文来自微信公众号:无线深海 (ID:wuxian_shenhai),作者:蜉蝣采采