在性能决定生死成败的时刻,通过知识和先验手段激发的自信心尤为重要。让我们一起了解网络主动保障方案是如何实现这一点的。——
让我们设想下面一个场景:兴奋的球迷涌入由5G网络支持的世界杯决赛直播间。比赛开始三分钟后,网络崩溃。观众们抓狂了,而社交媒体也炸开了锅。更麻烦的是,无论运营商如何努力地想要去定位并解决这一问题,仍然看不到光明的尽头。这应该是所有移动运营商避之不及的噩梦。
也许在比赛前一天晚上,运营商应该试试运行一系列大规模主动保障测试——这些测试使用机器学习(ML)并能够基于历史事件识别端到端流媒体的性能问题。在测试中,对签名阈值的违反将自动触发一个工作流,该工作流在端到端路径的关键网络接口处部署额外的主动测试代理,以识别问题的根源——也许是回传网络问题?流量被疏导至辅助链路,并在几分钟内恢复所需的性能。网络经过主动保障测试八小时后,决赛开始,此时的运营商的网络由于提前预判了问题并采取措施,从而使得运行无比流畅。上述两个场景中的后者,应该才是我们想要看到的。在性能决定生死成败的时刻,通过知识和先验手段激发的自信心尤为重要。
无论是关于低延迟网络切片还是5G网络的任何其他新功能,在客户遇到问题之前发现问题,对于持续保证为客户承诺的服务水平协议(SLA)至关重要。现在,通过在网络运维中适当平衡主动保障、机器学习与自动化,我们可以迅速识别并解决问题。
主动保障:5G网络的耳目
通过在网络中任意位置部署主动测试软件代理,主动保障可以主动模拟网络上的用户,无论这一网络属于运营商、科技巨头还是一般企业。它可以根据需要生成或大或小的流量,从而精确模拟用户可能产生的流量。与刚才世界杯那个例子一样,人们可以部署更多的测试代理,从而通过网络分段找到问题的根本原因。
主动测试代理可以放置于网络中的任何位置,通过测量端到端或分段的重点区域,使用逐步隔离方法对问题进行识别。人工智能与机器学习:快速的智能与洞察力
机器学习(ML)是人工智能(AI)的核心,它创建神经网络和预测模型并将其嵌入人工智能系统中。AI是数据的仲裁者,可以根据行业要求和其他因素做出结论并付诸行动。
ML根据历史数据来学习网络每个部分的性能阈值,并能够随着环境变化不断学习,从而能够以惊人的速度与准确度对网络问题进行检测。
自动化:执行速度
为什么主动测试与AI/ML对5G网络如此重要呢?有人说5G比上一代网络复杂50倍——这其实并不足为奇,因为网络功能、网络切片、加密、边缘设备、应用程序和基础设施都处于不断变化的状态中。持续集成/持续交付(CI/CD)的方式意味着需要对生产网络进行持续性的更新,而这些更新必须在上线之前进行验证。由于网络资源在网络中是动态实例化的,因此也需要对其进行测试。如果发生了滞后,网络就会变得混乱不堪,无法提供新兴应用所需的高质量和性能。然而人工处理这个问题是不可能的。
自动化保证:向自我修复网络迈进
用于性能监控、根本原因分析和SLA管理的传统人工方法无法应对5G网络的复杂性及其巨大流量。通过采用AI与ML触发的工作流程以及网络拓扑信息,主动保障系统与网络编排器合力在网络中的任何时间和地点插入主动测试代理,从而实现:
对新激活的功能、网络切片和基础设施在上线之前、期间及之后进行验证测试。
从最终用户的角度主动并持续监控关键连接与服务。
通过部署端到端和分段级别的测试来隔离根本原因,从而对任何问题进行故障排除。
运用变更管理用例确认修复,从而完成从激活、监控、故障隔离到变更验证的保障周期。
通过使用AI/ML,再加上拥有在任何地方自动部署及重新部署代理的便利性,可以更快地解决问题从而避免客户遭受影响。这是朝着闭环编排和自我修复网络迈出的重要一步。