电信网络携手大模型:AI赋能网络运维的新范式

当电信网络用上大模型,会带来怎样的体验?

过去,网络出现问题时,运维人员需要依赖经验反复排查,找到“病根”后再“对症下药”。但在大模型的加持下,问题的解决方式发生了颠覆性的改变。

如今,当网络出现问题,大模型可以自动找出“病根”,并将判断结果呈现给运维人员。如果结果与运维人员的诊断一致,那么就可以迅速解决问题。

即便诊断有所偏差或描述不够详细,运维人员也只需提出问题,大模型会像一位领域专家一样,利用其丰富的知识快速提供详细解答。业界认为,文本生成延时小于100毫秒是较为舒适的阈值,而这个大模型的表现更佳:首字符延时不到1秒,生成延时仅约50毫秒。面对再复杂的问题,运维人员仿佛有了一位“高人”在旁指导。

值得一提的是,这个网络大模型不仅是一个现象级产品,它已经投入实战。据悉,某电信运营商已在全国31个省份推广应用,每日调用量高达10万次!在刚刚落幕的第二届“华彩杯”算力大赛·智能计算专题赛中,该模型还斩获了一等奖,得到了官方认证。

此外,白皮书《中国电信携英特尔积极探索基于至强® CPU 平台的网络大模型推理算力方案》在中国通信标准化协会CCSA TC610和欧洲电信标准化协会ENI的云网运营自智与网络大模型技术研讨会上正式发布。接下来,我们将深入了解这个网络大模型的神奇之处。

当大模型“上岗”电信网络

目前,该电信运营商的各级运维人员都已接入网络大模型。运维方式也发生了实质性改变:专业知识问答、信息筛选、信息总结等工作,都可以交给大模型处理。

不仅如此,大模型在网络规划方面也发挥着重要作用,其推理结果涵盖网络建设、维护、优化和运营决策等场景。基层运维人员可以通过这些结果,实现精准的规则理解与分析,自动核查规则。同时,网络大模型提供的专业知识,也能帮助电信行业进行方案分析与生成。

那么,这与市面上的其他大模型问答产品有何区别?关键在于它的高度垂直性。作为行业“专家”,网络大模型能够深入理解运维人员的需求,生成更精准、个性化的答案。

应对边缘端需求,速度是关键

电信运维场景多处于边缘端,对数据的即时响应速度要求很高。若大模型生成答案需要几分钟,那么对于运营商的网络故障修复来说,将变得拖沓无效。

为此,该电信运营商采用了符合OTII标准的边缘服务器。这类服务器对部署环境要求高,有时甚至需在恶劣环境中运行。这意味着,边缘服务器必须在功耗、体积、耐用性等方面满足特定要求,能够在极端条件下保持正常运行。该运营商采用的OTII服务器可以在55℃以下高温工作,支持IP65,具备EMC ClassB设计和9级地震烈度,且机身小巧,适应挂墙安装等多种需求。

边缘服务器的应用保障了数据的即时交互与响应速度,使首字符延时不到1秒,生成延时约50毫秒,满足了大模型推理的需求。至今,网络大模型已覆盖网络“规、建、维、优、营”全生命周期,围绕知识问答、辅助助手、智能体三个维度,打造了12个AI助手。

网络大模型的性能表现

据悉,该网络大模型在日常应用中,问答准确率达到85%,方案生成可用率90%,故障处置效率提升30%,高危指令稽核效率提升50%。由此可见,网络大模型已成为合格且可靠的AI助手。

CPU的选择:推理的“马达”

在网络大模型中,模型推理是关键环节,直接决定了故障定位和方案生成的速度与准确性。这正是CPU的“主场”。电信行业历来有大量的CPU存量,因此无需引入全新架构,继续使用成熟的CPU方案有多重优势:

  1. 降低成本:该电信运营商作为全球规模最大的通信运营商之一,部署了数百万台X86服务器。这些服务器仍在使用周期内,可以通过软件升级快速实现大模型的部署与应用,降低前期投入。

  2. 确保稳定性:电信业务覆盖广泛,连续性要求极高。X86平台的英特尔CPU架构经过几十年的验证,具备高度的安全性和稳定性,符合电信网络对系统可靠性的需求。

  3. 降低学习成本:作为传统ICT企业,该运营商拥有庞大的IT技术团队,他们对英特尔CPU的微架构、指令集、调优工具等有深入了解。继续使用CPU部署大模型,无需额外学习和培训,降低了技术应用门槛。

第五代英特尔® 至强® CPU的应用

在具体选型中,“网络”大模型方案使用第五代英特尔® 至强® 可扩展处理器作为算力核心,来应对高强度、高并发的推理需求。该处理器拥有更多核心、更强单核性能和更大三级缓存,尤其是LLC容量的提升,使大多数模型参数直接驻留其中,显著提升推理速度。

第五代至强® 还内置了专用AI加速引擎,如英特尔® AMX(高级矩阵扩展),通过创新的矩阵乘法方式提升运算效率,支持INT8、BF16等低精度数据类型,提高指令执行效率。

软件工具和优化

方案还引入了一系列英特尔AI工具,如xFastTransformer(xFT)优化框架,支持多种数据类型和主流大模型,实现从GPU到CPU的无缝迁移。第五代至强® 的能效优势也显著降低了运营成本,能耗较上一代提升高达34%。

边缘服务器的高要求

网络大模型需要部署在生产一线,有时甚至在极端环境下运行,对服务器要求极高。该运营商选用了符合OTII标准的边缘服务器,满足电信边缘场景对开放性、可扩展性的要求,在恶劣环境中保持稳定运行。

CPU在AI推理中的潜力

这次实践表明,选择CPU进行网络大模型推理部署,经过大型企业验证,不仅满足时延、吞吐、功耗等业务需求,推理成本也大幅下降。该方案在2024华彩杯中取得佳绩,为大模型应用树立了标杆。

未来,大模型将深入更多行业,需要在性能、功耗、成本、易用性等方面实现平衡。CPU在AI推理加速上仍然大有可为。

 

国内直接使用ChatGPT4o:

谷歌浏览器直接使用:https://www.nezhasoft.cn

  1. 无需魔法,同时支持手机、电脑

  2. 个人独享

  3. ChatGPT4o mini永久免费

  4. 支持Copilot、DALLE AI绘画、上传文件等

长按识别下方二维码,备注:南阳,发给你

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1535825.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

java项目之基于工程教育认证的计算机课程管理平台(源码+论文)

项目简介 基于工程教育认证的计算机课程管理平台的主要管理员可以管理教师,可以对教师信息修改删除以及查询操作;可以对通知公告信息进行添加,修改,删除以及查询操作;可以对学生信息进行添加,修改&#xf…

算法刷题:300. 最长递增子序列、674. 最长连续递增序列、718. 最长重复子数组、1143. 最长公共子序列

300. 最长递增子序列 1.dp定义:dp[i]表示i之前包括i的以nums[i]结尾的最长递增子序列的长度 2.递推公式:if (nums[i] > nums[j]) dp[i] max(dp[i], dp[j] 1); 注意这里不是要dp[i] 与 dp[j] 1进行比较,而是我们要取dp[j] 1的最大值…

Linux操作系统入门(一)

Linux操作系统是开源的类Unix操作系统内核,由林纳斯托瓦兹在1991年创建。 Linux操作系统以其强大的性能、稳定性和开放性,赢得了全球用户的广泛认可,从服务器到个人电脑,从超级计算机到嵌入式设备,都有它的身影。作为…

进阶岛 任务3: LMDeploy 量化部署进阶实践

进阶岛 任务3: LMDeploy 量化部署进阶实践 任务:https://github.com/InternLM/Tutorial/blob/camp3/docs/L2/LMDeploy/task.md 使用结合W4A16量化与kv cache量化的internlm2_5-1_8b-chat模型封装本地API并与大模型进行一次对话,作业截图需包…

URP 线性空间 ui资源制作规范

前言: 关于颜色空间的介绍,可参阅 unity 文档 Color space URP实现了基于物理的渲染,为了保证光照计算的准确,需要使用线性空间; 使用线性空间会带来一个问题,ui资源在unity中进行透明度混合时&#xff…

Python版《天天酷跑+源码》,详细讲解,手把手教学-python游戏开发

天天酷跑游戏 游戏效果: 游戏主要是躲避障碍物,这里也添加了金币,增加一点积分的娱乐性,人物设置是三条命,障碍物有6种,包括金币,障碍物随机生成,碰到障碍物掉一滴血,没血了结束游戏…

STL之stack

stack容器 - 先进后出” - stack是堆栈容器&#xff0c;是一种的容器。 - 头文件&#xff1a;#include <stack> stack的push()与pop()方法 stack.push(elem);//往栈头添加元素 stack.pop();//从栈头移除第一个元素 stack<int> stkInt; stkInt.push(1);stkInt…

react hooks--概述

前言 ◼ Hook 是 React 16.8 的新增特性&#xff0c;它可以让我们在不编写class的情况下使用state以及其他的React特性&#xff08;比如生命周期&#xff09;。 ◼ 我们先来思考一下class组件相对于函数式组件有什么优势&#xff1f;比较常见的是下面的优势&#xff1a; ◼ …

清理C盘缓存,删除电脑缓存指令是什么

在处理计算机系统的C盘缓存清理任务时&#xff0c;需要谨慎操作以确保系统的稳定性和数据的安全性。通常&#xff0c;Windows操作系统中并没有直接的“一键清理C盘缓存”的单一命令&#xff0c;因为缓存文件分散存储于多个位置&#xff0c;并且有些缓存对于系统性能至关重要&am…

C#命令行参数解析库System.CommandLine介绍

命令行参数 平常在日常的开发过程中&#xff0c;会经常用到命令行工具。如cmd下的各种命令。 以下为sc命令执行后的截图&#xff0c;可以看到&#xff0c;由于没有输入任何附带参数&#xff0c;所以程序并未执行任何操作&#xff0c;只是输出了描述和用法。 系统在创建一个新…

《SpringBoot+Vue》Chapter01_SpringBoot介绍

SpringBoot的介绍 简单来说&#xff0c;SpringBoot就是Spring提供的用于Web开发的脚手架框架。配置简单、上手快速 SpringBoot的特性 自带tomcat、Jetty服务器可以部署war包自动配置Spring框架和第三方框架能够提供应用的健康监控和配置的监控没有代码生成&#xff0c;并且尽可…

HashSet及其实现原理

目录 一、Set二、HashSet三、HashSet的实现原理四、HashSet的线程安全与顺序1、线程安全2、有序性 一、Set Set 接口是 java.util 包下的一个集合接口&#xff0c;它继承自 Collection 接口。Set 接口定义了一个不允许包含重复元素的集合。Set 接口的实现类主要有 HashSet、Lin…

【网络安全的神秘世界】ssrf服务端请求伪造

&#x1f31d;博客主页&#xff1a;泥菩萨 &#x1f496;专栏&#xff1a;Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 ssrf 一、SSRF原理及漏洞演示 1.1 漏洞简介 SSRF&#xff08;Server-Side Request Forgery&#xff1a;服务端请求伪造&am…

3分钟手把手教FL Studio 24.1.1.4285中文破解完整版安装激活图文教程

FL Studio 24.1.1.4285中文破解完整版首先提供了音符编辑器&#xff0c;编辑器可以针对作曲者的要求编辑出不同音律的节奏&#xff0c;例如鼓&#xff0c;镲&#xff0c;锣&#xff0c;钢琴&#xff0c;笛&#xff0c;大提琴&#xff0c;筝&#xff0c;扬琴等等任何乐器的节奏律…

十三,Spring Boot 中注入 Servlet,Filter,Listener

十三&#xff0c;Spring Boot 中注入 Servlet&#xff0c;Filter&#xff0c;Listener 文章目录 十三&#xff0c;Spring Boot 中注入 Servlet&#xff0c;Filter&#xff0c;Listener1. 基本介绍2. 第一种方式&#xff1a;使用注解方式注入&#xff1a;Servlet&#xff0c;Fil…

Linux——应用层自定义协议与序列化

目录 一应用层 1再谈 "协议" 2序列化与反序列化 3理解read,write,recv,send 4Udp vs Tcp 二网络版本计算器 三手写序列和反序列化 四进程间关系与守护进程 1进程组 1.1什么是进程组 1.2组长进程 2会话 2.1什么是会话 2.2会话下的前后台进程 3作业控…

基于Arduino Uno的简易可视化操作界面设计

Arduino UNO是基于ATmega328P的Arduino开发板。它有14个数字输入/输出引脚&#xff08;其中6个可用于PWM输出&#xff09;、6个模拟输入引脚&#xff0c;一个16 MHz的晶体振荡器&#xff0c;一个USB接口&#xff0c;一个DC接口&#xff0c;一个ICSP接口&#xff0c;一个复位按钮…

C++速通LeetCode简单第16题-买卖股票的最佳时机

思路要点&#xff1a;假设当天卖&#xff0c;动态更新最低价格和最大利益 class Solution { public://要点&#xff1a;假设当天卖&#xff0c;动态更新最低价格和最大利益int maxProfit(vector<int>& prices) {int ans 0;int lowest prices[0];for(int i 1; i &…

COMP 6714-Info Retrieval and Web Search笔记week1

哭了哭了&#xff0c;这周唯一能听懂的就这门 目录 IR&#xff08;Information Retrieval)是什么&#xff1f;IR的基本假设Unstructured (text) vs. structuredDocuments vs. Database Records比较文本&#xff08;Comparing Text&#xff09;IR的范围(Dimensions of IR)IR的任…