面向未来的算力网络连接发展趋势分析

 

面向未来的算力网络连接发展特点与实践

   

1e28331c68ceb3c0dded9ddfd92ebb1c.jpeg

AI算力研究:英伟达B200再创算力奇迹,液冷、光模块持续革新

英伟达隆重宣布新一代Blackwell架构,华为对GPU算力需求高达百万片。

英伟达发布的GB200 NVL72 机架级系统内部包括 72 个 Blackwell GPU 和 36 个Grace CPU,引入了第五代 NVLink,其中GPU采用高速铜缆实现电连接,配置5000 根NVLink 铜缆(主要是224G)。铜缆方案或将成为未来趋势。

交换机是算力网络的核心,可以为接入交换机的任意两个网络节点提供独享的电信号通路,具备大缓存、高容量、虚拟化等特征,是算力网络高效传输的基石。随着大数据、云计算、大模型等新型信息技术的发展,对现代通信网络提出了更高的要求。近年来,400G交换机逐渐进入大型数据中心,正在成为大型数据中心的首要选择 。

铜缆是一种成本低、柔韧性好、可塑性强的线缆类型,适用于大多数应用环境。铜缆双绞线是由多股铜芯以特定规则扭绞在一起的线缆类型,在电力输送和网络通信领域应用广泛。结合铜缆自身的优缺点,2022年诞生了一种使用铜缆的400G传输协议,将同轴高速线用在距离较短的机柜内传输。这种协议可以提高数据传输速度,同时降低成本。

光纤传输在时延、带宽和损耗方面相较于铜缆具有明显优势。随着大数据和高性能计算机的快速发展,对算力和网络传输提出了更高要求。因此,亟需加快波分复用光纤(WDM)、CPO、空芯光纤等新型光纤技术的研究与应用。

在51.2T交换机时代,CPO技术凭借其更快更稳定的光传输特性,将确保网络通信能够满足新时代的应用需求。同时,空芯光纤在高性能光通信领域的潜力已得到验证,具备超低时延和宽谱特性等潜在应用前景。

铜缆双绞线的传输距离较短,且存在信号衰减等问题,在数据中心内仅用于设备管理和基础设施设备通信,而不能作为高速传输介质使用。光纤利用光的全反射原理进行信号传输,具有速度快、低衰减、高带宽等特性,通常传输距离100米以上就需要考虑光纤传输,且100G及以上的传输速率超过柜间级别的传输就基本只能使用光纤,如果采用单模光纤传输甚至可达到数公里。光纤常应于柜间、模块间以及数据中心之间互联,完全满足了传统电信业务机房和消费互联网业务为主的数据中心互连需求。

5852e3c8651945a0e781e827f291bc7b.jpeg

非屏蔽铜缆抗干扰能力一般,数据传输容易被监控,仅需物理连接即可获取传输号,甚至控制交互。断裂的铜缆可拼接继续使用,不影响信号传输。屏蔽铜缆有效避免干扰信号,提升安全性。光纤传输的光脉冲难以检测监控,成本高,断裂需特定设备熔接和机械拼接,难度大。

400G传输技术标准的命名规则如下,以SR结尾的表示多模传输,以DR、ER、LR、FR等结尾的通常是基于单模传输,CR是基于同轴的传输形式。IEEE802.3工作组对400G 光模块的命名规则进行了定义,例如400G SR4.2的名称中,400G代表速率是400Gbps,S代表数据中心内部机柜之间互连,距离一般在150米以内,4代表光纤对数,也就是8芯光纤,2代表每芯光纤上有2个波长。

9bd71fb52ecbde81d5cb0c1b21a179b9.jpeg

b4774bdd77e40f27acd5b6b96c948091.jpeg

"在国家“东数西算”宏大战略的推动下,数字中国正迈向深度建设。各领域如电商、娱乐、教育和媒体等,在信息化与人工智能大模型的崛起中,对计算能力的需求日益增长。400G交换机的商用逐渐普及,以其超高带宽、超低时延和极具成本效益的特点,有效解决了电信供应商、大型数据中心及企业面临的流量持续激增的挑战。"

在400G网络布线阶段,各种因素会影响到网络布线的设计。这些因素包括单通道速率、调制方案、波分复用技术类型、传输距离的长短、网络传输接口形式、光纤类型、MTP/MPO系统的Pin针及极性、是否采用预端接布线系统,以及是否考虑使用智能系统AIM或DCIM进行管理等。其中,传输距离是最主要的影响因素。

400G网络传输方式有四种:单通道型,即端口与端口的简单直接连接;四通道并行传输,即采用多个单通道的并行传输;多通道扇出/聚合,即光模块端向下扇出多个单通道/多通道速率的端口;单通道内多波长并行传输,此连接方式主要用于多模型收发器。

400G网络布线方案需要先根据机房平面图以及网络拓扑图来界定交换机端和服务器端的连接数量及对应的长度,明确配线架的密度和水平缆的类型,再按自下往上的顺序进行端口需求分析,明确连接头的类型与跳线的选择,最后得出网络布线传输方案。在高端数据中心建设当中,400G超高密度ENSPACE预端接光产品解决方案是较为成熟可靠的方案之一 。

5a7a16ded2e55eea513cb625b0df22f2.jpeg

算力网络将加快向800G、1.6T等下一代互联速率演进。中国已启动800G的标准化和测试研究。IEEE、OIF、IPEC、CCSA等组织目前正在加速推动800G标准研制工作。2019 年中国信通院与华为等启动DCCNG项目,研究800G的关键技术与应用,并将部分成果应用到IEEE国际标准中;2021年,中国信通院联合中国移动、中国电信、华为和思博伦等启动800G测试研究项目。

2022年发布的51.2T交换芯片支持64端口800Gb/s,标志着800G以太网的开发进入了实际的硬件阶段。2023年,IEEE发布了第一版IEEE802.3df标准,该标准定义了800G以太网的物理层规范。同时,OIF也发布了224 Gb/s标准,为构建800G和1.6T系统提供了112 Gb/s和224 Gb/s通道的指导。按照行业趋势中CPO2-3年的静默期来看,1.6T网络开发预计将在2025年完成。

e08b5c999183666356420e788c952b54.jpeg

中国算力网络发展正逐步迈向算网一体的新阶段。在此之前,我们首先实现了算网协同,优化了基础设施布局,并实现了云计算与网络资源的对接。尽管编排管理层和基础设施层的算网设施在此时仍保持独立,但通过资源协同,我们成功地向客户层输出了算网一体的产品。

在算网融合阶段,基础设施层实现“算”和“网”的初步融合,编排管理层统一管理、编排、调度和运维,服务层持续输出一体化服务。逻辑架构方面,资源管理和服务调度相互融合,呈现真正意义上的“算网产品”。

最终目标是实现算力网络的完全共生,打破技术边界。用户可直接使用多层次、统一化的算力资源,实现存储、计算与网络的融合发展。

关于新型智算中心改造的报告,其中提到了网络成为大模型训练的瓶颈,节点内外多方案并存等问题。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/147892.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【排序算法】插入排序_直接插入排序、希尔排序

文章目录 直接插入排序直接插入排序的基本思想直接插入排序的过程插入排序算法的C代码举例分析插入排序的复杂度分析插入排序的优点 希尔排序希尔排序(Shell Sort)详解希尔排序的步骤:希尔排序的过程示例:希尔排序的C语言实现举例…

S3C2440定时器

ee一、构造 二、设置相关位 1、MPLLCON寄存器(配置MPLL寄存器,进行倍频) 根据下列表格的想要输出的频率进行选择,选择完毕之后,对该寄存器进行设置 2、时钟分频控制(CLKDIVN)寄存器 根据不…

CSP-J 2024 入门组初赛第一轮初赛试题及答案解析

CSP-J 2024 入门组初赛第一轮初赛试题及答案解析 一、 单项选择题(共15题,每题2分,共计30分:每题有且仅有一个正确选项) 1 32 位 int 类型的存储范围是( ) A -2147483647 ~ 2147483647 B -21…

第十四章:html和css做一个心在跳动,为你而动的表白动画

💖 让心跳加速,传递爱意 💖 在这个特别的时刻,让爱在跳动中绽放!🌟 无论是初次相遇的心动,还是陪伴多年的默契,我们的心总在为彼此跳动。就像这颗炙热的爱心,随着每一次的跳动,传递着满满的温暖与期待。 在这个浪漫的季节,让我们一同感受爱的律动!无论你是在…

【深度学习】(4)--卷积神经网络

文章目录 卷积神经网络一、画面不变性二、图像识别三、卷积网络结构1. 原理2. 卷积层3. 池化层4. 全连接层 四、感受野 总结 卷积神经网络 卷积神经网络(Convolutional Neural Network,简称CNN)是一种深度学习模型,特别适用于处理…

基于SpringBoot+Vue+MySQL的校园一卡通系统

系统展示 用户前台界面 管理员后台界面 系统背景 随着现代社会的快速发展,校园一卡通已成为大学生活中不可或缺的一部分。它不仅承载着校园消费的功能,还集成了学生身份证明、图书馆借阅、门禁系统等多种服务。然而,传统的一卡通管理系统往往…

设计模式之策略模式例题

答案:A 知识点: 策略模式又叫模板方法模式 它的意图是定义一个操作中的算法骨架。而将一些步骤延迟到子类中,使得子类可以不改变一个算法的结构即可重新定义算法的某些特定步骤

Elasticsearch——介绍、安装与初步使用

目录 1.初识 Elasticsearch1.1.了解 ES1.1.1.Elasticsearch 的作用1.1.2.ELK技术栈1.1.3.Elasticsearch 和 Lucene1.1.4.为什么不是其他搜索技术?1.1.5.总结 1.2.倒排索引1.2.1.正向索引1.2.2.倒排索引1.2.3.正向和倒排 1.3.Elasticsearch 的一些概念1.3.1.文档和字…

大模型LLM对话模拟器Dialogue Simulator Visualization可视化工具

伴随着生成式人工智能技术发展,进2年涌现出大语言模型LLM/Agent系统/AI推理等众多方向的技术项目和论文。其中对话系统,智能体交互是用户通过UX界面和AI系统进行交互,这种交互有时候也是多模态(用户输入文字/语音/图像&#xff09…

MySQL高阶1919-兴趣相同的朋友

题目 请写一段SQL查询获取到兴趣相同的朋友。用户 x 和 用户 y 是兴趣相同的朋友,需满足下述条件: 用户 x 和 y 是朋友,并且用户 x and y 在同一天内听过相同的歌曲,且数量大于等于三首. 结果表 无需排序 。注意:返…

用最通俗易懂的语言和例子讲解三维点云

前言: 我整体的学习顺序是看的按B站那“唯一”的三维点云的视频学习的(翻了好久几乎没有第二个...)对于深度学习部分,由于本人并没有进行学习,所以没有深究。大多数内容都进行了自己的理解并找了很多网络的资源方便理解…

论文阅读:A Generalization of Transformer Networks to Graphs

论文阅读:A Generalization of Transformer Networks to Graphs 1 摘要2 贡献Graph TransformerOn Graph Sparsity(图稀疏)On Positional Encodings(位置编码)3 Graph Transformer Architecture(架构&#…

阿里HPN-用于大型语言模型训练的数据中心网络

阿里巴巴HPN:用于大型语言模型训练的数据中心网络 探索大规模语言模型训练新方法:阿里巴巴HPN数据中心网络论文。 摘要 本文介绍了阿里云用于大型语言模型(LLM)训练的数据中心网络HPN。由于LLM和一般云计算之间的差异(例如,在流量模式和容错性方面)&…

一份热乎的阿里25届数据分析面试题

目录 阿里巴巴25届数分面试题 想要获取答案,想进一步了解SQL这门艺术语言的,可以订阅我的专栏数字化建设通关指南,将在该专栏进行详细解析。 专栏 原价99,现在活动价39.9,按照阶梯式增长,还差3个名额将上…

如何备份SqlServer数据库

第一步:登录你要备份的服务器数据库ssms 第二步:选择你要备份的数据库 此处已PZ-SJCS 数据库为例 右键该数据库-->任务-->备份 第三步:选择你备份的类型备份组件等,目标磁盘 ,点击添加选择将你备份的文件备份那…

kubernetes网络(一)之calico详解

摘要 本文介绍Kubernetes最流行的网络解决方案calico。 kubernetes中不同宿主上的pod需要相互通信,如果按TCP/IP协议分层进行分类: 二层方案:flannel的udp和vxlan模式 三层方案:flannel的host-gw模式;calico的IPIP模…

pod介绍与配置

1、pod概念介绍 Pod 是 kubernetes 基本调度单位。每个 Pod 中可以运 行一个或多个容器,共享 Pod 的文件系统、IP 和网络等资源,每个 Pod 只有一个 IP。 2、使用 yaml或json 文件创建 Pod 声明式文件方式创建 Pod,支持 yaml 和 json 1&…

【Fastapi】参数获取,json和query

【Fastapi】参数获取,json和query 前言giteegithub query形式json传递同步方法使用json 前言 花了半个月的时间看了一本小说,懈怠了…今天更新下fastapi框架的参数获取 gitee https://gitee.com/zz1521145346/fastapi_frame.git github https://git…

【网络通信基础与实践番外一】多图预警之图解UDP和TCP前置知识

参考大佬的文章https://www.cnblogs.com/cxuanBlog/p/14059379.html 一、宏观架构中的传输层 在计算机中,任何一个可以交换信息的介质都可以称为端系统。计算机网络的运输层则负责把报文从一端运输到另一端,运输层实现了让两个互不相关的主机进行了逻辑…

【洛谷】P10417 [蓝桥杯 2023 国 A] 第 K 小的和 的题解

【洛谷】P10417 [蓝桥杯 2023 国 A] 第 K 小的和 的题解 题目传送门 题解 CSP-S1 补全程序,致敬全 A 的答案,和神奇的预言家。 写一下这篇的题解说不定能加 CSP 2024 的 RP 首先看到 k k k 这么大的一个常数,就想到了二分。然后写一个判…