中国移动完成首个 800G 以太网城市群智算中心分布式训练现网试验
【导语】7月14日,中国移动携手新华三、朗美通在河北移动鹿泉智算中心成功完成业界首次800G以太网智算协同训练的现网技术试验。此次试验采用创新IP与光融合方案,大幅降低成本、功耗及时延,实现超高容量传输,有效解决城市群算力碎片化问题。该成果标志着中国移动在800G以太网技术和国际标准领域的持续引领,为后续构建全球领先的AI算力网络基础设施奠定坚实基础。
7 月 14 日消息,中国移动联合新华三、朗美通在河北移动鹿泉智算中心,于 7 月 11 日完成业界首次 800G 以太网智算协同训练的现网技术试验。
本次试验采用 IP 与光融合 GSE-DCI 路由器方案,实现支持多个 800G 波长通道的彩光以太组网(Nx800G)。相较传统“路由器 + 传输设备”方案,新技术降低 40% 单比特成本、35% 功耗及 20% 节点时延。在跨智算中心 700 亿参数大模型训练中,采用流水线并行(PP)方式,实现 98% 以上的等效算力效率,是探索跨智算中心互联的新架构和新技术的重要突破。
中国移动在中长距离 800G 以太网技术和国际标准领域持续发力。2024 年,中国移动在 IEEE 802.3 工作组牵头完成 800G 以太网 20km 标准立项,是由中国公司主导的首个 IEEE 以太网基础标准立项;同时主导的 20km 和 40km 标准技术框架被 IEEE 采纳,统一了 800G 以太网 20~120km 技术标准路线。
基于此标准基础,本次试(shì)点(diǎn)采用了大容量路由器直接接入 800G 中长距彩光以太网模块的方案,单台设备将路由功能和长距光传输融合,单光纤可支持 25.6T(基于 32 波长 800G)的超大容量传输,避免了传统方案中“路由器 + 传输设备”组网带来的高功耗、高时延和高成本问题,满足了大模型协同(tóng)训(xun)练(liàn)对(duì)超(chāo)高(gāo)带宽与高密度接口的严苛要求。
本次试验主要面向京津冀、长三角等区域城市群内分散部署的智算中心场景。这些智算中心通常在百公里级围绕城市群构建。新技术通过以太网彩光直接互联,将分散的算力资源高效整合,以低成本实现“聚沙成塔”,解决城市群算力碎片化问题。
本次试点验证了 GSE-DCI 两大核心技术创新。
一是以太网层负载均衡:流量在多个 800G 波长通道上均衡分担,避免了流量分布不均问题。
二是IP 层快速拥塞控制:创新的广域快速拥塞感知(CNP)技术,通过设备主动监控网络拥塞并及时通知数据发送端降速,克服长距离传输引发的拥(yōng)塞(sāi)感(gǎn)知(zhī)延(yán)迟(chí)和(hé)吞(tūn)吐(tǔ)量(liàng)下(xià)降(jiàng),实(shí)现(xiàn)端(duān)侧(cè)广(guǎng)域长(zhǎng)距(jù)无(wú)感(gǎn)。
中(zhōng)国(guó)移(yí)动(dòng)表(biǎo)示(shì),本(běn)次(cì)试(shì)验(yàn)验(yàn)证(zhèng)了(le)基(jī)于(yú) IP 与(yǔ)光(guāng)协(xié)同(tóng)的(de) GSE-DCI 技(jì)术(shù)架(jià)构(gòu)的(de)可(kě)行(xíng)性(xìng)和(hé)先(xiān)进(jìn)性(xìng)。后(hòu)续(xù),中(zhōng)国(guó)移(yí)动(dòng)将(jiāng)继续推进 GSE-DCI 技术体系的完善,重点探索原创的 SuperPipe、PhySec 和 FlexLane 等新技术,致力于构建全球领先的 AI 算力网络基础设施。
微信公众号搜索“ 新能源 ”加关注,最新环卫前沿洞察、企业动态、产品公告全面了解。推荐关注!