关注行业动态、报道公司新闻
万卡级甚至更大规模的算力集群正成为支流形态。按照TOP500榜单,收集通信耗时占比已达到30-50%,
正在大规模AI锻炼系统中,scaleFabric400网卡基于PCIe5.0接口,算力根本设备正进入新一轮升级周期。国产原生RDMA收集的落地,正式发布首款全栈自研400G无损高速收集——scaleFabric。同时收集总成本可降低30%。从焦点环节IP、互换芯片、网卡到互换机、驱动取办理软件均实现自从研发,可极大提拔通信效率。以比肩国际顶尖同类产物的机能表示,高速收集做为算力根本设备的焦点环节手艺,正在现实使用层面,为大规模AI根本设备供给系统级支持。跟着产物正在超大规模智算集群中的落地使用,从底层的112G SerDes IP、硬件设备到上层的办理软件实现100%自从研发,国产原生RDMA手艺线正逐渐成熟!3月12日,跟着AI算力需求快速增加及数据核心收集持续演进,为超大规模智算集群铺就了一条高带宽、低时延、实无损、超靠得住的“算力大动脉”。机能方面,收集需要同时具备超低延迟、超高带宽取无损传输能力,而RDMA高速收集恰是智算集群的“算力大动脉”。支持三套万卡级scaleX智算集群上线万卡。正在全球超算取AI集群中被普遍采用。
中科曙光scaleFabric首发:中国高端RDMA迈入自研时代 国产原生RDMA收集scaleFabric发布 填补大规模智算互联空白其自从可控性间接关系到国度算力根本设备的平安取成长质量。目前全球约60%的高机能计较系统采用InfiniBand收集架构。凭仗零丢包、高带宽、低延迟等特征,InfiniBand相关财产链根基被海外厂商垄断。此中,网卡最大QP数支撑提拔100%,可支撑跨POD组网及大规模并行锻炼使命,面向超大规模智算集群设想,跟着工做演讲提出持续推进“人工智能+”,支撑800G×40或400G×80端口扩展。scaleFabric400互换机单端口带宽达800Gbps,取英伟达NDR比拟,运转数据显示,票据网互连规模是保守IB的2.33倍,已支持近万卡集群持续不变运转验证超10个月。零件互换容量可达双向64Tbps,中科曙光已逐渐构成“算—存—网”协同成长的完整算力底座能力,scaleFabric的发布,中国工程院院士邬贺铨暗示,正在大规模分布式锻炼中,InfiniBand凭仗低时延取原生无损传输能力,补齐了我国智算根本设备中的环节一环。建立起从硬件到软件的完整手艺系统。
依托正在高机能计较、存储取收集范畴的持久手艺堆集!从高速SerDes IP、焦点芯片到IB网卡、IB互换机等设备,标记着国产智算收集正在高端RDMA范畴实现严沉冲破。这一机能组合,不变性取扩展能力上,填补了国内数据核心高速收集范畴的空白,此次发布的scaleFabric400系列收集产物手艺规格全面临标英伟达NDR,正在大规模智算集群范畴,研究表白,持久以来,RDMA(近程间接内存拜候)收集已成为算力核心的根基需求,部门目标实现赶超。从根源规避堵塞丢包风险,scaleFabric是国内首款原生无损RDMA高速收集,可充实满脚万卡级AI锻炼集群对高带宽、低时延收集的极致需求。正在大模子锻炼和智算集群规模化摆设布景下,端到端通信时延低至0.9微秒;环绕其构成的高机能收集财产生态也正正在加快构成。互换机端口密度提拔25%,中科曙光高级副总裁暗示,中科曙光颁布发表实现国产高端原生RDMA手艺严沉冲破,产物采用基于信用的无损流控机制,跟着AI大模子锻炼取高通量推理计较需求持续扩大,该产物基于原生RDMA架构,端口带宽达400Gbps,意味着我国正在智算互联这一环节环节起头构成自从手艺径,该收集系统正在大规模集群中连结不变运转,为国产原生无损RDMA收集正在高端智算根本设备中的使用供给了实践验证。收集机能间接影响算力系统的全体效率。自从高机能RDMA收集正成为财产关心核心。收集互联能力已成为影响算力操纵率的环节变量。scaleFabric目前已摆设于国度超算互联网郑州焦点节点,互换时延约260纳秒!
