没人提提曙光的X640超节点架构吗？【中国芯吧】

中科曙光在乌镇世界互联网大会发布 scaleX640，作为全球首个单机柜级640卡超节点，其技术创新集中体现在硬件架构、能效控制、生态兼容与可靠性设计四大维度

看了一下，没有写技术，应该只是硬件应用级的，使用什么协议还不清楚，用电脑来比的话，应该只能算是一个兼容组装机吧，，给那些不想自己装机，又不愿意全盘买单华为或者寒武纪的公司一个选择吧，

这是国内通信产业链的红利，连nv都要找诺基亚合作了

scaleX640 的核心带宽指标是卡间总带宽 1.6TB/s和HBM 总带宽 2304TB/s，这两项数据已在 2025 年 11 月 6 日乌镇峰会官方发布
注：片间互连总带宽 (573TB/s) 与卡间总带宽 (1.6TB/s) 是两个不同指标，前者衡量芯片内部通信能力，后者衡量加速卡之间的通信能力，共同构成了 scaleX640 的多层次高速通信体系。该产品的关键技术（如超高速正交架构、浸没相变液冷技术等）拥有 "100% 自主知识产权，不依赖任何国外专利授权 "，进一步证实了技术来源的单一性。
超高速正交架构：这一核心技术 "源自中科曙光十余年的互联技术研发，经过多代产品迭代优化 "，是实现 573TB/s 片间互连总带宽和 1.6TB/s 卡间总带宽的关键。
一拖二高密架构：这一设计是中科曙光的独创，实现了单机柜 640 卡的超高速互连。
scaleX640 采用 "算、存、网、电、冷一体化紧耦合系统设计
技术实现与架构特点1. 超高速正交架构
全互连网状拓扑：640 张加速卡通过专用高速链路直接连接，无需多级转发
单链路带宽：每条链路带宽达 25GB/s
无转发延迟：数据可在任意两张卡间直接传输，消除传统树形架构的转发损耗
2. 112G 背板线模组
采用112G SERDES(串行器 / 解串器) 技术构建背板线组
实现低至 200 纳秒的片间数据传输延迟（部分测试环境可达）
使 640 张加速卡 "如单一芯片般协同工作"，GPU 间通信效率提升 15 倍
3. 一拖二高密架构
单机柜集成 640 张加速卡，形成高密度计算单元
柜内构建独立通信域，640 卡形成全互连网络
双 scaleX640 可组成千卡级计算单元 (1280 卡)，柜间通过高速网络互连
性能优势1. 超低延迟通信
卡间通信延迟控制在 2 微秒以内（传统架构通常为 10 微秒 +）
某测试环境中延迟低至200 纳秒（0.2 微秒）
比华为灵衢 2.0 (5 微秒) 降低 60%，确保多卡协同训练同步性
2. 超高带宽吞吐
单卡间有效通信带宽≥100GB/s（实际应用中的聚合带宽）
支持每秒百万级交易数据的实时处理（金融风控场景）
某自动驾驶企业基于此平台，每天可处理500TB路测数据，效率提升 40%
超低延迟：微秒级响应的 "神经中枢"
卡间通信延迟控制在 2 微秒以内（部分测试环境低至 200 纳秒），较传统架构的 20 微秒 + 降低 90% 以上
彻底消除多级转发延迟：640 张加速卡通过专用高速链路直接连接，无需经过交换机等中间设备
多卡协同同步性提升：延迟抖动控制在 ±0.5 微秒，确保大规模并行计算中各节点 "步调一致"
性能对比：传统架构 640 卡训练时，因通信延迟导致实际算力利用率仅 60%，而 scaleX640 通过超低延迟设计使算力利用率提升至 90% 以上，整体性能提升 50%
中科曙光 scaleX640 超高速正交架构是全球首个实现单机柜 640 卡全互连的突破性设计，其核心优势在于将传统多级转发的树形架构转变为 "任意节点直连" 的网状拓扑，构建出业界领先的高带宽、低延迟、高可靠通信系统。
核心在于采用 112G SERDES 技术构建的背板线模组，形成 "正交网状" 拓扑结构，使 640 张加速卡中的任意两张都能直接通信，无需经过中间节点转发。这一设计不仅消除了传统树形架构的 "带宽漏斗效应"，还大幅降低了通信延迟，使 640 卡能像单一芯片一样高效协同工作。

scaleX640 实现单机柜 640 卡的关键不是机柜更大，而是采用了革命性的高密度刀片架构，将传统机柜的算力密度提升了 20 倍。一、scaleX640 采用标准机柜，尺寸与普通机柜相同
标准 19 英寸机柜，高度 1.8 米（42U），与普通服务器机柜尺寸完全一致
具体实现：
每个刀片模块采用 "8 卡紧凑布局"，通过定制 PCB 将加速卡、内存、互联芯片高度集成
80 个刀片模块在标准 1.8 米机柜中垂直堆叠，形成 80×8=640 卡的高密度布局
刀片间采用 "分区互联" 设计，消除传统机柜的线缆丛林，节省 70% 布线空间
三、四大核心技术协同，突破高密度极限
1️⃣ 超高速正交架构：通信革命
采用 "全互连正交" 设计，640 卡通过专用高速链路直接互联，无需多级转发
单卡间通信带宽达 100GB/s+，总通信带宽达 1.6TB/s，是传统架构的 10 倍
卡间延迟降至 2 微秒以内（传统架构 10 微秒 +），实现 "万卡如一机" 的协同效果
2️⃣ 浸没相变液冷：散热突破
技术原理：加速卡直接浸泡在绝缘冷却液中，利用液体蒸发吸热原理带走热量，蒸发后在冷凝区液化回流，形成 "蒸发 - 冷凝" 循环
散热能力：
散热效率是传统风冷的 3 倍，单系统可实现 50kW + 散热能力（传统风冷仅 10kW）
确保 640 卡满负载时，温度稳定在 35-45℃，温差不超过 3℃，避免 "热岛效应"
PUE（能耗比）降至 1.1 以下，比传统数据中心 1.8-2.0 的 PUE 节省 40% 能耗
3️⃣ 高压直流供电：能源优化
采用 DC400V 高压直流供电，消除传统交流供电的多级转换损耗
供电效率提升 5-8%，达 96% 以上，支持单机柜 900kW + 的超高功率密度
分区供电策略：每 10 个刀片模块组成一个供电单元，配置 6kW 钛金级电源，智能负载均衡，效率达 97.8%
4️⃣ "一拖二" 架构：系统级创新
一个主柜 + 两个扩展柜的协同设计，主柜负责计算，扩展柜提供互联和散热支持
柜间通过超高速总线连接，支持 "1 主 n 扩" 模式，单集群可扩展至 10 万卡级，扩展延迟≤10μs
液冷柜位于中央，两侧是计算柜，形成热 - 冷 - 热对称布局，提升散热效率
四、总结：密度革命的本质scaleX640 实现单机柜 640 卡的核心不是机柜更大，而是通过系统级架构创新，在标准机柜尺寸内实现了算力密度的 20 倍提升。核心突破点：
空间重构：从 "1U/2U 单卡独立" 到 "刀片高密度堆叠"，将空间利用率提升 500%
散热革新：相变液冷技术解决了 900kW 级散热难题，是高密度的必要条件
互联革命：正交架构让 640 卡形成无阻塞通信网络，释放全部算力潜能
相比传统方案，scaleX640 将 "需要扩建机房获取算力" 转变为 "在现有空间内倍增算力"，为 AI 计算提供了 "小空间、大算力" 的革命性解决方案。

目前的短板在芯片和光刻机上

用的什么芯片，像老黄这种芯片又不是说机柜怎么样先进就能让人插多少卡都行的吧，芯片本身就有限制

****吧！看看中科曙光跌成癞皮狗了，还在这吹牛逼！

这个卡放在绝缘液冷里边挺有意思，以后换卡，还得先把水放干净吗？跟换热水袋一样

有通稿吗，看看

日	一	二	三	四	五	六

没人提提曙光的X640超节点架构吗？

扫二维码下载贴吧客户端