案例
AI智算 共赢未来

算力组网调优(苏北)

项目痛点

· 区域算力缺口:苏北缺乏大规模AI算力基础设施,制约区域数字化转型与AI产业发展;

· 万卡级集群技术挑战:传统网络架构难以支撑万卡级GPU通信,存在带宽瓶颈与延迟问题;

· 智能化管理需求:超大规模集群人工运维成本高,故障定位效率低,缺乏自动化管控。


方案内容

规划万卡集群,首期164台H800服务器构建4000P算力池;

IB组网:400G IB算力网+200G IB存储网,消除万卡训练网络拥塞,时延降低至μs级;

云平台统一管理(虚拟化+容器调度),实现资源池化、任务智能调度和智能运维,降低后续运营成本;


方案价值

· 技术价值:苏北首个可扩展至万卡的AI算力枢纽,填补区域高性能算力空白;

· 经济价值:高性能IB组网,训练效率提升15%,运维管理平台,运维人力节省40%+,云平台统一资源管理,利用率提升至80%+;

· 产业价值:为区域数字经济提供4000P公共算力底座,驱动千亿级AI生态发展型训练任务如期开展。


相关案例