国产超节点开窍向“千卡”!384一夜失宠?
一直以来AI大模型痛点太突出了。从来不是算力不够,而是被生态绑定的“束手束脚”。要么选择华为昇腾,接受 CANN 生态的封闭限制,放弃 CUDA 生态的海量既有资产;要么硬扛 CUDA 迁移成本,在多品牌加速卡适配中消耗大量研发精力。我们真的没有第三条路了吗?
当然不是。
据说2025 乌镇世界互联网大会,曙光将发布千卡超节点,直接把这道难题给解了。
如果说384是性能猛兽,曙光千卡则是生态巨鲲。
前者优势在于“专”。全栈自研的技术路径,从芯片到软件生态的深度优化,为国产算力搭建了单点标杆,16 万卡级集群的成熟部署,让大规模算力应用有了可落地的范本。
难度小,局限也同样明显。仅支持自家昇腾 910 系列芯片,上下游必须基于 CANN 生态开发,难以复用CUDA生态的既有技术资产。这种“链主主导”的模式,虽然能催熟自有生态,但长期来看用户对绑定式采购的抵触情绪逐渐显现,也难形成对抗英伟达的体系化力量。
而开放式路线则走了一条 “先难后易”的路径,也因此,行业里早有厂商尝试做兼容工具,但要么适配范围窄,要么性能损耗严重。
曙光此前的突破,是把 UPTK 和 OpenDAS 基础软件栈、DAP 应用平台凑成了“铁三角”——UPTK 解决编程适配,OpenDAS 做全栈性能优化,DAP 打通应用落地,形成了全链路的支撑。这意味着,国产加速卡不仅能 “自由切换”,还能把硬件性能充分释放出来,不用再为兼容牺牲效率。
现在整个行业都在盼着这种工具链的成熟。毕竟只有打破 CUDA 的垄断,国产加速卡才能真正形成合力,企业也不用再在单芯片绑定和高成本适配之间二选一。乌镇大会上,曙光这波操作大概率会成为行业风向标,接下来肯定会有更多厂商跟进开放工具链,国产算力生态的协同效应,这下要彻底爆发了。
页:
[1]