[db:作者] 发表于 2025-9-30 10:00

对话CANN开发者:国产AI生态如何从“可用”迈向“首选”?

2025年8月5号,华为轮值董事长徐直军干了件大事,宣布昇腾背后的CANN架构要全面开源,还说年底前肯定完成。

现在AI行业早不是比谁算力猛了,说白了,拼的是软件、码农和生态这些“护城河”。
国产AI要转型,华为这步棋算是站在了风口上。
本来想把CANN开源说得像个普通技术更新,后来发现真不是。
这事儿对国产AI生态来说,相当于从“自己闷头干”改成“喊大家一起干”,既要跟CUDA这种老大哥掰手腕,还得让更多码农愿意来用。

为了搞懂这事儿到底有啥意义,我找了三个懂行的人聊了聊,哈工大的苏统华教授、无问芯穹的李秀红、华南理工的陈昀博士,他们说的话,倒是把CANN的门道讲透了。
早期玩CANN:跟“刀耕火种”似的,开发者没少遭罪陈昀博士有个比喻特形象,他说AI框架是大厦,算子就是砖头,他每天干的就是磨这些砖头。
但早年磨这些“砖头”,简直是遭罪。
2018年CANN刚出1.0版本的时候,要求码农快到汇编层面写代码,这跟用手刨地种庄稼没啥区别,效率低得吓人。

就算后来版本更了,陈昀他们调算子还得手动管流水排布、内存调度,一行代码改半天是常事。
那会儿做开发,不是在调bug就是在等bug出现的路上。
苏统华教授更惨,他团队花一年写了本CANN应用案例的书,结果审核时被告知“底层软件全重写了”。
一年的活白干,还得再花一年重做,换谁都得崩溃。
这事儿也能看出来,早期国产AI生态就是“摸着石头过河”,连石头稳不稳都不知道。
本来以为工具慢慢会好,可还是有绕不开的坎。

比如模型在昇腾上跑,精度经常跟别的框架差一大截,底层信息又不透明,根本找不到问题在哪。
苏教授说,有些学生碰到这情况,都快不想做这行了。
还有调试工具也不全,想找个像GDB那样能回溯断点的功能都没有,优化性能全靠经验猜。
如此看来,早期CANN就算能用,也只是“凑活用”,离“好用”差得远。
开源+工具升级:CANN终于让开发者“能喘气”了难归难,CANN也没闲着,慢慢磨出了些好用的“家伙事儿”,后来开源一搞,才算真给开发者松了绑。

先说工具,AscendC编程语言出来后,苏教授说终于能跟CUDAC对标了。
以前用TIK、TBE方案,又费劲性能又差,现在总算有了主流的编程方式。
还有个叫Profiling的工具,能把NPU怎么干活的细节全显示出来,比如利用率多少、有没有带宽瓶颈。
陈昀就用它把一个算子的利用率从一半提到了快90%,他说那感觉跟爬山登顶似的,之前的苦都值了。

但真正的改变还是开源。
以前底层是黑箱,码农碰到问题只能等华为更新,现在编译器、运行时的代码全公开了。
苏教授说,企业客户再碰到深层问题,不用等几个月,自己改改代码就能解决。
我觉得这才是关键,开源不是放代码玩,是把主动权还给了开发者。
而且跟CUDA比,人家核心组件还没全开放,CANN这步算是走得更彻底。
门槛也降了不少。

比如CATLASS算子模板库,以前得硬件专家才能搞的活,现在调调参数就行,一个月的活一周搞定。
苏教授团队还搞了Python接口,AI算法工程师不用学C++,也能用上昇腾的算力。
这么改下来,愿意来试CANN的人肯定会变多,毕竟谁都不想跟复杂的底层死磕。
要建“国产AI大厦”:CANN想让大家一起添砖工具好用了,开源也搞了,华为接下来想的是怎么把生态做大,说白了,就是找“最大公约数”,让更多人愿意来共建。
首先是架构拆细了。

以前CANN软件包又大又乱,改个小功能得等整体更新。
现在拆成20多个小组件,码农想用哪个更哪个,灵活多了。
而且不同层级开放程度也不一样,核心的运行时、编译器全开源,需要稳定的指令集就只开接口,既保证创新又不破坏兼容性。
这招挺聪明,毕竟生态不能只追求开放,还得稳。
然后是成立了技术指导委员会,26个人里有高校教授,也有华为、讯飞这些企业的人。

以前是华为自己说了算,现在大家一起决策。
我觉得这很重要,生态不是一家的事,多听点不同意见,才不容易走偏。
比如之前投票搞的“算子贡献激励计划”,就有15家企业加入,这就是共治的好处。
人才培养也没落下,跟16所高校合作搞孵化中心,还开了专项课程。
还有算子挑战赛、训练营,能吸引不少年轻人。
毕竟生态再牛,没人用也白搭。

华为还说每年投1500P算力、3万片开发板,资源给得挺足。
不过大家都清楚,现在还在追赶阶段,先把CUDA的短板补上。
但真正的目标是“原生创新”,就像李秀红说的,等有了类似FlashAttention那样的革命性工具从CANN生态里出来,才算真的从追赶者变成引领者。
如此看来,CANN的路还没走完,但方向是对的。
最后想说,CANN这些年的变化,其实就是国产AI基础软件的缩影,从早期的艰难拓荒,到现在的开放共建。

苏教授说“人越多生态越旺”,陈昀说要搞零门槛社区,李秀红说要做好基础软件让别人创新。
我觉得这话没毛病,国产AI的大厦,不是华为一家能盖起来的,得靠千万个开发者一起添砖加瓦。
接下来就看,有多少人愿意走进这个开源的圈子,一起把这事干成了。
页: [1]
查看完整版本: 对话CANN开发者:国产AI生态如何从“可用”迈向“首选”?