大动作,摩尔线程正式发布并开源面向GPU底层算子生成的专用代码大模型MusaCoder。
MusaCoder是业内首个完全基于国产全功能GPU算力底座完成全链路训练与验证的开源代码大模型,它主要是解决底层算子(Kernel)的开发效率问题。
目前绝大多数通用代码大模型擅长写的是应用层代码。而MusaCoder则专注于GPU底层算子的编写。这部分工作过去极度依赖高薪且稀缺的底层算子工程师。
而现MusaCoder可支持从PyTorch标准算子自动生成高性能CUDA/MUSA原生Kernel代码。这可以降低开发者手写底层GPU算子的门槛,提升GPU高性能计算场景下的代码生成、验证和优化效率。
它的完整后训练流程,全都是在基于摩尔线程MTT S5000芯片构建的夸娥智算集群上跑完的。这也直接证明了国产GPU集群不仅能跑模型推理,也完全具备了训练大模型的能力。
从性能上来说,在专门测试算子生成能力的KernelBench严格评测中,MusaCoder-27B-RL 模型的表现超越了超越Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6等国内外主流SOTA代码模型,性能比肩行业顶尖水平。
在芯片行业,一般是硬件决定下限,软件决定上限。英伟达之所以有如今的垄断地位,不仅仅是因为硬件强,更因为其苦心经营了十多年的CUDA生态。国内GPU厂商想要破局,就必须兼容或者建立自己的软件生态。
而摩尔线程选择将MusaCoder开源,就是一个非常聪明的生态打法。通过降低开发者编写国产GPU底层代码的门槛,能够吸引更多开发者进入摩尔线程自己的MUSA生态,从而加速国产算力在实际业务中的落地替代。