摩尔线程 × 上海AI实验室｜基于S5000和KernelSwift实现DeepSeek-V4核心算子Day-0适配

摩尔线程携手上海 AI 实验室 DeepLink 团队，通过大模型驱动的智能算子迁移系统 KernelSwift，率先在旗舰级AI训推一体智算卡 MTT S5000 上完成了核心算子的Day-0适配。

今日，DeepSeek-V4预览版正式发布并开源。摩尔线程携手上海 AI 实验室 DeepLink 团队，通过大模型驱动的智能算子迁移系统 KernelSwift，率先在旗舰级AI训推一体智算卡 MTT S5000 上完成了核心算子的Day-0适配。目前算子通过率已超80%，真正实现了模型发布与国产算力适配的同步落地。这一成果不仅为开发者提供了无缝部署体验，更彰显了 KernelSwift 与 MUSA 软件栈在生态协同中的强大支撑作用。

支撑多元国产芯片Day-0适配，KernelSwift极致提升开发效率

KernelSwift作为支持多元算力的智能算子迁移系统，可提供指定芯片的Triton算子定制优化服务。以高级抽象与自动算子生成，KernelSwift将适配周期从数月压缩至小时级，为多元国产AI芯片提供“开箱即用”的高性能算子支持，助力Day0适配计划的真正落地。在公开数据集 Kernelbench 上，KernelSwift 实现 SOTA 级别的表现，可自动生成的高性能算子覆盖语言大模型和科学大模型；并基于深度学习编译器（DLCompiler）实现编译器到算子生成全链路支撑，摆脱单一生态绑定。

国产算力底座标杆：MTT S5000硬核支撑前沿模型

摩尔线程旗舰级全功能AI训推一体智算卡MTT S5000专为大模型训练与推理设计，其核心亮点在于原生支持FP8精度，并配备硬件级FP8 Tensor Core加速单元。相比国内主流芯片普遍依赖的BF16/FP16，FP8可将数据位宽减半，使显存带宽压力降低50%、理论计算吞吐量翻倍，从而更高效地承载DeepSeek-V4等前沿模型所需的“FP4+FP8”混合精度策略，为模型部署与推理提供坚实的算力底座。

深度协同优化，释放极致性能

在DeepSeek-V4模型发布后，KernelSwift基于摩尔线程MTT S5000启动全自动流程生成核心算子，全程无需人工干预。得益于摩尔线程对Triton的全面支持以及MUSA软件生态的高兼容性与开放架构，KernelSwift得以快速完成与MTT S5000的对接验证。在此基础上，DeepSeek-V4模型共计21个核心算子均实现明显加速，算子通过率超过80%；自动生成的算子经少量人工修改后在MTT S5000上实现100%正确性。

算子筑基，共筑国产AI生态新范式

KernelSwift 与 MTT S5000 在 DeepSeek-V4 上的Day-0协同落地，充分展示了国产 AI 生态的高效协作，为国产算力生态从技术研发走向大规模应用积累了重要经验。摩尔线程 MUSA 软件栈与 KernelSwift 的深度融合，证明了国产全功能 GPU 能够即时响应最前沿的大模型需求，为构建自主可控、高效敏捷的 AI 基础设施树立了标杆。未来，摩尔线程将持续联合生态伙伴，推动更多前沿模型在国产算力平台高效部署，加速 AI 生态向“好用”和“领先”跨越。

▼ KernelSwift 在线体验链接：

https://deeplink.org.cn/kernelswift

▼ DeepSeek-v4算子代码仓：

https://github.com/DeepLink-org/DLBlas/tree/add-dsv4-kernels/dlblas/kernels/kernelswift_triton/level3

来源：业界供稿

0赞

好文章，需要你的鼓励

摩尔线程 × 上海AI实验室｜基于S5000和KernelSwift实现DeepSeek-V4核心算子Day-0适配

来源：业界供稿

2026

04/25

11:11

分享

点赞

手机上的"氛围编程"时代正式来临

技术通常为年轻人创造就业，AI会做到吗？

AI驱动美国储能市场创季度新高，2030年预计突破610GWh

突破内存瓶颈：HBM、CXL与GPU新部署策略

光掩模技术面临新挑战：瓶颈、曲线图形与数据难题

低温焊料在芯片小片与光子学领域的关键作用

Chiplet经济学：成本如何影响芯片产业发展？

定制化单板计算机如何提升嵌入式视觉系统的盈利能力

Anthropic企业市场份额首超OpenAI，AI模型支出激增

用谷歌街景模拟真实世界场景，Project Genie 全面升级

保加利亚启用谷歌云强化国家网络安全防御

Forward品牌升级推出网络预测新能力

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: