MUSA获得SGLang主线支持！5月10日北京，AI Meetup等你来

摩尔线程MUSA后端，正式加入全球领先的开源推理框架SGLang的官方支持体系，相关代码也已成功合入SGLang主线。

5月10日，北京，一场硬核技术沙龙即将开启。

SGLang、TileLang、Triton、Mooncake等技术大牛，将齐聚一堂，深度探讨「SGLang × MUSA」落地实践，分享推理引擎、算子编译和工程优化的硬核干货。

无论你是框架开发者、算子工程师，还是关注国产GPU生态的AI从业者，将有机会与技术专家进行深度交流，获取行业前沿洞察。（扫描文末二维码报名或预约直播）

这场Meetup的契机，源于一个重磅消息：摩尔线程MUSA后端，正式加入全球领先的开源推理框架SGLang的官方支持体系，相关代码也已成功合入SGLang主线。

MUSA获得SGLang主线支持！5月10日北京，AI Meetup等你来

图注：SGLang GitHub官方仓库展示的 Moore Threads（MUSA）GPU 支持开发规划与路线图

代码合入SGLang主线，标志着摩尔线程全功能GPU获得SGLang“原生支持”（First-Class Support），成为官方后端矩阵一员。

现在，无论是用SGLang框架本体sglang、高性能算子库sgl-kernel，还是多模态生成组件multimodal_gen，开发者均可原生调用摩尔线程GPU，享受极致性能优化。

▼SGLang 开源地址：

https://github.com/sgl-project/sglang

▼SGLang × MUSA Roadmap 地址：

https://github.com/sgl-project/sglang/issues/16565

打破壁垒：

国产GPU融入全球开源生态

SGLang是业界领先的大语言模型推理与服务框架，凭借卓越的吞吐性能和灵活的编程接口，受到开发者广泛关注。

此次，摩尔线程贡献的MUSA后端，原生支持MUSA架构的算子加速与显存管理，同时开源MATE算子库，为SGLang在摩尔线程GPU上的高效运行提供了坚实的核心性能支撑。开发者在AI训推一体智算卡MTT S5000上运行DeepSeek、Qwen等主流模型，可实现“开箱即用”的推理加速。

摩尔线程进入SGLang官方后端矩阵，不仅意味着国产GPU在生态适配上拥有更充分、更直接的兼容路径，也为中文AI社区提供了一条基于国产硬件的高性能推理路径。

开发者只需克隆 SGLang 官方仓库，并执行以下命令，即可获得同时支持大语言模型（LLM）与多模态模型（文生图/文生视频等）的运行能力：

安装 SGLang kernel（MUSA支持）

python setup_musa.py install

安装SGLang及其完整MUSA依赖环境

pip install "python[all_musa]"

未来，随着SGLang官方发布针对MUSA架构优化的正式sglang-kernel build，还可以通过以下命令安装专为摩尔线程硬件优化的kernel版本：

pip install sglang-kernel --index-url https://docs.sglang.io/whl/musa<<version>>

MUSA开源技术沙龙：

SGLang × MUSA Meetup

为庆祝这一重要合作，摩尔线程联合SGLang社区将于5月10日（周日）下午在北京举办技术Meetup，采用「线下活动 + 线上直播」双通道形式。

▼ 议题一：框架适配与架构演进

SGLang核心贡献者Xiaoyu Zhang（BBuf）与摩尔线程核心贡献者，将分享SGLang Roadmap、kernel优化、Vibe Coding应用、MUSA移植落地等。

▼ 议题二：算子编译与性能优化

Triton、TileLang项目技术大牛，揭秘算子工程，分享高性能算子生成、MUSA专项优化、MATE技术协同。

▼ 议题三：系统整合与生态共建

Mooncake等明星项目专家将探讨训推一体系统与开源社区协同，共建 AI 新生态。

诚挚邀请开发者朋友们

扫码报名线下参会，或预约线上直播，与技术大牛面对面，共探 AI 无限可能。

来源：业界供稿

0赞

好文章，需要你的鼓励

MUSA获得SGLang主线支持！5月10日北京，AI Meetup等你来

来源：业界供稿

2026

04/30

10:37

分享

点赞

手机上的"氛围编程"时代正式来临

技术通常为年轻人创造就业，AI会做到吗？

AI驱动美国储能市场创季度新高，2030年预计突破610GWh

突破内存瓶颈：HBM、CXL与GPU新部署策略

光掩模技术面临新挑战：瓶颈、曲线图形与数据难题

低温焊料在芯片小片与光子学领域的关键作用

Chiplet经济学：成本如何影响芯片产业发展？

定制化单板计算机如何提升嵌入式视觉系统的盈利能力

Anthropic企业市场份额首超OpenAI，AI模型支出激增

用谷歌街景模拟真实世界场景，Project Genie 全面升级

保加利亚启用谷歌云强化国家网络安全防御

Forward品牌升级推出网络预测新能力

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: