MiniMax M2.7是业界首个具备深度自我进化能力的大模型,能够自主构建Agent Harness,通过Agent Teams协作、复杂Skills调用及Tool Search Tool等能力完成复杂生产力任务,甚至深度参与自身迭代。在软件工程领域,M2.7支持端到端完整项目交付、日志分析排障、代码安全审查及机器学习任务;在专业办公场景,其Excel/PPT/Word高保真编辑与多轮修改能力显著提升,即使在超长上下文复杂任务中仍保持稳定的高水平skills遵循率。与此同时,该模型对长上下文处理、复杂Agent任务调度及高保真编辑等场景提出了极高的计算效率要求。

针对上述挑战,摩尔线程技术团队基于MUSA架构完成深度调优,成功在MTT S5000上实现M2.7大模型的高性能推理,核心技术优势包括:
超长上下文高吞吐:依托MTT S5000的80GB大容量显存、1.6TB/s高带宽及PD分离架构,配合高效KV Cache管理,支撑MiniMax M2.7长时间、多步骤任务的稳定执行。
全精度端到端支持:MTT S5000原生支持FP8至FP64全精度计算,可满足代码生成、金融建模等场景对混合精度及高精度计算的要求,确保决策精准可靠。
高算力低延迟推理:MTT S5000单卡可提供1000 TFLOPS稠密算力,结合vLLM-MUSA定制化调优,实现复杂Agent Harness与高频工具调用场景下的低延迟响应。
强大生态兼容性:深度兼容PyTorch、vLLM、SGLang、Triton等主流生态,通过MUSA C++、Triton-MUSA、TileLang-MUSA等抽象层实现新算子“零成本迁移”,确保前沿模型发布当日完成极速适配。
此次Day-0适配是摩尔线程常态化技术响应能力的再次体现。依托 MUSA 架构对主流AI生态的深度兼容与持续演进,国产全功能GPU算力底座已形成覆盖前沿模型“极速适配-高效部署”的全链路支撑体系,帮助开发者以更快响应、更稳运行、更低迁移成本第一时间接入最新模型能力,加速大模型创新落地与规模化应用。
开发者可下载镜像进行开箱体验:registry.mthreads.com/presale/devtech/vllm_musa:MiniMax-M2.7
好文章,需要你的鼓励
谷歌宣布为旗下互动世界构建工具Project Genie新增Google街景功能,用户可基于真实地点生成可探索的游戏世界。只需选定美国境内的地图位置,描述角色形象,并选择"沙漠"或"石器时代"等风格,系统即可生成与现实街景绑定的沉浸式虚拟场景。每次游玩时长限60秒,支持WASD操控,目前仅向AI Ultra订阅用户开放,后续将逐步扩展覆盖范围。
新加坡国立大学构建了首个视频隐喻理解基准ViMU,含588段视频与2352道题,测试16个主流AI模型均未超过50%,揭示AI在视频潜台词理解上的系统性短板。
随着AI编程工具的普及,越来越多的非开发者开始尝试自己构建应用。谷歌在I/O大会上宣布,AI Studio新增功能可让用户通过提示词快速生成原生Android应用,并直接导出到手机。此外,谷歌还推出了基于Gemini的自定义小组件功能,并提出"生成式UI"概念,让手机界面根据需求实时生成。与此同时,苹果据报道也在探索通过提示词创建快捷指令的功能,手机个性化体验或将迎来新突破。
浙江大学等机构联合提出PanoWorld,通过球面空间交叉注意力和57万张全景图训练数据,让AI能直接理解360度全景图的空间结构,在导航和视觉搜索任务中大幅超越现有方法。