近日,联想集团宣布基于联想问天WA7780 G3服务器,在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型,以低于行业公认1TGB显存(实际768GB)承载多并发用户流畅体验,可以满足千人企业的使用需求,为行业树立了企业级大模型部署新基准。
联想问天WA7780 G3大模型训推一体服务器
突破性能限制,树立DeepSeek-R1大模型部署新基准
作为全球关注的焦点,众多企业正准备在本地化部署DeepSeek大模型。然而,在落地实施过程中用户普遍面临以下关键决策难题:单机能否部署满血版DeepSeek R1?所需最低配置是什么?如何确保高并发与吞吐量下的优质体验?如何避免采购陷阱?
联想此次突破为企业提供科学选型指南。针对行业公认1TB显存是千亿参数大模型运行基线的背景下,联想研发团队通过专家并行优化、智能访存架构升级及PCIe 5.0全互联架构创新,大幅提升了显存利用率,从而实现了性能的提升。
据了解,联想WA7780 G3服务器在2月初已实现单机768GB GPU显存条件下部署DeepSeek 671B R1和V3满血模型,并能满足中小企业的并发需求。进而通过联想万全异构智算平台的访存优化,专家并行调用策略等技术优化手段,实现了单机一个月内并发能力增长10倍, 同时还提升了每路用户的TPOT、TTFT等综合性能体验
持续优化升级,解决用户体验难题
联想的这一创新成果揭示了设备选型的新维度,也提醒企业审慎评估各种测试数据,摒弃对总吞吐量和总并发数等指标的片面追求,而应从用户体验出发,关注这些指标背后的隐藏信息,如数据精度等。实际上,如果将数据精度从FP8转为int8或int4(即量化),虽能明显改善性能表现(如更高并发量和高吞吐量),但会牺牲结果的准确性,显然这不是用户所期望的。
需要特别指出的是,高吞吐量和高并发量也并不等同于用户体验好。若服务器GPU卡配置不高,局部通信瓶颈可能引发响应延迟使体验降级,这正是联想着力解决的难点之一。
毫无疑问,联想技术突破将有效破除大模型落地瓶颈,显著加速大模型在企业的落地进程。未来,联想基础设施业务群与联想研究院ICI实验室将继续携手合作,依托联想万全异构智算平台对DeepSeek平台从AI预训练、后训练到推理的全流程进行持续优化,为客户奉献出性能更佳、性价比更高的产品和解决方案,以加速DeepSeek大模型的落地,推动新一轮生产力革命。
好文章,需要你的鼓励
OpenAI推出ChatGPT Images新版本GPT Image 1.5,承诺更好的指令遵循、更精确的编辑功能和高达4倍的图像生成速度。该模型面向所有ChatGPT用户和API开放。这是OpenAI在CEO奥特曼宣布"红色警报"后与谷歌Gemini竞争的最新升级。新模型提供后期制作功能,支持更精细的编辑控制,能在编辑过程中保持面部相似度、光照、构图和色调的视觉一致性,解决了传统AI图像工具迭代编辑时缺乏一致性的问题。
艾伦人工智能研究所开发的olmOCR 2通过创新的单元测试训练方法,将文档识别准确率提升至82.4%,在处理复杂数学公式、表格和多栏布局方面表现卓越。该系统采用强化学习和合成数据生成技术,实现了完全开源,为全球研究者提供了先进的OCR解决方案,推动了AI技术民主化发展。
Zoom推出AI Companion 3.0,采用联邦AI架构结合自研模型与OpenAI、Anthropic等第三方大语言模型。新版本具备智能工作流、对话式工作界面等功能,可将会议对话转化为洞察、进度跟踪和文档内容。系统支持加密传输,不使用客户内容训练模型。用户可通过ai.zoom.us访问,或以每月10美元独立购买。
苹果公司发布了包含40万张图片修改案例的AI训练数据集Pico-Banana-400K,涵盖35种修图操作类型。该数据集采用严格质量控制,包含成功失败案例对比和多轮修图场景。研究显示AI在全局修改方面表现优秀,但精细操作仍有挑战。这为AI修图技术发展奠定基础,未来将让修图软件更智能易用。