3月17-18日,以“智算创见 数实相融”为主题的2022浪潮信息生态伙伴大会(IPF22)举行。浪潮信息总裁彭震在演讲中表示,数实相融是一个逐级演进的过程,我们将面对更复杂的场景、更巨量的信息以及更高效的决策需求,需要以全新的智算架构,融合算力、算法、数据、网络,推进数实相融,推动质量变革、效率提升以及新旧动能的转换。
浪潮信息总裁彭震
创新驱动世界加速变化,随着数字世界与物理世界的深度融合,浪潮信息全面升级了数实融合基础设施框架,加速构建面向智慧时代的算力、算法、数据、互联的创新体系,发挥智算生态的产业聚合作用,筑牢数实相融的智算底座。
以大算力+大模型为核心,全面布局智算基建化
彭震表示,算力和算法是智算中心的核心,要想产生一流的智慧,就必须要有一流的算法,同时算法的高效运转要依赖领先的算力,算力基建化和算法基建化相辅相成。
算力基建化以算力服务为核心,通过智算中心操作系统的统一调度并对外服务,把计算力像水和电一样提供给千行百业;算法基建化则通过在智算中心部署大模型所需要的训练、推理和数据处理系统,构建出自然语言处理大模型、视觉大模型和多模态大模型,同时,以模型API服务、领域模型、开发者社区的形式对外提供算法基础服务,缓解企业面对大模型训练成本高、技术门槛高的问题,真正让算法普惠大众,助力行业智慧应用高效开发,加速行业和产业AI化。
会上,浪潮信息发布了由“源”大模型生成的最新技能模型,包括知识增强的对话模型、知识检索问答模型、中英文翻译模型、古文理解模型。“源”大模型可以更加快速地生产出专业的技能模型,从而在更多专业场景中实现小型化、轻量化的落地运作。目前,“源”大模型也已经落户南京智能计算中心,以模型API服务、技能模型、开发者社区的形式对外提供算法基础服务。
“All In液冷”践行双碳
随着“碳达峰、碳中和”目标加速落地,各行各业的低碳转型进入深水区。数据中心如同一座“不冒烟的钢铁厂”,年用电量占全社会总用电近3%,而采用传统风冷的数据中心PUE为1.8-2.0,这与实现国家目标的PUE<1.3还有差距。浪潮信息长期聚焦绿色数据中心技术和产品创新。
绿色降碳是智算发展必然趋势
彭震表示,2022年,浪潮信息将“All In液冷”纳入公司发展战略中,全面布局冷板式、热管式、浸没式等液冷设计开发,实现服务器全产品线支撑液冷,并进一步升级液冷智算中心解决方案,实现数据中心PUE<1.1。
IPF大会期间,浪潮信息与京东云联合发布天枢(ORS3000S)液冷整机柜服务器,该产品支持冷板式液冷,与传统风冷式整机柜相比,能耗降低45%。
此外,还发布了“钱塘江”液冷智算中心,升级算力基础设施方案。“钱塘江”液冷智算中心是浪潮信息联合燧原科技打造的绿色智算中心整体解决方案,采用浪潮信息先进成套液冷技术,智算中心整体PUE降至1.1以下。
为促进液冷规模化、标准化,浪潮信息已建成亚洲最大的液冷数据中心研发生产基地——天池,形成了从研发、测试、生产、交付的全链条液冷智造能力,年产量达10万台。天池基地已经实现业界首次冷板式液冷整机柜的大批量交付,整体交付周期在5-7天之内。
布局领先智算产品技术体系
作为全球领先的新型IT基础设施供应商,浪潮信息将持续巩固算力系统、云数智软件平台层面的优势,提供硬件重构的智算整机系统,包括通用计算系统、智算加速系统,也会面向海量数据和高速互联提供智算存储和数据中心交换机产品。
会上智算创新产品悉数亮相,首款元宇宙服务器 MetaEngine重磅发布,为元宇宙数字空间的创建和运行提供强大算力;推出新一代SSD高速存储介质,采用ZNS数据分流等技术,性能提升210%,每GB成本下降60%。同时,会上还展示了围绕通用计算、AI计算、关键计算、边缘计算、存储、云、网络等领域的创新成果。
此外,浪潮信息将技术栈持续往底层延伸,面向不同的场景,开发定制化的AI加速、网络加速和存储加速产品。最终形成覆盖物理设施、芯片/加速卡、整机系统、系统软件的领先产品体系。秉承异构加速、多元融合、软件定义及高效制冷的产品理念,不断完善并创新面向未来的领先智算产品,帮助企业把握数实相融的产业发展机遇期。
深化元脑生态,聚力共赢
在智算生态建设层面,2022年,浪潮信息还将继续推行“智算合伙人”理念,持续壮大元脑生态,具体包括升级元脑平台AIStore、加速分销智慧转型、行业智能方案共创、伙伴赋能加油站等四大举措。为此,浪潮信息将为伙伴培训技术专家5000人以上,增加行业智算方案开发费用投入。
彭震表示,浪潮信息将以智算为引领,持续深化元脑生态,以创新应答数实融合的发展机遇。
根据IDC最新数据,浪潮信息的服务器产品2021年稳居全球前二,持续领跑中国市场;2021年上半年浪潮信息的AI服务器产品市场占有率位居全球第一,市占率超过20%。根据Gartner最新数据,浪潮存储连续三个季度保持全球前五,分布式存储跃居全球前三。根据Synergy的最新数据,浪潮信息服务器连续10个季度位居全球公有云基础设施计算市场份额第一。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。