4月9日,2020浪潮云数据中心合作伙伴大会(IPF2020)在线上举行,超过5000家合作伙伴在线出席本次大会。在会上,浪潮提出智慧计算的新基建是智算中心,浪潮将全力深化人工智能、开放计算两大战略性业务布局,通过持续的产品技术创新和生态发展,强力助推新基建建设,并将加速向全球服务器第一的目标迈进。
浪潮集团执行总裁、首席科学家王恩东指出,当前人工智能计算需求正呈指数级增长,未来将占据80%以上的计算需求,智算中心就是承载这种需求的AI算力中心,将是智慧时代的新型基础设施。随着人工智能被纳入“新基建”框架,承载、供应人工智能计算力的智算中心势必会成为社会经济运行的核心基础设施之一。
为此,浪潮将围绕AI算力的四大关键作业环节持续创新,即生产算力、聚合算力、调度算力、释放算力,实现AI计算力的全流程、一体化的高效交付,通过AI计算生产方式的变革促进人工智能应用的效率变革,进一步加速智慧新基建建设。
生产算力需要最领先的算力机组,浪潮目前拥有业内最强最全的AI计算产品阵列,NF5488M5是业界性能最好的Transformer训练服务器,MX1是全球首个可支持多家不同型号的AI芯片直接更换的AI开放加速系统,最新研发成功的AI大模型计算框架LMS,可将NLP智能语言模型参数规模突破73亿,相比业界主流水平提升20倍以上。聚合算力依托最敏捷的数据中心,浪潮NX20智能网络加速产品可以打造更高效率更低延迟的云中心,而针对高并发推理集群,浪潮通过构建高性能存储池和深度优化软件栈,吞吐能力提升3.5倍以上。调度算力从而赋力更多创新可能,浪潮AIStation训练平台实现高效共享算力、加速AI研发创新,全新发布的AIStation推理平台帮助企业轻松部署推理服务、提速AI生产交付。释放算力实现快速落地进化AI,浪潮AutoML Suite帮助客户实现企业级一站式 AI 模型自动构建,支持本地化和云端部署,支持并行高效模型搜索,可自动建模、自动模型压缩、自动超参调整,实战表现超出专家模型水平。
而据IDC发布的中国AI基础架构市场报告显示,浪潮近3年一直位居AI服务器中国市场份额第一,市场占有率超过50%。
此次大会浪潮发布了全新的AIStation推理平台,使得AIStation资源平台全面支持训练与推理两大环节,实现从模型开发、训练、部署、测试、发布、服务的全流程一站式高效交付。
最新发布的AIStation推理平台通过弹性可伸缩架构、低延迟轻量化设计、A/B测试滚动发布、多模型加权评估等重要技术创新,有力地帮助企业轻松部署推理服务,从而大幅提升AI生产交付效率: 1 生产上线快速容易:AI模型从开发环境到生产部署繁杂过程的自动化快捷操作,以往部署一个模型需要两三天,现在可降到几分钟。支持本地On-Premise和云端Cloud部署,保证服务的可获得性和业务连续性;2服务资源敏捷调配:可根据推理服务资源需求的变化及时调整资源配给,响应突发需求的实例部署时间从几小时缩短到几分钟,支持新模型发布前A/B测试,保证服务的平稳上线和可靠运行;3多源模型统一调度:通过统一平台管理多源、多场景模型的推理服务,全局资源实时掌控,对模型服务实现综合调度和动态部署,同一资源池可同时支持多家模型服务,资源利用率从40% 提高到 80%.
元脑生态由浪潮联合具备AI开发核心能力的左手伙伴和具备行业整体方案交付能力的右手伙伴共同组成,聚合了最强的AI算力平台、最领先的AI算法模型能力和最优质的集成部署和服务能力,有力支撑和加速各产业与人工智能的快速融合,使之具备可感知、自学习、可进化的能力,最终帮助产业用户完成业务智能转型升级。
元脑生态发布以来,已经汇聚了众多业界领先的AI科技公司和TOP级行业ISV、SI,AI头部能力汇聚已初具规模。2020年,加速产业AI应用落地是元脑生态发展的目标。为此,浪潮宣布将投入亿元资金成立促进元脑生态发展的专项基金——“E基金”,以推动元脑生态的可持续发展,旨在通过与左手伙伴和右手伙伴的紧密联动,以生态之力成就行业AI大脑,加速产业AI化进程。
浪潮携手元脑左右手伙伴已经在金融、铁路、电力、交通、智慧城市、石油石化等行业领域实现了产业AI化落地。在金融行业,浪潮和声扬科技、赞华一起推出的 “智慧声纹识别”解决方案在某大型银行落地,该方案可实现通过2秒手机数字语音即可确认客户身份,电话信道1比100万top1命中率超过90%,1比1声纹确认为同一人准确率99.7%,大幅提升了银行在客服、风控方面的工作效率。在国家交通的大动脉的铁路运输行业,浪潮联合元脑合作伙伴鼎汉奇辉和中铁信息工程集团打造智慧车站方案已在中国铁路5个站点应用,针对智能识别特定人群和人流拥挤等情况的识别精度高达98%,并实现了AI高清货检和客运站智能管理,大大促进了铁路的智慧转型。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。