4月16日,以“智慧凝聚”为主题的IPF2019浪潮云数据中心合作伙伴大会在上海举行,中国工程院院士、浪潮集团执行总裁王恩东在大会演讲时指出,人工智能正在驱动前所未有的社会变革,这一颠覆性技术依赖强大的计算力支撑,人工智能计算作为一种当下及未来的主要计算形态,正在成为智慧未来的核心动力。
当前,智慧计算时代已经来临,云计算、大数据和人工智能等典型智慧计算应用场景已经成为主流信息化形态。根据IDC数据,全球基础架构投资正在流向云计算、人工智能、大数据等新一代业务负载。
“智慧时代,计算力就是生产力,计算力指数是衡量一个国家、地区,甚至是企业发展水平的重要指数。”王恩东对计算力的价值做出了如上判断。从全球GDP与服务器出货量的分布来看,全球GDP排名前四的美国、中国、日本、英国,服务器采购量同样排名前四。中国市场有着相同的分布规律,北、上、广、浙每万亿GDP的服务器出货量远大于其他省区,这些地区的新旧经济升级明显快于其他地区。
“人工智能计算是未来核心动力,代表着智慧计算的发展方向。”与去年不同的是,王恩东今年将人工智能摆在了“放大镜”下,给予了超乎寻常的关注。
人工智能推动了各个行业从信息化向智慧化的升级,提高了社会经济的效率,并在多个行业引发了新一轮商业模式的创新,如在金融领域,智能分析系统能够秒级完成人工一年36万小时的合同分析工作;在制造领域,富士康现在已经用智能机器人代替了一半以上的劳动力。
从宏观来看,人工智能发展将成为中国经济增长的新引擎,相关数据显示,到2035年人工智能领域的经济总量在整体经济的占比将达到20%。浪潮与IDC联合发布的《2018-2019年中国人工智能计算力发展》报告中提出,目前国内主要城市人工智能计算力的建设状况和走势, 处在第一梯队的城市是杭州、北京、深圳、上海等,都是经济最为活跃和高度数字化转型的典型城市。
在现场,王恩东以英伟达新推出的DRIVE PX Pegasus车辆计算平台为例,它的计算性能可以达到320万亿次每秒,在人工智能方面的表现能力等同于100台服务器,“人工智能芯片的增长率11倍于通用计算,今后几年里人工智能计算力增长速度将远超通用计算。”
人工智能计算是未来核心动力,那么浪潮将如何拥抱正在到来的人工智能时代呢?对此,王恩东表示,浪潮的智慧计算战略将进一步聚焦人工智能,加大投入人工智能业务。
浪潮是全球人工智能计算领先企业,在计算平台、管理套件、框架优化、应用加速四个层次致力于打造敏捷、高效、优化的人工智能基础设施。根据IDC公布的2018上半年中国人工智能基础架构市场调查报告,浪潮人工智能服务器以51.4%的绝对优势蝉联中国市场第一,超过了其余所有厂商份额的总和。
另外,浪潮开始参与甚至主导人工智能的产品技术标准和性能评测标准。在OCP社区,浪潮加入了OAM(OCP Accelerator Module)项目组,参与了第一代OAM标准的制定。在全球系统性能评测标准组织SPEC中,浪潮率先发起成立Machine Learning技术委员会,贡献了首个工作负载,目前担任首届委员会主席,Intel为秘书长单位,协同Alibaba、AMD、ARM、HPE、IBM等12个成员,共同制定深度学习的性能测试规范和开展相关基准测试工作。
“融合、开放与敏捷将是人工智能计算最重要的三大发展趋势,它们将对围绕人工智能计算构建而成的整个AI产业生态体系,提出新的变化和要求。”王恩东对人工智能计算未来的发展趋势有着非常清晰的认知。
技术开放融合推动了产业层面的开放融合,技术创新的加速让产业的敏捷化程度不断提高,但同时带来了生态问题——生态发展滞后于应用需求。针对当下人工智能生态面临的困局,浪潮提出要打造百花齐放的人工智能产业生态。
截止至2018年底,浪潮共有合作伙伴9000多家,全面开发联合解决方案400多个,其中人工智能联合方案20多个,由此产生的销售额200多个亿。人工智能百强企业中80%都与浪潮有着深度的合作,合作伙伴不仅包含BAT等互联网厂商,也包括第四范式、宽邦、暗物质、商汤等人工智能新兴独角兽,还有大量行业ISV。
2019年,人工智能生态将进一步成为浪潮整个生态体系的“第一生态”,为此浪潮将聚焦计算机视觉、语音识别、自然语言识别、量化交易等四个基础应用场景,发展100家以上的合作伙伴,开发100个以上的联合解决方案,帮助400家以上的传统ISV建立人工智能技术能力,覆盖金融、企业、通信、教育等8个主流行业。
经过多年的高速增长,人工智能已经形成了完整的产业体系。传统行业的应用在人工智能产业发展中扮演着越来越重要的角色。根据IDC数据,2018年上半年中国人工智能基础架构市场销售额和出货量分别同比增长176%和129%,包括金融、电信等12个领域在内的传统行业市场销售额和销量同比增速分别高达293%和219%。IDC、埃森哲等调查机构都曾表示,传统行业是人工智能产业更大的发展空间,是“冰山的水下部分”,这一观点正在变成现实,也就是在人工智能形成产业以后,迎来了“产业AI化”的发展时期。
人工智能业务正在拉动浪潮业绩的持续高速增长。根据Gartner数据,2018年,浪潮服务器销售额和出货量增速均为业界最高,其中销售额同比增长83.9%,市场份额提高了2.5个百分点,稳定全球前三。而对于人工智能产业生态的重大投入,将为浪潮提供持续的增长动力,加速推进全球第一的目标。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。