世界上90%的数据是在过去几年里产生的——事实上,过去30年中,全球的数据量大约每两年增加10倍,这远远超过了计算机领域的摩尔定律。“数据的海量增长向人类提出一项要求,那就是我们必须迅速掌握像人工智能这样的技术手段来应对大数据提出的挑战。”曙光公司首席运营官叶健如是说。
“大数据平台助力提高分析与推理速度,高性能计算则帮助提高了AI的学习速度。”叶健表示,新信息环境与人工智能技术相结合将催生“实时系统智能”,例如智慧城市、智能医疗、智能交通等。
大数据、高性能计算、人工智能相得益彰
“由于各类传感器和数据采集技术的发展,人们开始拥有以往难以想象的海量数据,同时也开始在各个领域拥有深度的、细致的数据。” 叶健说到,这些正是训练该领域“智能”的前提。大数据与AI发展都需要“快”,而“快”恰是曙光的特点和基因。
叶健说,海量数据、高速并行运算、更优化的算法共同促成了人工智能的突破性发展;而互联网环境中的许多环节都是在一边学习一边应用的过程中实现的。大数据、高性能计算、人工智能三者像是踏上了一个共同前进的节拍,相得益彰。
“与以往传统的算法相比,立足于神经网络的人工智能技术利用输入的数据自行模拟和构建相应的数学模型。”叶健解释说,这一算法特点决定了它更为灵活且可以根据不同的训练数据而拥有自优化的能力。
如今,人工智能在大数据及高性能计算的驱动下,已经在各个领域实现了价值。商品推荐、社交图谱、智能客服乃至无人驾驶等都已经依靠深度学习和其他人工智能方法,实现了巨大的商业价值。
助力社会走向实时系统智能
纵观人工智能60多年的发展史和历史上的几次起落,人工智能这次的变革“大不同”。叶健分析说:“首先,人工智能的基础发生了改变,已经从以往的样本分析变成了如今的大数据、多媒体数据、传感器网的流数据以及AR和VR的复杂系统。其次,从社会需求来看,人工智能不再满足于研究个体的智能,而是希望研究整个系统的智能,甚至是实时系统智能。”
“随着虚拟世界与物理世界的界线不断模糊甚至趋近于相互融合,人工智能正在走向2.0时代。” 叶健表示,实时系统智能已在诸多应用场景中大显身手,如通过预研人脸采集比对预警、实时视频图像预警、视频录像情报分析系统预研防控及情报业务,启动情报加指挥双引擎,达到反恐的实时布控;通过利用入侵检测系统提供的功能并结合异常分析,准确报告攻击行为,实现网络犯罪模式的实时识别;移动警务视频云平台通过支持数千点位移动警务终端的视频直播和点播等功能,做到视频监管立体全覆盖,以利于快速研判,为重大活动道路交通疏导、交通事故现场处理、交通应急事件处置等提供有效决策依据和业务支持。
叶健认为,未来,新一代人工智能应该沿大数据智能、群体智能、跨媒体智能、人机混合增强智能和自主智能系统方向发展,并在商务、医疗、制造等各个领域产生深刻影响。
“曙光2015年提出‘数据中国’战略,目前已经积累了大量的云计算和大数据技术和应用经验,接下来,曙光将借助人工智能技术优势,在‘数据中国’的基础上进一步实施‘数据中国智能计划’,致力于将人工智能和中国的信息化合为一体,使信息化的线路从数字化发展到网络化,最后进展到智能化。”叶健说,在人工智能变革大潮的机遇中,曙光将依靠大量数据的滚动,将数据的累积、迭代和自动标注形成一个良性循环。
好文章,需要你的鼓励
RiOSWorld是一项开创性研究,评估多模态计算机使用代理在真实环境中的安全风险。由上海人工智能实验室团队开发的这个基准测试包含492个风险任务,涵盖网页浏览、社交媒体、操作系统等多种应用场景。研究将风险分为环境源和用户源两大类,通过风险目标意图和完成两个维度进行评估。对十个代表性MLLM代理的测试结果表明,当前代理在风险目标意图上的不安全率高达84.93%,在风险目标完成上达59.64%,揭示了AI代理在计算机使用安全性方面存在的严重隐患,为未来可信AI系统的开发提供了重要参考。
牛津大学林元泽及其国际合作团队开发的IllumiCraft是一种创新的视频重光照技术,它首次将几何和光照引导统一到一个扩散模型中。通过同时处理HDR环境图、合成重光照帧和3D点轨迹,该技术能生成与用户提示一致的时间连贯视频。研究团队还构建了包含20,170个视频对的高质量数据集,实验表明IllumiCraft在视觉质量、提示对齐和时间一致性方面显著优于现有方法,开创了可控视频生成的新可能。
中国人民大学物理学院研究团队开发了HTSC-2025,这是一个专为AI预测超导临界温度而设计的常压高温超导体基准数据集。该数据集包含140个样本,涵盖了2023-2025年基于BCS理论预测的超导材料,平均Tc为27.3K,最高达160K。研究不仅提供了公开的评估框架,还总结了提高超导温度的物理策略,如空穴掺杂和轻元素引入。该基准已在GitHub开源,为AI驱动的超导材料发现提供了重要支持。
MBZUAI研究团队开发了FinChain,这是金融领域首个可验证的符号化思维链推理基准测试。该基准涵盖12个金融领域的54个主题,每个主题包含5个不同难度的参数化模板,配有可执行的Python代码验证每一步推理。研究者还提出了ChainEval评估指标,同时评估最终答案正确性和中间推理步骤一致性。对30个大语言模型的测试表明,即使最先进模型在处理复杂金融推理时仍有很大提升空间,且模型规模是决定推理能力的关键因素。