随着社会智慧程度的提高,海量数据收集、分析、处理带来的挑战越来越大。数据中心作为智能化的核心基础设施,未来会成为科技新基建的主线之一。
数据中心与人工智能结合愈发紧密
在第十五届中国IDC产业年度大典(IDCC 2020)上,浪潮信息副总裁、浪潮服务器产品线总经理沈荣接受记者采访时表示,当前人工智能的发展离不开算法和算力增强,而这些都与数据中心密切相关。
一方面,数据中心越来越多承担人工智能等应用,人工智能计算需求未来将占据80%以上的计算需求。这就需要大量的AI服务器部署到数据中心,而浪潮提供了平台、管理和框架等领域的全栈AI方案。
沈荣表示,当数据量越来越大,未来一定是异构计算的世界,也就是“术业有专攻”,不同的工作负载需要专业的芯片进行处理,这也是现在GPU、FPGA、AI加速处理器等不断涌现的原因。
另一方面,人工智能技术也可以用于数据中心的智能化运维,比如机器巡检、故障预测和负载管理等。这些智能化场景改变了整个数据中心的管理方式,毕竟数据中心规模越来越大,承载的业务也日趋多样化,如果采用人工方式显然是无法应对的。
“数据中心的运维如何从以人为本到以智为本,通过算法和数据模型、历史使用等数据,实现自动化的运行和无人值守,这是当前很多用户非常需要的技术。”沈荣说。
开放计算成为行业共识与选择
在数据中心集中化、规模化、绿色化的趋势下,开放计算正在成为主流选择。开放计算在成本和效率方面,都将对未来数据中心的设计和建设产生重大的影响,并且加速AI、边缘计算、新型节能等新兴技术的普及。
沈荣表示,无论是互联网数据中心,还是传统行业数据中心,它们对硬件基础设施的需求存在共性,比如绿色、高效、智能等等,这是开放计算得以跨界的共性基础。开放计算起源于互联网,壮大于互联网,但在未来,传统行业对于开放计算的接纳度会越来越高。
虽然互联网行业是开放计算的最大用户,但是浪潮也在推动开放计算在传统行业中的落地,而且行业客户在采用开放计算之后的收益也是显而易见的。
沈荣表示,以前按照传统数据中心的建设模式,一套集群从交付上一般都要在30到40天,集成还要花费10天左右。但通过开放计算的整机柜方式,硬件的部署速度可以缩短到一周以内,并且通过将研发环境集成在应用,大大节省了运营交付的时间,在时间、密度、性能和管理上均有了质的飞跃。“通过开放的基础构架,数据中心可以在部署密度提升4倍的同时,通过集中化的解决方案使整体系统功耗降低了15%,同时系统硬件故障率降低了60%。开放体系也有助于一体化交付的实施,降低整体的部署成本。”
比如浪潮整机柜服务器SR全面应用于中国移动,采用机柜级模块化设计,集中供电、散热和管理,功耗节省20%,空间利用率高达90%,客户投资回报率提升33%,拥有一体化极简设计和超高的灵活性,可以满足不同的应用需求;浪潮为某省农信提供了以整机柜服务器SR为核心的解决方案等,相较传统服务器,交付速递提升8-10倍,部署密度提升6倍,通过RMC集中管理单元实现整个系统资源的实时监控。
虽然开放计算正在展现出越来越大的发展潜力,但在沈荣看来,需要更多的组织与开发者加入到这一生态体系之中。
“开放计算的模式强化了知识共享、技术共享,所以开放计算很重要的一件事情是规模化和互通性,形成规范标准。”沈荣说,“浪潮不会自己做一套标准体系,开放涉及很多工作,组织的参与,产品的贡献,大家在一起交流,推动社区的发展。”
标准的制定非常重要,一开始就先确立标准,这样可以避免野蛮生长。目前,浪潮正在推动开放计算项目与新兴技术领域的融合。在AI领域,浪潮与OCP积极推进OAM规范的开发,解决AI计算基础设施建设中硬件分裂化和生态割裂化的重大挑战,推进最新技术的应用落地;在边缘计算领域,2017年浪潮与中国移动、电信、联通等运营商发起OTII项目,形成运营商行业面向电信应用的技术及方案,更好地应对未来5G及边缘时代的到来;在新型节能技术领域,浪潮正推动ODCC、OCP等项目中的开放浸没式液冷技术在行业的应用,帮助数据中心的PUE降到1.1,甚至接近1的水平,而目前传统的数据中心PUE做到1.6左右已经是非常好的结果。
展望未来,开放促进技术进步、生态繁荣。开放变革了IT产业的生产模式和应用服务模式,持续推动着信息技术的发展,促进了整个IT产业的生态繁荣。随着智慧时代的到来,扮演“技术底座”角色的开放计算将为各行各业的数字化转型提供强有力的支撑。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。