至顶网服务器频道 01月07日 新闻消息(文/Nancy):2019年1月7日,华为宣布推出业界最高性能ARM-based处理器——鲲鹏920(Kunpeng 920),以及基于鲲鹏920的TaiShan服务器、华为云服务,并携手产业伙伴推动ARM的产业发展。
华为董事、战略Marketing总裁徐文伟在发布会上表示:“华为在计算领域围绕客户价值持续创新;我们预见,随着智能社会的到来,未来这一领域还将持续增长。当前业务和数据的多样性带来了异构计算的需求,长期以来,华为与Intel共同合作取得了很好的成绩,为ICT产业发展作出积极贡献,华为与Intel将长期保持战略合作、持续创新。同时,ARM产业迎来新的发展机会,华为本次发布鲲鹏920及TaiShan服务器,主要应用于大数据、分布式存储、ARM原生应用等场景。”
据介绍,鲲鹏920是目前业界最高性能ARM-based处理器。该处理器采用7nm制造工艺,基于ARM架构授权,由华为公司自主设计完成。通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高处理器性能。典型主频下, SPECint Benchmark评分超过930,超出业界标杆25%。同时,能效比优于业界标杆30%。鲲鹏920以更低功耗为数据中心提供更强性能。
鲲鹏920主频可达2.6GHz,单芯片可支持64核。该芯片集成8通道DDR4,内存带宽超出业界主流46%。芯片集成100G RoCE以太网卡功能,大幅提高系统集成度。鲲鹏920支持PCIe4.0及CCIX接口,可提供640Gbps总带宽,单槽位接口速率为业界主流速率的两倍,有效提升存储及各类加速器的性能。
此外,基于华为鲲鹏920芯片,华为同步推出基于鲲鹏920的TaiShan系列服务器产品,包括均衡型,存储型和高密型三个机型。TaiShan系列服务器主要面向大数据、分布式存储和ARM原生应用等场景,发挥ARM架构在多核、高能效等方面的优势,为企业构建高性能、低功耗的新计算平台;例如大数据场景,实现了多核高并发和资源调度调优,计算性能提升20%。基于TaiShan服务器,华为云也将提供弹性云服务、裸金属服务和云手机服务。
华为认为,万物互联、万物感知和万物智能的智能社会正加速到来,基于ARM的智能终端应用加速发展并出现云端协同;与此同时,云计算下的新业务让数据类型越发多样性,如大数据应用、分布式存储和部分边缘计算等,这些场景应用对多核(Many Core)高能效计算提出明确需求,在性能和功耗方面具有优势的ARM计算系统将发挥作用。
从行业趋势和应用需求看,多样性计算时代正在到来,多种数据类型和场景驱使计算架构的优化,多种计算架构的组合是实现最优性能计算的必然选择。没有一个单一的计算架构能够满足所有场景、所有数据类型的处理,目前各种CPU、DSP、GPU、AI芯片、FPGA等同时存在,多种计算架构共存的异构计算,是未来的发展之路。
华为发布的基于 ARM 架构的鲲鹏 920,再次将ARM 服务器芯片性能推向新高度。徐文伟表示,ARM 产品的优势在于高性能与低功耗,是为提供更好客户价值而做出的 “自然选择”。鲲鹏 920 芯片的发布后,有望与此前已投产的麒麟 980 手机芯片,以及昇腾 910 人工智能芯片一起,帮助华为构建起结合云服务的物联生态体系。不过,华为并不是一家专门生产芯片的公司。徐文伟强调,“华为不是要与 Intel 竞争,更不会替代。布局芯片主要是看到了由于数据多元化带来的计算多元时代。”
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。