2018年11月27日,北京——在今年 “数博会” 期间许下的承诺,贵州华芯通半导体技术有限公司 (以下简称 “华芯通”) 完成了兑现。11月27日,华芯通在北京国家会议中心举办新品发布会,宣布其第一代可商用的ARM架构国产通用服务器芯片—昇龙4800 (StarDragon 4800) 正式开始量产。国家互联网信息办公室信息化发展局、国家发展改革委员会高技术产业司、工业和信息化部电子司等中央部委和贵州省大数据局、贵州省工业和信息化厅、贵安新区管委会等贵州政府领导,以及国家集成电路产业投资基金、赛迪研究院、华芯投资、高通公司、绿色计算产业联盟、贵州华芯公司等合作伙伴的负责人出席发布会,共同见证昇龙4800的量产和上市。
华芯通由贵州省政府与美国高通公司联合出资成立。此前,在今年5月的数博会上,华芯通宣布将于2018年年底之前推出其第一代服务器芯片产品,当时该芯片已经完成研发设计工作、流片试产成功。时隔半年,这款定名为昇龙4800的服务器芯片在通过了一系列一线客户的性能测试和验证后,正式从“幕后”走向“台前”,将接受订单实现量产。
作为华芯通推出的第一代产品,昇龙4800是兼容ARMv8架构的48核处理器芯片,在CPU设计和性能表现方面堪称惊艳。其采用目前服务器领域先进的10nm制程工艺封装,在400平方毫米的硅片内集成了180亿个晶体管,每秒钟最多可以执行近5000亿条指令。昇龙4800拥有低功耗、高性能双重优势,在性能上可媲美国际市场上的主流高端服务器芯片产品。此外,在安全性方面,昇龙4800内部集成符合中国商用密码算法标准的密码模块,结合安全可控的基础架构,为应用系统的信息安全提供芯片级的技术实现。
华芯通持续不断地与硬件、软件和应用生态伙伴共同打造具体应用场景的解决方案和性能优化。这些生态系统合作伙伴涵盖服务器整机系统、固件、操作系统内核、各种虚拟化技术、云架构软件、云存储、数据库和安全等领域。目前,昇龙4800已在大数据分析、Web前端、分布式存储、安卓云、网络虚拟化和可信安全等应用方面取得了众多客户的积极反馈。
华芯通致力于提供目前国产最先进的ARM架构服务器芯片。从服务器CPU设计能力、性能表现,安全性以及稳定性方面考量,昇龙4800已达到国产化服务器芯片设计的顶尖水平,这标志着华芯通正式进入国产化服务器芯片的第一阵营。同时,华芯通已经制定清晰的技术演进路线图,通过昇龙4800的推出,为下一代产品的技术演进打下坚实基础。
华芯通在昇龙4800新品发布会上介绍,其新产品的市场定位是数据中心服务器市场,如互联网、电子政务外网、电信运营商、大型企业等,为对服务器芯片的国产化替代方面有需求的领域提供有力的支持。
2014年以来,我国相继出台了《国家集成电路产业发展推进纲要》,成立了国家集成电路产业投资基金,以加大集成电路产业投资布局。随后,我国集成电路自给率大幅提高,在不少终端设备上已采用国产芯片。然而,在保持着高增长态势的服务器等IT基础设施方面,大量依赖进口国外CPU的局面并未发生根本性改变。
华芯通半导体CEO汪凯博士表示:“基于ARM架构并融合了高性能和低功耗双重优势的华芯通昇龙4800服务器处理器,能够充分满足目标用户的现实需求,为在能耗比、性价比方面有严苛要求的客户,同时提供安全性和可靠性,是其寻找国产化替代解决方案的理想选择。”
诸多云服务供应商、ARM产业生态上下游合作伙伴及软件,硬件提供商参加了发布会,包括阿里巴巴、腾讯、京东金融、京东云、白山云、360、中兴、浪潮、中国联通、中国移动、联想、东大金智、ARM、三星Foundry、铿腾电子科技等。其中美团、创新科、华东电脑、技嘉等企业在现场对运行在昇龙4800系列上的ARM数据中心的应用进行了介绍或演示。
美团云计算负责人钟红军表示:“美团看到了华芯通第一代商用服务器芯片的潜力,在中国蓬勃发展的ARM服务器生态系统中,我们相信昇龙4800处理器系列拥有巨大的增长契机。”
创新科存储技术有限公司董事长陈凯表示:“很高兴能和华芯通进行合作,以满足我们基于高性能、低功耗的ARM架构处理器的服务器和存储设备在产品化和规模化的部署。创新科希望和华芯通共同推进IT设备软硬件平台的全面国产化,以满足电子政务云和新一代数据中心的建设需求。”
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。