11月20日,旨在体验和展现人工智能、深度学习领域前沿技术的英伟达GPU技术大会(GTC China 2018)在苏州拉开帷幕,国内知名的信息技术领军企业中科曙光受邀参加了本次盛会,并推出了全新XMachine系列国产AI服务器,备受业界关注。
随着IT技术的迅速发展,如何对海量数据进行更好地处理,对各大厂商提出了挑战。为了满足日益增长的市场需要,曙光XMachine系列国产AI服务器应运而生。
中科曙光本次推出的全新XMachine系列AI服务器主要包括X745-G30、X785-G30、X795-G30、X740-H30,该系列服务器采用统一硬件平台,完全兼容适配NVIDIA公司Tesla系列产品,满足当下主流应用的需求;采用CPU主板和GPU底板解耦合设计,可根据CPU和GPU的发展各自独立升级,降低用户更新换代成本。
正如“道生一, 一生二, 二生三, 三生万物”宇宙生成论阐述的那样,全新一代XMachine系列AI服务器可以做到一个硬件平台,两块不同主板(CPU、GPU),三种不同拓扑,可实现更多种类、更强适应性的AI服务器变化,填补了人工智能服务器领域的技术空白,被业界誉为国产AI服务器中的“变形金刚”。
中科曙光总裁助理、高性能计算产品事业部总经理李斌介绍,“即将量产的全新一代XMachine‘变形金刚’基于Intel Skylake CPU,最多可支持8卡NVIDIA NVLink的GPU、10卡训练GPU、20卡推理加速卡。凭借高性能计算的技术优势、城市云中心和先进计算中心的数据背景,曙光对于推进深度学习应用进一步落地有着清晰的规划。”
作为高性能计算的领导者和AI赋能者,2018年曙光公司在人工智能领域取得了一系列令人瞩目的成绩:人工智能管理平台SothisAI,以其高效稳定、弹性灵活、可为用户“量身定制”等特征,荣膺2018 ECI Awards技术创新类金奖;“面向深度学习应用的开源平台建设及应用”项目成功入选国家发改委2018年重大工程;曙光牵头组建了以人工智能技术为重要技术支撑的“国家先进计算产业创新中心”等等。而此次发布的“变形金刚”系列AI服务器,更进一步为曙光人工智能发展夯实了技术基础。据透露,下一步曙光人工智能研发团队将设计更多的CPU主板和GPU底板。
人工智能是新一轮科技革命和产业变革的重要驱动力量,“变形金刚”AI服务器的推出不仅为业界提供了强劲、多元的计算产品,而且能够帮助用户更快速实现AI计算的更新换代,助力行业实现智能化发展。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。