11月20日,旨在体验和展现人工智能、深度学习领域前沿技术的英伟达GPU技术大会(GTC China 2018)在苏州拉开帷幕,国内知名的信息技术领军企业中科曙光受邀参加了本次盛会,并推出了全新XMachine系列国产AI服务器,备受业界关注。
随着IT技术的迅速发展,如何对海量数据进行更好地处理,对各大厂商提出了挑战。为了满足日益增长的市场需要,曙光XMachine系列国产AI服务器应运而生。
中科曙光本次推出的全新XMachine系列AI服务器主要包括X745-G30、X785-G30、X795-G30、X740-H30,该系列服务器采用统一硬件平台,完全兼容适配NVIDIA公司Tesla系列产品,满足当下主流应用的需求;采用CPU主板和GPU底板解耦合设计,可根据CPU和GPU的发展各自独立升级,降低用户更新换代成本。
正如“道生一, 一生二, 二生三, 三生万物”宇宙生成论阐述的那样,全新一代XMachine系列AI服务器可以做到一个硬件平台,两块不同主板(CPU、GPU),三种不同拓扑,可实现更多种类、更强适应性的AI服务器变化,填补了人工智能服务器领域的技术空白,被业界誉为国产AI服务器中的“变形金刚”。
中科曙光总裁助理、高性能计算产品事业部总经理李斌介绍,“即将量产的全新一代XMachine‘变形金刚’基于Intel Skylake CPU,最多可支持8卡NVIDIA NVLink的GPU、10卡训练GPU、20卡推理加速卡。凭借高性能计算的技术优势、城市云中心和先进计算中心的数据背景,曙光对于推进深度学习应用进一步落地有着清晰的规划。”
作为高性能计算的领导者和AI赋能者,2018年曙光公司在人工智能领域取得了一系列令人瞩目的成绩:人工智能管理平台SothisAI,以其高效稳定、弹性灵活、可为用户“量身定制”等特征,荣膺2018 ECI Awards技术创新类金奖;“面向深度学习应用的开源平台建设及应用”项目成功入选国家发改委2018年重大工程;曙光牵头组建了以人工智能技术为重要技术支撑的“国家先进计算产业创新中心”等等。而此次发布的“变形金刚”系列AI服务器,更进一步为曙光人工智能发展夯实了技术基础。据透露,下一步曙光人工智能研发团队将设计更多的CPU主板和GPU底板。
人工智能是新一轮科技革命和产业变革的重要驱动力量,“变形金刚”AI服务器的推出不仅为业界提供了强劲、多元的计算产品,而且能够帮助用户更快速实现AI计算的更新换代,助力行业实现智能化发展。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
延世大学研究团队通过分析AI推理过程中的信息密度模式,发现成功的AI推理遵循特定规律:局部信息分布平稳但全局可以不均匀。这一发现颠覆了传统的均匀信息密度假说在AI领域的应用,为构建更可靠的AI推理系统提供了新思路,在数学竞赛等高难度任务中显著提升了AI的推理准确率。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
蒙特利尔大学团队发现让AI"分段思考"的革命性方法Delethink,通过模仿人类推理模式将长篇思考分解为固定长度块,仅保留关键信息摘要。1.5B小模型击败传统大模型,训练成本降至四分之一,计算复杂度从平方级降为线性级,能处理十万词汇超长推理,为高效AI推理开辟新道路。