11月20日,旨在体验和展现人工智能、深度学习领域前沿技术的英伟达GPU技术大会(GTC China 2018)在苏州拉开帷幕,国内知名的信息技术领军企业中科曙光受邀参加了本次盛会,并推出了全新XMachine系列国产AI服务器,备受业界关注。
随着IT技术的迅速发展,如何对海量数据进行更好地处理,对各大厂商提出了挑战。为了满足日益增长的市场需要,曙光XMachine系列国产AI服务器应运而生。
中科曙光本次推出的全新XMachine系列AI服务器主要包括X745-G30、X785-G30、X795-G30、X740-H30,该系列服务器采用统一硬件平台,完全兼容适配NVIDIA公司Tesla系列产品,满足当下主流应用的需求;采用CPU主板和GPU底板解耦合设计,可根据CPU和GPU的发展各自独立升级,降低用户更新换代成本。
正如“道生一, 一生二, 二生三, 三生万物”宇宙生成论阐述的那样,全新一代XMachine系列AI服务器可以做到一个硬件平台,两块不同主板(CPU、GPU),三种不同拓扑,可实现更多种类、更强适应性的AI服务器变化,填补了人工智能服务器领域的技术空白,被业界誉为国产AI服务器中的“变形金刚”。
中科曙光总裁助理、高性能计算产品事业部总经理李斌介绍,“即将量产的全新一代XMachine‘变形金刚’基于Intel Skylake CPU,最多可支持8卡NVIDIA NVLink的GPU、10卡训练GPU、20卡推理加速卡。凭借高性能计算的技术优势、城市云中心和先进计算中心的数据背景,曙光对于推进深度学习应用进一步落地有着清晰的规划。”
作为高性能计算的领导者和AI赋能者,2018年曙光公司在人工智能领域取得了一系列令人瞩目的成绩:人工智能管理平台SothisAI,以其高效稳定、弹性灵活、可为用户“量身定制”等特征,荣膺2018 ECI Awards技术创新类金奖;“面向深度学习应用的开源平台建设及应用”项目成功入选国家发改委2018年重大工程;曙光牵头组建了以人工智能技术为重要技术支撑的“国家先进计算产业创新中心”等等。而此次发布的“变形金刚”系列AI服务器,更进一步为曙光人工智能发展夯实了技术基础。据透露,下一步曙光人工智能研发团队将设计更多的CPU主板和GPU底板。
人工智能是新一轮科技革命和产业变革的重要驱动力量,“变形金刚”AI服务器的推出不仅为业界提供了强劲、多元的计算产品,而且能够帮助用户更快速实现AI计算的更新换代,助力行业实现智能化发展。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。