11月20日,旨在体验和展现人工智能、深度学习领域前沿技术的英伟达GPU技术大会(GTC China 2018)在苏州拉开帷幕,国内知名的信息技术领军企业中科曙光受邀参加了本次盛会,并推出了全新XMachine系列国产AI服务器,备受业界关注。
随着IT技术的迅速发展,如何对海量数据进行更好地处理,对各大厂商提出了挑战。为了满足日益增长的市场需要,曙光XMachine系列国产AI服务器应运而生。
中科曙光本次推出的全新XMachine系列AI服务器主要包括X745-G30、X785-G30、X795-G30、X740-H30,该系列服务器采用统一硬件平台,完全兼容适配NVIDIA公司Tesla系列产品,满足当下主流应用的需求;采用CPU主板和GPU底板解耦合设计,可根据CPU和GPU的发展各自独立升级,降低用户更新换代成本。
正如“道生一, 一生二, 二生三, 三生万物”宇宙生成论阐述的那样,全新一代XMachine系列AI服务器可以做到一个硬件平台,两块不同主板(CPU、GPU),三种不同拓扑,可实现更多种类、更强适应性的AI服务器变化,填补了人工智能服务器领域的技术空白,被业界誉为国产AI服务器中的“变形金刚”。
中科曙光总裁助理、高性能计算产品事业部总经理李斌介绍,“即将量产的全新一代XMachine‘变形金刚’基于Intel Skylake CPU,最多可支持8卡NVIDIA NVLink的GPU、10卡训练GPU、20卡推理加速卡。凭借高性能计算的技术优势、城市云中心和先进计算中心的数据背景,曙光对于推进深度学习应用进一步落地有着清晰的规划。”
作为高性能计算的领导者和AI赋能者,2018年曙光公司在人工智能领域取得了一系列令人瞩目的成绩:人工智能管理平台SothisAI,以其高效稳定、弹性灵活、可为用户“量身定制”等特征,荣膺2018 ECI Awards技术创新类金奖;“面向深度学习应用的开源平台建设及应用”项目成功入选国家发改委2018年重大工程;曙光牵头组建了以人工智能技术为重要技术支撑的“国家先进计算产业创新中心”等等。而此次发布的“变形金刚”系列AI服务器,更进一步为曙光人工智能发展夯实了技术基础。据透露,下一步曙光人工智能研发团队将设计更多的CPU主板和GPU底板。
人工智能是新一轮科技革命和产业变革的重要驱动力量,“变形金刚”AI服务器的推出不仅为业界提供了强劲、多元的计算产品,而且能够帮助用户更快速实现AI计算的更新换代,助力行业实现智能化发展。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。