以蒸汽机、交流电、集成电路为代表的前三次工业革命已成为历史,借助ICT和数字化技术强大加速效应的第四次工业革命热度不断提升,其中人工智能技术可谓最热门的话题之一。紫光旗下新华三集团针对新的人工智能应用场景,即将推出全新一代人工智能服务器及计算管理平台。
AI的理想与服务器产品的现实
作为前沿技术,人工智能本身需要强大的计算能力作为支撑;可以说,人工智能就是计算力在更高维度的一种体现。企业需要花费大量时间及硬件资源对人工智能程序进行训练并不断改进迭代,这是人工智能应用的关键步骤。而计算能力的强弱就直接关系到这种训练和迭代的速度。
目前,由具备强大并行计算能力的GPU与CPU组成的异构计算服务器是承载人工智能计算的主力军。但大多数传统服务器在设计与生产时并没有充分考虑到GPU的应用需求,普通服务器通常只能安装最多2-4个GPU计算卡。
对于大规模的人工智能训练及应用开发来说,想要部署更多GPU就只能购买更多数量的服务器,这样对于企业来说造成了服务器资源的极大浪费。
深刻洞察用户痛点,AI服务器全新出发
随着IT技术的发展,通过对服务器内部全面的空间、功耗、散热以及管理优化,全新的AI服务器能够同时搭载成倍甚至成双倍的GPU,让企业通过较少的服务器数量拥有强大的GPU计算能力,丰富其人工智能技术实力,极大提升了企业的资源利用效率,避免服务器资源的浪费。而随着GPU数量的增加,计算管理平台也成为了业界关注的重点与企业应用的痛点。
新华三针对新的人工智能应用场景,即将推出全新一代人工智能服务器及计算管理平台,在AI时代让用户拥有更多选择。10月18日,“智计算·启未来”新华三服务器新品发布会,敬请期待!
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。