以蒸汽机、交流电、集成电路为代表的前三次工业革命已成为历史,借助ICT和数字化技术强大加速效应的第四次工业革命热度不断提升,其中人工智能技术可谓最热门的话题之一。紫光旗下新华三集团针对新的人工智能应用场景,即将推出全新一代人工智能服务器及计算管理平台。
AI的理想与服务器产品的现实
作为前沿技术,人工智能本身需要强大的计算能力作为支撑;可以说,人工智能就是计算力在更高维度的一种体现。企业需要花费大量时间及硬件资源对人工智能程序进行训练并不断改进迭代,这是人工智能应用的关键步骤。而计算能力的强弱就直接关系到这种训练和迭代的速度。
目前,由具备强大并行计算能力的GPU与CPU组成的异构计算服务器是承载人工智能计算的主力军。但大多数传统服务器在设计与生产时并没有充分考虑到GPU的应用需求,普通服务器通常只能安装最多2-4个GPU计算卡。
对于大规模的人工智能训练及应用开发来说,想要部署更多GPU就只能购买更多数量的服务器,这样对于企业来说造成了服务器资源的极大浪费。
深刻洞察用户痛点,AI服务器全新出发
随着IT技术的发展,通过对服务器内部全面的空间、功耗、散热以及管理优化,全新的AI服务器能够同时搭载成倍甚至成双倍的GPU,让企业通过较少的服务器数量拥有强大的GPU计算能力,丰富其人工智能技术实力,极大提升了企业的资源利用效率,避免服务器资源的浪费。而随着GPU数量的增加,计算管理平台也成为了业界关注的重点与企业应用的痛点。
新华三针对新的人工智能应用场景,即将推出全新一代人工智能服务器及计算管理平台,在AI时代让用户拥有更多选择。10月18日,“智计算·启未来”新华三服务器新品发布会,敬请期待!
好文章,需要你的鼓励
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
OpenAI发布ChatGPT Atlas AI浏览器,支持网页问答、历史查询和邮件改写等功能。同时曝光秘密项目Mercury,雇佣约100名前投行精英以每小时150美元训练AI金融模型。公司还因用户滥用Sora生成马丁·路德·金视频而暂停相关功能。此外,医疗AI搜索引擎OpenEvidence获2亿美元融资,估值60亿美元。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。