4月26日,在2018浪潮云数据中心合作伙伴大会(IPF2018)上,浪潮与科大讯飞联合发布了面向于语音识别、翻译等AI应用的16卡计算集群“AI Booster”,单套系统能够实现单精度240TFlops/s或Int8 752TFlops/s的计算性能。双方公布的实测数据显示,在智能翻译模型训练任务中,采用相同计算卡的“AI Booster”与传统4卡服务器组成的16卡集群相比,AI计算加速比提升18%。
科大讯飞云计算研究院副院长张致江表示:“我们很高兴看到浪潮与科大讯飞的工程师通力合作,带来了一套性能卓越、扩展灵活、适用广泛的创新AI基础架构AI Booster。这套系统蕴藏了讯飞大量的算法研究和实验场景的实践,以及浪潮在硬件设计领域的深厚积累,已在科大讯飞多个AI研究中进行试点。”
浪潮集团副总裁彭震表示:“针对大客户和关键场景,进行定制化联合创新开发AI计算软硬件,提供端到端AI系统方案及开发工具使能行业应用,既是浪潮未来AI创新的重要发力点,也是浪潮AI生态T计划的关键环节之一。浪潮希望通过与全球AI领先技术公司的广泛深入合作,以协同开发、联合生产的创新商业模式,向行业与企业用户联合交付融合、开放、敏捷的AI基础架构,加速AI赋能行业并促进AI商业化进程。”
T计划是浪潮面向AI计算的全新生态建设计划,旨在从创新、伙伴和人才三个维度入手,释放AI计算力的核心价值与能力,赋能企业在人工智能时代拥有坚实可靠的基础架构支撑。
科大讯飞长期致力于使用人工智能改变世界,在语音合成、语音识别、口语评测、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等多项国际测评中均占据国际领先地位。
浪潮是全球领先的AI计算力提供者,已成为百度、阿里和腾讯的AI计算GPU服务器的最主要供应商,占有率达到90%,并与科大讯飞、奇虎360、搜狗、今日头条、Face++等人工智能领先公司保持在系统与应用方面的深入紧密合作,帮助客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升,在中国的AI计算平台占有率达到60%。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。