至顶网服务器频道 08月01日 新闻消息: 语音自动识别、语音感知等音频分析是深度学习技术最具落地潜力的领域之一,对其后端系统的性能存在极高要求。针对哈尔滨工业大学深度学习项目中的多媒体音频信息处理等应用,浪潮为其定制了高性能计算解决方案,解决了其在音频分析过程中遇到的噪音干扰信号等问题、提高分析的精准度,让音频分析向着"媲美人脑"的目标不断迈进。

哈尔滨工业大学
音频分析,高性能是关键
语言信息主要包含在语音信号的参数之中,因此准确而迅速地提取语言信号的参数是进行语音信号处理的关键。在当前的音频分析领域,连续语音的分割、大词量语音的识别和识别任何人的语音等方面都是难点,业内尚无有效的解决方案,哈尔滨工业大学(后简称:哈工大)语音实验室希望通过深度学习技术的应用,将这些难题一一化解。
经过多方测试,在后端系统的搭建中,哈工大语音实验室决定采用高性能计算集群解决方案,并搭配GPU计算节点,利用GPU加速卡强大的计算性能来有效的提高其现有的计算能力。然而,在高性能集群搭建过程中,哈工大却遇到了不少挑战。
首当其冲的是如何满足音频分析对高性能的苛刻要求。要实现精准如人脑的音频分析,就需要构建深层神经网络,将深层卷积神经网络(Deep CNN)等技术应用于语音识别声学建模中,模拟人脑神经元和神经突触的信息和数据传输及计算,其需要的计算能力是极其惊人的。音频分析系统的性能越高,也就越能接近于人脑识别的精准度与速度。
与此同时,作为重点项目,哈工大语音实验室的音频分析项目涉及到大量的重要研究数据,运行着关键应用,哈工大语音实验室需要确保音频分析能够长时间安全、稳定的运行,以最大程度上提升分析的效率、避免宝贵分析成果的损失。同时,哈工大语音实验室还希望对高性能集群的各个节点进行准确的监控,降低意外情况发生的几率。
57万亿次的峰值性能 浪潮让音频分析更精准
为建设高性能、高安全、高稳定的高性能集群,哈工大语音实验室与浪潮开展合作,在开放的技术架构下,将计算能力与实际应用相结合,以驱动音频分析的应用价值。在高性能集群的实际搭建过程中,浪潮定制的解决方案采用6台浪潮倚天超算系列产品NF5568M4浪潮SKVM视频切换系统,搭配性能强大的GPU加速卡,以满足音频分析对于高性能的苛刻需求。
运算峰值57万亿次:浪潮NF5568M4与GPU加速计算技术的协同,CPU主要承担其更擅长的逻辑选择、判断跳转和IO通信方面的职责,而GPU则专职计算密集型、高度并行的计算工作,使得计算资源合理的分配,计算力被充分释放,计算性能达到从几倍到几十倍的增长。浪潮采用了先进的56Gb IB高速网络技术,保证集群中所有节点无阻塞、全线速的运行,可充分满足高速互联的需求。在哈工大语音实验室高性能集群建设中,整个集群的双精度浮点运算峰值可达到57万亿次以上,为实验室的音频分析应用提供了的极高性能支撑。
安全稳定的集群管理:浪潮在设计方案时,考虑到集群中节点的监控问题,特别配置了远程视频切换系统,采用专门的SKVM网络,可以准确的监控集群中每个节点的信息,相当于给每个节点安装了一台小型的监控器,保证了集群的安全运行。另外,浪潮还提供了智能的集群管理软件Cluster Engine,管理计算平台上运行的几十款软件,并通过定制化开发,适配用户的应用,构建了一个易用、高效、稳定的超算平台。

浪潮Cluster Engine集群管理软件
领先应用调优服务:浪潮在高性能计算领域拥有深厚积累,拥有一支专业的高性能应用研究分析团队。目前,浪潮已经积累了十余个行业的三百余款软件的应用特征,建立了六十余款典型应用基准算例库,能够提供定制化解决方案和专业的应用调优服务,这些深厚的经验积累帮助哈工大语音实验室提供了领先的调优服务,确保了音频应用的高效能运行。
哈工大语音实验室负责人表示:"语音处理的研究已经经历了将近50年的历史,取得了许多成果,但是如何利用深度学习技术提高语音分析能力依然是崭新的问题。浪潮高效的高性能计算系统为之前复杂的计算问题带来极大的帮助,让研究人员可以专注于音频分析技术的研究,而不用将更多的精力耗费在高性能集群的优化上。此外,浪潮还提供了360°的售后服务,解决了系统的后顾之忧,这也帮助我们将音频分析应用研究保持在国内高校领先水平。"
深度学习
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。