至顶网服务器频道 08月01日 新闻消息: 语音自动识别、语音感知等音频分析是深度学习技术最具落地潜力的领域之一,对其后端系统的性能存在极高要求。针对哈尔滨工业大学深度学习项目中的多媒体音频信息处理等应用,浪潮为其定制了高性能计算解决方案,解决了其在音频分析过程中遇到的噪音干扰信号等问题、提高分析的精准度,让音频分析向着"媲美人脑"的目标不断迈进。

哈尔滨工业大学
音频分析,高性能是关键
语言信息主要包含在语音信号的参数之中,因此准确而迅速地提取语言信号的参数是进行语音信号处理的关键。在当前的音频分析领域,连续语音的分割、大词量语音的识别和识别任何人的语音等方面都是难点,业内尚无有效的解决方案,哈尔滨工业大学(后简称:哈工大)语音实验室希望通过深度学习技术的应用,将这些难题一一化解。
经过多方测试,在后端系统的搭建中,哈工大语音实验室决定采用高性能计算集群解决方案,并搭配GPU计算节点,利用GPU加速卡强大的计算性能来有效的提高其现有的计算能力。然而,在高性能集群搭建过程中,哈工大却遇到了不少挑战。
首当其冲的是如何满足音频分析对高性能的苛刻要求。要实现精准如人脑的音频分析,就需要构建深层神经网络,将深层卷积神经网络(Deep CNN)等技术应用于语音识别声学建模中,模拟人脑神经元和神经突触的信息和数据传输及计算,其需要的计算能力是极其惊人的。音频分析系统的性能越高,也就越能接近于人脑识别的精准度与速度。
与此同时,作为重点项目,哈工大语音实验室的音频分析项目涉及到大量的重要研究数据,运行着关键应用,哈工大语音实验室需要确保音频分析能够长时间安全、稳定的运行,以最大程度上提升分析的效率、避免宝贵分析成果的损失。同时,哈工大语音实验室还希望对高性能集群的各个节点进行准确的监控,降低意外情况发生的几率。
57万亿次的峰值性能 浪潮让音频分析更精准
为建设高性能、高安全、高稳定的高性能集群,哈工大语音实验室与浪潮开展合作,在开放的技术架构下,将计算能力与实际应用相结合,以驱动音频分析的应用价值。在高性能集群的实际搭建过程中,浪潮定制的解决方案采用6台浪潮倚天超算系列产品NF5568M4浪潮SKVM视频切换系统,搭配性能强大的GPU加速卡,以满足音频分析对于高性能的苛刻需求。
运算峰值57万亿次:浪潮NF5568M4与GPU加速计算技术的协同,CPU主要承担其更擅长的逻辑选择、判断跳转和IO通信方面的职责,而GPU则专职计算密集型、高度并行的计算工作,使得计算资源合理的分配,计算力被充分释放,计算性能达到从几倍到几十倍的增长。浪潮采用了先进的56Gb IB高速网络技术,保证集群中所有节点无阻塞、全线速的运行,可充分满足高速互联的需求。在哈工大语音实验室高性能集群建设中,整个集群的双精度浮点运算峰值可达到57万亿次以上,为实验室的音频分析应用提供了的极高性能支撑。
安全稳定的集群管理:浪潮在设计方案时,考虑到集群中节点的监控问题,特别配置了远程视频切换系统,采用专门的SKVM网络,可以准确的监控集群中每个节点的信息,相当于给每个节点安装了一台小型的监控器,保证了集群的安全运行。另外,浪潮还提供了智能的集群管理软件Cluster Engine,管理计算平台上运行的几十款软件,并通过定制化开发,适配用户的应用,构建了一个易用、高效、稳定的超算平台。

浪潮Cluster Engine集群管理软件
领先应用调优服务:浪潮在高性能计算领域拥有深厚积累,拥有一支专业的高性能应用研究分析团队。目前,浪潮已经积累了十余个行业的三百余款软件的应用特征,建立了六十余款典型应用基准算例库,能够提供定制化解决方案和专业的应用调优服务,这些深厚的经验积累帮助哈工大语音实验室提供了领先的调优服务,确保了音频应用的高效能运行。
哈工大语音实验室负责人表示:"语音处理的研究已经经历了将近50年的历史,取得了许多成果,但是如何利用深度学习技术提高语音分析能力依然是崭新的问题。浪潮高效的高性能计算系统为之前复杂的计算问题带来极大的帮助,让研究人员可以专注于音频分析技术的研究,而不用将更多的精力耗费在高性能集群的优化上。此外,浪潮还提供了360°的售后服务,解决了系统的后顾之忧,这也帮助我们将音频分析应用研究保持在国内高校领先水平。"
深度学习
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。