ZDNet至顶网服务器频道 07月16日 编译:就在美国发出禁令、要求英特尔的处理器专家们停止向中国销售产品之后,计算机设计大师卢雨彤已经为中国自主超级计算机芯片规划出一份新的发展蓝图。
今年4月,山姆大叔以雷霆手段限制英特尔,要求其不得将高端至强及至强Phi处理器产品出售给中国的国防实验室及其它超级计算领域。而这些组件在一定程度上正是构建数据处理设备的根基所在,这意味着中国必须找到新的解决方案。但就在两个月之后,中国已经以远超预期的速度完成了新途径的探索。
根据The Platform网站报道,作为中国天河超级计算机的首席设计师,卢博士表示未来的天河2A超级计算机升级方案将采用中国自主研发的数字-信号处理器(简称DSP),卢博士是在本周三于德国召开的国际超级计算大会上公布这一消息的。
经过升级的天河2A预计将在2016年年底之前投入运行,且计划执行能力应该拥有100 PFLOP运行峰值,即每秒10亿亿次水平。根据卢博士的说法,天河2A的整体功率在1800万瓦,系统内存容量为3 PB,并将使用来自天河2号的英特尔至强E5-2692处理器以及中国自主开发的加速器。
目前的天河2号采用E5-2692 CPU外加至强Phi加速器。从本质上讲,天河2A将采用中国国内设计的数字-信号处理器来取代Phi协处理器,而且似乎其将最终全面取代至强E5处理器。根据我们得到的消息,天河2A将包含有总计18000个节点,且所运行文件系统可达30 PB。
The Platform网站编辑Nicole Hemsoth报道称,“天河2号机(及其采用DSP加速器的继任者)位于中国的国防科技大学当中”。
具体来讲,这座计算中心实际上属于中国国防及安全研究中心之一,而DSP则将被作为协处理器的替代方案引入各高性能计算系统,同时配备必要的软件堆栈以及编程环境,这意味着其很可能被用于中国的军事及国防工程当中。”
“DSP目前被大量应用于嵌入式军事应用领域,包括遥感、雷达以及其它活动当中——卢博士在本周的大会上,还着重强调了国防科技大学在DSP技术领域的广泛经验。”
将这些特殊芯片引入高性能计算设备当中绝不是什么新鲜概念:大家可以对其进行编程,从而在硬件当中执行浮点运算,这意味着数学问题将在这里快速得到解决。除此之外,这些系统还能够利用多个计算核心执行代码。通常来讲,DSP主要出现在音频及信号处理、视频压缩以及语音识别等系统当中。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。