美国当地时间11月15日,在盐湖城举行的全球超算大会SC16上,浪潮与英特尔联合发布了双方合作研发的FPGA加速卡F10A,这是目前业界支持OpenCL的最高密度最高性能的FPGA加速设备。
SC16发布会现场
F10A支持OpenCL高级语言开发使其具备良好的易编程性,从而在软件生产力上取得了质的飞跃。传统FPGA开发采用Verilog、VHDL等硬件描述语言,对开发者要求较高,开发周期也较长,因此在高性能计算应用受到限制。而采用OpenCL的F10A利用软件高级语言和模型编程,开发周期大幅缩短。据浪潮提供的数据显示,在F10A上开发GZIP算法,1名工程师采用OpenCL用时1个月即可独立完成开发,而采用Verilog则需要耗时3个月才能完成移植。
FPGA加速卡
F10A具有高性能、高密度、高带宽的特点。F10A基于Altera的Arrial 10芯片,单芯片峰值运算能力达到了1.5TFlops,功耗却只需35W,每瓦特性能达到42GFlops。同时,F10A设计为高密度的半高半长PCI-E插卡,同时具有灵活的板卡内存配置,最大支持32G双通道内存,是业内同等FPGA卡内存容量的4-8倍。此外,F10A支持2个10Gb光口,可以实现数据直接从网络到板卡处理,无需经过CPU,大大减低了传输延时。
F10A适用面极广,既可采用DNRange模式实现数据并行,也可采用Pipeline模式实现任务并行,完全支持所有低延迟、高强度应用,如高性能计算、深度学习、数据采集、高频交易、网络处理和信号处理等。
随着高性能计算和人工智能技术的快速发展以及大数据的爆发式增长,传统处理器芯片在提升性能功耗比方面遇到了极大挑战。支持OpenCL的FPGA介于专用芯片和通用芯片之间,具有一定的可编程性,体现出非常明显的硬件重构+软件定义特点,在处理特定应用时有更加明显的效率。此前,浪潮已经与科大讯飞、Altera成功将FPGA芯片应用于智能语音线上识别领域,较CPU性能加速2.871倍,而功耗相当于CPU的15.7%,性能功耗比提升18倍。
好文章,需要你的鼓励
本文探讨如何使用生成式AI和大语言模型作为倾听者,帮助用户表达内心想法。许多主流AI如ChatGPT、Claude等被设计成用户的"最佳伙伴",或试图提供心理健康建议,但有时用户只想要一个尊重的倾听者。文章提供了有效的提示词技巧,指导AI保持中性、尊重的态度,专注于倾听和理解,而非给出建议或判断。同时提醒用户注意隐私保护和AI的局限性。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
人工通用智能和超级人工智能的出现,可能会创造出一种全新的外星智能形态。传统AI基于人类智能模式构建,但AGI和ASI一旦存在,可能会选择创造完全不同于人类认知方式的新型智能。这种外星人工智能既可能带来突破性进展,如找到癌症治愈方法,也可能存在未知风险。目前尚不确定这种新智能形态是否会超越人类智能,以及我们是否应该追求这一可能改变人类命运的技术突破。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。