至顶网服务器频道 11月19日 新闻消息:美国当地时间11月14日,在达拉斯举行的全球超算大会SC18上,浪潮发布集成HBM2高速缓存的FPGA AI加速卡F37X,可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,实现高性能、高带宽、低延迟、低功耗的AI计算加速。
F37X是浪潮专为AI极致性能设计的尖端FPGA加速卡。它采用Xilinx Virtex UltraScale+架构,INT8计算性能达到了28.1TOPS,集成8GB HBM2高速缓存,带宽达460GB/s。F37X典型应用功耗仅为75瓦,性能功耗比高达375Gops/W。性能数据显示,浪潮F37X在AI图像识别实时推理场景,基于GoogLeNet深度学习网络模型,当BatchSize=1时性能高达8600 images/s,是CPU性能的40倍。同时F37X可支持SDAccel 开发环境与C/C++、OpenCL和RTL三种主流的编程语言,覆盖机器学习推理、视频图像处理、数据库分析、金融、安全等典型AI应用领域,提供强大的生态支持,具备更加出色的易编程性,可灵活快速开发和迁移不同的AI定制算法应用,在软件生产力上实现了质的飞跃。
Xilinx数据中心销售副总裁Freddy Engineer表示,Xilinx的U200、U250 FPGA卡已经在浪潮NF5280M5、NF5468M5、GX4等多款AI服务器上进行了认证和测试,不同型号的服务器在板卡支持密度、互联设计等方面有不同的创新考虑,可以适用于视频转码、图像识别、语音识别、自然语言处理、基因组测序分析、NFV、大数据分析查询等各类应用场景。
浪潮高级技术总监郭洪昌表示:"Xilinx是全球领先的FPGA、可编程SoC 与 ACAP解决方案提供商,浪潮一直致力于创新FPGA软硬件技术,双方在推动FPGA技术应用、加速AI计算等方面有着广泛的共识。浪潮将与Xilinx 围绕客户需求加强FPGA技术合作与创新,为全球FPGA、AI用户带来极致的计算加速体验。"
浪潮是全球领先的AI计算力专业厂商,从计算平台、管理套件、框架优化、应用加速等四个层次致力于打造敏捷、高效、优化的AI基础设施。据IDC《2017年中国AI基础架构市场调查报告》显示,浪潮AI服务器市场份额达57%高居第一。同时,浪潮致力于通过创新设计为世界范围的客户提供领先的计算设备,目前已成为全球多家领先公司的合作伙伴。
好文章,需要你的鼓励
科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。
Salesforce AI研究团队构建了首个大规模多模态文档RAG评测基准UniDoc-Bench,包含7万页真实PDF文档和1600个问答对,覆盖8个领域。研究发现文本图像融合检索策略显著优于单一模态和联合多模态方法,为未来AI文档理解系统提供了"分工合作"的设计思路。
Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。
腾讯研究团队发现AI训练中"推理火花"现象,揭示低概率词汇如"等等"、"不过"等在维持AI探索能力中的关键作用。团队开发的低概率正则化方法通过精准保护有价值的低概率词汇,在数学推理任务中实现60.17%准确率,比传统方法提升2.66%,为AI创造性思维研究开辟新路径。