至顶网服务器频道 11月19日 新闻消息:美国当地时间11月14日,在达拉斯举行的全球超算大会SC18上,浪潮发布集成HBM2高速缓存的FPGA AI加速卡F37X,可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,实现高性能、高带宽、低延迟、低功耗的AI计算加速。
F37X是浪潮专为AI极致性能设计的尖端FPGA加速卡。它采用Xilinx Virtex UltraScale+架构,INT8计算性能达到了28.1TOPS,集成8GB HBM2高速缓存,带宽达460GB/s。F37X典型应用功耗仅为75瓦,性能功耗比高达375Gops/W。性能数据显示,浪潮F37X在AI图像识别实时推理场景,基于GoogLeNet深度学习网络模型,当BatchSize=1时性能高达8600 images/s,是CPU性能的40倍。同时F37X可支持SDAccel 开发环境与C/C++、OpenCL和RTL三种主流的编程语言,覆盖机器学习推理、视频图像处理、数据库分析、金融、安全等典型AI应用领域,提供强大的生态支持,具备更加出色的易编程性,可灵活快速开发和迁移不同的AI定制算法应用,在软件生产力上实现了质的飞跃。
Xilinx数据中心销售副总裁Freddy Engineer表示,Xilinx的U200、U250 FPGA卡已经在浪潮NF5280M5、NF5468M5、GX4等多款AI服务器上进行了认证和测试,不同型号的服务器在板卡支持密度、互联设计等方面有不同的创新考虑,可以适用于视频转码、图像识别、语音识别、自然语言处理、基因组测序分析、NFV、大数据分析查询等各类应用场景。
浪潮高级技术总监郭洪昌表示:"Xilinx是全球领先的FPGA、可编程SoC 与 ACAP解决方案提供商,浪潮一直致力于创新FPGA软硬件技术,双方在推动FPGA技术应用、加速AI计算等方面有着广泛的共识。浪潮将与Xilinx 围绕客户需求加强FPGA技术合作与创新,为全球FPGA、AI用户带来极致的计算加速体验。"
浪潮是全球领先的AI计算力专业厂商,从计算平台、管理套件、框架优化、应用加速等四个层次致力于打造敏捷、高效、优化的AI基础设施。据IDC《2017年中国AI基础架构市场调查报告》显示,浪潮AI服务器市场份额达57%高居第一。同时,浪潮致力于通过创新设计为世界范围的客户提供领先的计算设备,目前已成为全球多家领先公司的合作伙伴。
好文章,需要你的鼓励
VMware宣布将终止现有渠道合作伙伴计划,新计划采用邀请制,大幅减少授权合作伙伴数量。未受邀合作伙伴将于2025年7月15日收到不续约通知,可继续交易至10月31日。白标计划也将同时终止。此举是18个月内VMware第二次重大合作伙伴调整,旨在专注与少数核心云服务提供商深度合作。客户可能面临续约困难、服务质量下降和成本上升等影响。
StepFun公司推出的Step1X-Edit是首个能够媲美GPT-4o和Gemini2 Flash等商业模型的开源图像编辑AI。该模型通过整合多模态语言理解和扩散图像生成技术,能够处理11种编辑任务,在新构建的GEdit-Bench基准测试中表现优异,为图像编辑技术的民主化开辟了新道路。
谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。
BluOrion公司开发的ZClip是一种智能梯度裁剪算法,解决了大型语言模型训练中的梯度爆炸和损失飙升问题。通过Z分数统计检测和动态调整策略,ZClip能够自适应地控制梯度幅度,相比传统固定阈值方法提升训练效率35%以上,同时显著降低训练失败风险,为大模型训练提供了更稳定、高效的解决方案。