近日,英特尔宣布原始设备制造商(OEM)在其服务器系列中采用了英特尔现场可编程门阵列(FPGA)加速。这是可重新编程芯片的首次重要使用,旨在加速现代数据中心中的主流应用。英特尔FPGA可为新型数据中心奠定坚实基础,凭借出色的多功能性和速度可支持处理从数据分析到金融服务的各种工作负载。
由于数据正呈指数级增长,数据中心运营商需要保持大规模性能需求和运营效率之间的平衡。为了提升性能与功效,数据中心正采用英特尔至强可扩展处理器,并配合使用加速器,以满足工作负载中特定功能的数据密集型性能要求。
借助英特尔FPGA,我们的原始设备制造商客户在基于英特尔至强可扩展处理器的全新服务器中提供了卓越的加速器驱动性能和运营效率。作为领先的原始设备制造商,戴尔EMC和富士通将在各自的产品中集成完整的英特尔硬件与软件堆栈,包括采用Arria 10 GX FPGA的英特尔可编程加速卡和面向包含FPGA的英特尔至强可扩展处理器的英特尔加速堆栈。
富士通公司执行官兼数据中心平台业务部门负责人Kenichi Sakai表示:“我们很荣幸与英特尔携手合作,为我们的客户打造高性能数据中心。我们开始在PRIMERGY服务器中部署采用Arria 10 GX FPGA的英特尔可编程加速卡,以吸引重要客户。FPGA加速优势能帮助运营商摆脱运营支出的限制,同时实现出色的可扩展性、性能和适应性。”
集成英特尔FPGA加速的戴尔EMC PowerEdge R640、R740和R740XD服务器目前可以进行大规模部署,未来更多服务器将支持这一功能。
英特尔可编程解决方案事业部营销副总裁Reynette Au表示:“随着戴尔EMC和富士通将强大、灵活的英特尔FPGA整合至主流服务器产品,我们即将迎来数据中心计算的新时代。我们为客户和合作伙伴提供了硬件性能优势,支持他们在软件开发环境中大规模创建丰富的高性能解决方案。”
例如,英特尔合作伙伴 Levyx(一家大数据基础设施领域的高性能数据处理软件提供商)为金融机构构建了一款基于英特尔FPGA的回溯测试解决方案。
Levyx业务发展高级副总裁Matt Meinel表示:“金融建模是一个对性能极为敏感的大数据课题。相比传统的Spark实施,借助英特尔PAC和加速堆栈,我们的架构师和软件开发人员的算法执行速度和期权计算速度分别提高了八倍和两倍。”
支持FPGA加速的服务器具有卓越的可用性,这是英特尔可编程芯片快速发展进程中的又一座里程碑。加速堆栈提供了一种软件开发环境,确保庞大的开发人员社区能够受益于FPGA的卓越性能和灵活性。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。