ZDNet至顶网服务器频道 11月19日 编译:英伟达公司在本届SC14大会上再一次成为关注焦点此次公布的下一代增量式升级方案Tesla K80为高性能计算GPU加速器带来新标准。
作为前代Tesla K40的继任者,此次亮相的K80不仅在名称上实现了翻倍,各项参数也迎来同等幅度的提升:性能表现乘二,内存传输带宽也乘二。不出所料,英伟达公司预计该产品将主要用于数据分析以及科学计算应用程序等领域(除了比特币挖掘,这属于GPU加速高性能计算的意外产物)。
K80号称能够在单精度浮点运算当中取得8.74万亿次的出色成绩,双精度浮点运算也有2.91万亿次的不俗表现。每块板卡搭载两个GPU,总计24GB GDDR5显存(每个GPU分得12GB),外加480 GB每秒的内存传输带宽。K80当中包含有4992个CUDA计算核心,而英伟达的GPU增强机制(即超频技术)以及动态并行处理技术也将得到支持。
与其它几家企业一样,英伟达公司目前也致力于在美国能源部的2017年Summit与Sierra性能巨兽项目中分得一杯羹,二者的既定处理能力水平分别为100千万亿次与300千万亿次。
在这笔总值超过3.25亿美元的合约当中,英伟达公司将负责为这两台基于IBM POWER架构的服务器设备提供GPU加速技术。
英伟达公司最近刚刚从美国能源部手中拿下一笔价值1800万美元的订单,旨在为该机构FastForward 2项目中的超大规模研究事务提供计算资源支持。美国能源部在最新一轮支出当中共计花费1亿美元,旨在到2020年建立起一套超大规模系统、且为其定下整体能源预算仅为20万瓦的宏伟目标。
好文章,需要你的鼓励
Carma Technology 针对 Uber 提起专利侵权诉讼,称其侵犯了涉及拼车系统的五项专利。案情回溯至十年前,凸显专利保护对创新者的重要性,可能对 Uber 及其他公司带来巨大影响。
东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些挑战性任务上的表现也比常规任务降低了约14个百分点,证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务,为评估AI代理在实际应用场景中的表现提供了更严格的标准。
经过暂停战略调整,Automattic 宣布重返 WordPress 开发,包括核心、Gutenberg、Playground 等模块,计划今年推出 6.9 版本,并涉及与 WP Engine 的法律争端。
这项研究提出了一种名为LIFT的新型微调方法,通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明,仅更新5%的主要权重就能在推理任务上超越全参数微调,同时保持与LoRA相当的内存效率。LIFT在常识推理、算术推理等多项任务上表现优异,还能更好地平衡学习新知识与保留原有能力。这一方法揭示了大语言模型中关键参数的重要性,为资源高效的模型定制提供了新思路。