Arm宣布推出Cortex-R82,该芯片旨在支持可以同时保存数据和处理数据的新一代存储设备。
这种新型硬件称为计算存储,有助于为延迟敏感型工作负载(例如机器学习和实时分析应用)提升速度。
通常来说,存储数据和处理数据的任务被分配给系统内部的单独组件去完成,磁盘或闪存驱动器用于保留信息,单独的处理器用于处理信息,每次执行操作的时候,数据都必须从存储驱动器传输到处理器,然后再返回,这个过程会导致一定的延迟,从而降低性能。
这种新型计算存储设备的目标是消除这个过程中的延迟,以加快应用的速度。存储驱动器使用内置控制器在本地处理器信息,而不是将信息发送到单独的芯片进行处理。控制器是闪存和磁盘驱动器中的一个微型计算模块,通常只用于执行低级别任务,例如写入数据和读取数据。
Arm此次新推出的Cortex-R82将被用作计算存储设备的控制器,即可以作为芯片设计提供,硬件制造商也可以根据需要进行许可和定制。
Arm称,Cortex-R82最多可以配置8个处理核心,其性能是上一代R8产品的2倍,计算能力的提升让Cortex-R82可以直接在存储驱动器内部运行完整的Linux发行版和应用。
那些计划在存储驱动器上运行机器学习模型的企业,可以通过为Cortex-R82配备Arm Neon机器学习技术来获得更高的性能。Arm表示,与上一代R8相比,Neon将神经网络的性能提高了14倍。
计算存储硬件有许多潜在的应用场景。例如,一家建筑企业可以在建筑工地部署安全摄像头,使用运行在内部闪存驱动器上的AI模型,发现潜在的危险。Arm也列出了一些更为传统的数据中心使用场景,例如数据库加速、视频转码和实时分析。
好文章,需要你的鼓励
高带宽闪存技术承诺提供超大容量,但面临极其复杂的工程挑战。该技术将多层NAND芯片堆叠,每层由数百个3D NAND单元层组成,可创造前所未有的存储容量。相比昂贵的HBM内存,HBF使用更便宜但速度较慢的闪存为GPU提供更多存储空间。技术复杂性体现在互连布线的困难,12层HBF堆叠将包含2866个存储层。由于需要英伟达等GPU厂商深度参与和行业标准制定,预计HBF距离商用还需两年以上时间。
阿里巴巴达摩院联合浙江大学、香港科技大学发布Inferix,这是专为世界模拟打造的下一代推理引擎。它采用块扩散技术,像搭积木般分段生成视频,既保证高质量又支持任意长度,克服了传统方法的局限。配套LV-Bench评测基准包含1000个长视频样本,建立了分钟级视频生成的评估标准,为游戏、教育、娱乐等领域的内容创作带来革命性突破。
戴尔第三季度营收270亿美元,同比增长11%,创历史新高,主要受AI服务器需求爆发式增长推动。AI服务器订单达123亿美元,全年订单总额300亿美元。基础设施解决方案集团营收141亿美元,增长24%,其中服务器和网络业务表现强劲。存储业务营收39.8亿美元,同比下降1%,但全闪存阵列产品实现双位数增长。公司预计第四季度营收315亿美元,全年AI服务器出货量约250亿美元。
Luma AI推出的终端速度匹配(TVM)是一种革命性的图像生成技术,能够在单次计算中生成高质量图像,突破了传统方法需要数十步采样的限制。该技术通过关注生成路径的"终点"而非"起点",实现了从噪声到图像的直接跳跃,在保证数学理论基础的同时大幅提升了生成效率,为实时AI应用开辟了新路径。