ZDNet至顶网服务器频道 01月24日 编译:Amazon公司已经同意收购一家“神秘”的以色列芯片制造商,并希望借此举为自身庞大的数据中心体系构搭建起新的定制化技术方案。
以色列金融报刊《Calcalist》抢先发表报道,指出Amazon方面已经兼并了位于以色列Yoqneam的Annapurna Labs公司,而Amazon方面随后也向《华尔街日报》以及其它几家新闻媒体确认了这一消息。
当下尚不完全明确Amazon希望借助此次收购达成的目标,因为到目前为止Annapurna公司仍然对与此次收购相关的内容保持沉默。
不过完全可以通过这家企业的发展历程作出一些推断,Annapurna公司由Avidor Willenz于四年前正式建立,这位创始人曾于1994年创立Galileo Technology公司(一家制造网络芯片与收发装置的企业)。
Galileo公司也许并未在半导体行业之外获得足够的关注度,但却切实吸引到了ARM芯片制造商Marvell的青睐。后者于2000年以约27亿美元股权将其招至麾下。
因此尽管Annapurna尚没有公开任何细节信息,但可以肯定其产品与Galileo业务较为相似,事实上,有匿名消息人士向《华尔街日报》透露称,这家以色列企业一直在着力开发中端网络芯片、为了将高性能表现与低功耗水平加以结合。
除此之外,Amazon方面也确实很有理由收购一家网络芯片厂商,至少其理由要比收购服务器CPU设计厂商更充分。
在去年十一月于拉斯维加斯召开的AWS re:Invent大会上,Amazon公司数据中心策划工作负责人James Hamilton就在接受采访时指出,虽然Amazon已经多次对ARM服务器进行评估、但其显然对作为主要处理器合作伙伴的英特尔公司更有信心。
Amazon公司的服务器芯片采购如此庞大,以至于英特尔甚至愿意专门针对AWS数据中心的实际需求开发定制化芯片版本,Hamilton表示,借于此,Amazon最新推出的弹性计算云(简称EC2)设备实例才能如期呈现在广大用户面前。
不过Amazon方面对自家数据中心工程技术任务的关注度极高,而且有计划在定制化CPU之外跨出更为积极的一步。其最终目标是,Amazon的所有硬件设备都采用定制化套件、并由原始设计制造商(简称ODM)负责构建,而网络方案正是其中最为重要的核心组成部分。
“就目前而言,网络已经成为我们乃至整个行业眼中最为紧要的技术层面,”Hamilton在AWS re:Invent大会的一次主题演讲中指出。“相较于所有其它设备的使用成本,网络设备成本的上涨幅度最高。这明显是种反摩尔定律的现象。我们的全部设备都能实现成本逐步下降,也因此使我们得以不断缩减服务价格,但网络很明显走上了一条错误的发展道路。这绝对是个大问题。”
目前我们尚不清楚Annapurna将在Amazon的下一步规划中扮演怎样的角色,不过如果前者确实具备云计算王者所需要的技术方案,那么Amazon可能已经开始对其融入进行部署。双方交易协议的细节信息尚未披露,不过有消息表明Amazon方面将为这笔收购支付3.5亿美元到3.75亿美元。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。