ZDNet至顶网服务器频道 03月27日 编译:英特尔公司近日发布了一系列消息,媒体及分析人士开始对其即将推出的六十核心Knights Landing至强Phi芯片进行了概括性的解读,这是一次管中窥豹式的探索过程。英特尔公司在其位于俄勒冈州希尔斯伯勒市的代工厂召开了新闻发布会,并向到场记者宣称Knights Landing Phi可以承载八十亿个晶体管。
正如Timothy Prickett-Morgan在The Platform网站上所言,Knights Landing的Silvermont凌动核心将继承Broadwell核心的全部指令集,仅仅将正处于调整当中的TSX事务型内存功能排除在外。
Knights Landing设定的浮点运算能力目标为三万亿次,而单精度浮点运算能力目前则达到了惊人的六万亿次。英特尔公司目前对于该芯片所能支持的最大计算核心数量继续保密,根据预期其核心数量应该为六十个,但也有传闻指出其最大支持能力将达到七十二个。
The Platform指出,届时英特尔将推出一款该产品的协处理器衍生版本外加一个配备每秒100GB Omni-Path端口的版本,后者也正是英特尔打造的第一款拥有主机结构接口的芯片。考虑到高性能计算应用程序的实际情况,Omni-Path能够支持OpenFabrics Alliance(简称OFA)堆栈实现良好的兼容性,从而使其同专为InfiniBand以及英特尔True Scale Fabric环境所编写的软件并行协作。
不过英特尔公司当然希望客户能更倾向于使用其Omni-Path每秒100GB端口,据称其能带来更低延迟水平,且交换芯片的端口数量将为四十八个,这将高于InfiniBand的三十六个。六条内存通道都将支持最高64GB的单条DDR4内存,这代表着每块处理器能够最多匹配384GB内存容量,而英特尔公司目前正与Micron方面合作,希望为该芯片开发出高带宽内存产品,其每数据包体系高达16GB。DDR4内存的运行速率大约为每秒90GB,而本地高带宽内存能够带来每秒约400GB的运行速率,外围通信将由36个PCIe 3.0通道负责实现。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。