ZDNet至顶网服务器频道 03月27日 编译:英特尔公司近日发布了一系列消息,媒体及分析人士开始对其即将推出的六十核心Knights Landing至强Phi芯片进行了概括性的解读,这是一次管中窥豹式的探索过程。英特尔公司在其位于俄勒冈州希尔斯伯勒市的代工厂召开了新闻发布会,并向到场记者宣称Knights Landing Phi可以承载八十亿个晶体管。
正如Timothy Prickett-Morgan在The Platform网站上所言,Knights Landing的Silvermont凌动核心将继承Broadwell核心的全部指令集,仅仅将正处于调整当中的TSX事务型内存功能排除在外。
Knights Landing设定的浮点运算能力目标为三万亿次,而单精度浮点运算能力目前则达到了惊人的六万亿次。英特尔公司目前对于该芯片所能支持的最大计算核心数量继续保密,根据预期其核心数量应该为六十个,但也有传闻指出其最大支持能力将达到七十二个。
The Platform指出,届时英特尔将推出一款该产品的协处理器衍生版本外加一个配备每秒100GB Omni-Path端口的版本,后者也正是英特尔打造的第一款拥有主机结构接口的芯片。考虑到高性能计算应用程序的实际情况,Omni-Path能够支持OpenFabrics Alliance(简称OFA)堆栈实现良好的兼容性,从而使其同专为InfiniBand以及英特尔True Scale Fabric环境所编写的软件并行协作。
不过英特尔公司当然希望客户能更倾向于使用其Omni-Path每秒100GB端口,据称其能带来更低延迟水平,且交换芯片的端口数量将为四十八个,这将高于InfiniBand的三十六个。六条内存通道都将支持最高64GB的单条DDR4内存,这代表着每块处理器能够最多匹配384GB内存容量,而英特尔公司目前正与Micron方面合作,希望为该芯片开发出高带宽内存产品,其每数据包体系高达16GB。DDR4内存的运行速率大约为每秒90GB,而本地高带宽内存能够带来每秒约400GB的运行速率,外围通信将由36个PCIe 3.0通道负责实现。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。