ZDNet至顶网服务器频道 03月27日 编译:英特尔公司近日发布了一系列消息,媒体及分析人士开始对其即将推出的六十核心Knights Landing至强Phi芯片进行了概括性的解读,这是一次管中窥豹式的探索过程。英特尔公司在其位于俄勒冈州希尔斯伯勒市的代工厂召开了新闻发布会,并向到场记者宣称Knights Landing Phi可以承载八十亿个晶体管。
正如Timothy Prickett-Morgan在The Platform网站上所言,Knights Landing的Silvermont凌动核心将继承Broadwell核心的全部指令集,仅仅将正处于调整当中的TSX事务型内存功能排除在外。
Knights Landing设定的浮点运算能力目标为三万亿次,而单精度浮点运算能力目前则达到了惊人的六万亿次。英特尔公司目前对于该芯片所能支持的最大计算核心数量继续保密,根据预期其核心数量应该为六十个,但也有传闻指出其最大支持能力将达到七十二个。
The Platform指出,届时英特尔将推出一款该产品的协处理器衍生版本外加一个配备每秒100GB Omni-Path端口的版本,后者也正是英特尔打造的第一款拥有主机结构接口的芯片。考虑到高性能计算应用程序的实际情况,Omni-Path能够支持OpenFabrics Alliance(简称OFA)堆栈实现良好的兼容性,从而使其同专为InfiniBand以及英特尔True Scale Fabric环境所编写的软件并行协作。
不过英特尔公司当然希望客户能更倾向于使用其Omni-Path每秒100GB端口,据称其能带来更低延迟水平,且交换芯片的端口数量将为四十八个,这将高于InfiniBand的三十六个。六条内存通道都将支持最高64GB的单条DDR4内存,这代表着每块处理器能够最多匹配384GB内存容量,而英特尔公司目前正与Micron方面合作,希望为该芯片开发出高带宽内存产品,其每数据包体系高达16GB。DDR4内存的运行速率大约为每秒90GB,而本地高带宽内存能够带来每秒约400GB的运行速率,外围通信将由36个PCIe 3.0通道负责实现。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。