ZDNet至顶网服务器频道 12月05日 新闻消息:近日英特尔公司披露了多项全新的增强型技术,进一步巩固其在高性能计算(HPC)领域的领导地位。这些技术包括披露了未来的新一代的英特尔至强融核处理器(代号 Knights Hill),以及英特尔Omni-Path架构——一种针对HPC部署而优化的全新高速互连技术的架构及性能细节。
英特尔还发布了新的软件及合作计划,旨在帮助HPC社区更为轻松地释放现有及未来英特尔行业标准硬件的全部性能潜力。这些全新的HPC构建模块及行业合作计划,必将形成合力,解决实现极致可扩展能力和HPC迈入主流应用带来的双重挑战,同时为经济高效地实现百亿亿级(Exascale)计算奠定坚实基础。
英特尔宣布,其未来的第三代英特尔至强融核产品家族(代号 Knights Hill)将使用英特尔的10纳米制程工艺技术进行制造,并集成英特尔Omni-Path Fabric互连技术。Knights Hill将在即将上市的Knights Landing产品之后问世,而首批基于Knights Landing的商用系统预计将于明年开始出货。
针对英特尔至强融核处理器的行业投资仍在持续增长,预计将有超过50家供应商提供基于Knights Landing处理器的系统,而更多系统将使用该产品的协处理器PCIe卡版本。迄今为止,客户购买的Knights Landing处理器所支持系统的计算速度已超过了100 PFLOPS。
最近备受瞩目的基于Knights Landing的系统包括:Trinity超级计算机,它是美国洛斯阿拉莫斯国家实验室和桑迪亚国家实验室的合作结晶;Cori超级计算机,来自美国能源部(DOE)国家能源研究科学计算中心(NERSC)。此外,专注地球科学的公司DownUnder GeoSolutions最近宣布了现阶段英特尔至强融核协处理器的最大规模商用部署计划;国家超级计算中心IT4Innovations 也公布了一台全新的超级计算机,它将成为欧洲基于英特尔至强融核协处理器的最大集群。
英特尔公司透露:英特尔Omni-Path架构预计可提供100 Gbps的线路速率,而且在中大型集群中,能够实现比InfiniBand架构最多减少56%的交换机连接延迟。英特尔Omni-Path架构将使用一个48端口的交换机芯片,可提供比当前36端口InfiniBand架构更高的端口密度和系统扩展能力。它通过为每个交换机芯片提供多出33%的节点,预计将能减少所需交换机的数量,从而简化系统设计,全方位降低基础设施成本。系统扩展优势预计将包括:
提供1.3倍于Infiniband的端口密度,从而使较小集群从单交换机投资中获取最大效益。
相比基于InfiniBand的中大型类似集群,将交换机使用数量减少了多达50%。
采用双层结构配置,相比基于InfiniBand的集群,其相同数量的交换机可实现高达2.3倍的扩展性能,从而能够更经济高效地对基于特大规模集群系统进行扩展。
英特尔还启动了英特尔Fabric Builders计划,旨在为基于英特尔Omni-Path 架构解决方案的发展营造生态系统。此外,英特尔还透露了英特尔并行计算中心(IPCC)的扩展计划,目前已有超过40个中心分布在13个国家和地区,它们将协力为超过70个最流行的HPC社区代码进行现代化升级。
为扩展其 Lustre软件功能,英特尔发布了Lustre英特尔企业版v2.2和Lustre英特尔基版。目前在新设备中使用Lustre软件的增强型英特尔 解决方案的新设备的厂商已有戴尔、DataDirect Networks和Dot Hill 。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。