日本福冈九州大学信息技术研究所日前宣布,将于10月份收到一个新的超级计算机系统,全国各地的大学都可以使用该超级计算机系统进行人工智能(AI)等领域的研究。
九州大学将启用富士通的新系统,系统属于JHPCN联合使用/研究中心跨学科大型信息基础架构的计算资源,跨学科大型信息基础架构是一个联合使用地点网络,由北海道大学、东北大学、东京大学、东京理工大学、名古屋大学 、京都大学、大阪大学和九州大学的超级计算机设备组成,以东京大学的信息技术中心为核心。
新系统也将用于高性能计算基础架构(HPCI),HPCI是一个连接K计算机及日本各大学和实验室主要超级计算机的计算环境。大学里和大学外的用户都可以使用新的超级计算机,此举有望提升日本的学术研究平台及为AI的学术研究做出新的贡献。
来自富士通的新超级计算机系统服务器系统主要由后端子系统、前端子系统和存储子系统组成。后端的计算节点由2,128个Primergy CX400系统组成,并配备了Intel Skylake Xeon处理器,总内存容量达433 TB。128个x86服务器各配备了四个Nvidia Tesla P100 GPU计算卡。
前端子系统由160个基本前端节点构成,其中包括Intel Skylake Xeon处理器和Nvidia Quadro P4000显卡以及四个高容量前端节点,除了服务器的内存以外,每个前端节点亦拥有12 TB的内存。
该系统的理论峰值性能约为10 petaflops,并配有24 PB的存储系统、100Gbps InfiniBand EDR互连以及富士通可扩展的集群文件系统(FEFS)。
该系统为日本第一个在前端子系统上构建了大型私有云环境的超级计算机系统,其前端子系统通过高速文件系统与后端子系统的计算服务器相连。
日本的Riken先进智能项目中心曾于4月 启动了自行研究的深度学习超级计算机,该超级计算机将用于加速AI技术在“现实世界”的应用的研发。
该系统由两个服务器架构组成,每个架构含24个Nvidia DGX-1服务器(每个服务器包括8个最新Nvidia Tesla P100加速器和整合深度学习软件)、32个富士通服务器Primergy RX2530 M2服务器以及高性能存储系统。
该系统的文件系统也是富士通服务器Primergy RX2540 M2 PC服务器上的FEFS; 8个富士通存储ETERUS DX200 S3存储系统;以及一个富士通存储Eternus DX100 S3存储系统,用于提供深入学习分析的IO处理要求。
捷克水文气象研究所日前也宣布,星期四将收到一台超级计算机,捷克水文气象研究所是个政府机构,其用于天气预报的LX系列计算服务器是由NEC提供的。
业内人士预计,NEC集群将可以令捷克水文气象部门提高数字天气预报和相关应用的准确性,例如预警系统。
该NEC系统提供了超过300个节点的计算能力,这些计算节点通过高速Mellanox EDR InfiniBand网络连接在一起,系统还包含Intel Xeon E5-2600 v4产品系列双插槽计算节点,计算内核的总数超过3,500个。
NEC公司表示,新系统比目前使用的系统快80多倍,新系统将于2018年初开始运行。
该HPC解决方案还包括基于NEC LXFS-z并行文件系统设备的高性能存储解决方案,具有超过1 PB的存储容量和超过30Gbps的带宽,这些可望满足捷克水文气象研究所的运作需求。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。