近日,在百度整机柜集采招标中,曙光TC5600-I整机柜服务器成功拿下上万节点大单。这是继2016年曙光TC5600-I首次入围百度天蝎整机柜集采后的又一次重大胜利。
曙光TC5600-I整机柜系统,凭借其过硬的产品性能、优异的产品质量,顺利的赢得了百度的认可。本次成功中标,为曙光整机柜服务器未来在互联网、运营商客户中全面铺开市场奠定了坚实的基础。
给新型数据中心注入生命力
曙光是业内最早涉足整机柜形态服务器的厂商,2010年曙光便已经开始探索新型数据中心定制化服务器的可行性。由曙光研发的天蝎第一代整机柜服务器TC5600早已部署于全球最大的中文搜索引擎提供商——百度。
曙光是业内行业覆盖度最广、行业应用最广的整机柜服务器供应商。2013年曙光推出了同时满足HPC&IPDC市场需求的TC5600-H整机柜服务器,成为业内唯一的一机多用整机柜服务器供应商。几年来,曙光TC5600-H整机柜服务器已经为十余个行业,百余家用户提供了基于整机柜的一体化解决方案。
另外,曙光在2015年又推出了第三代整机柜服务器TC5600-I,这是一款完全满足天蝎2.5标准的整机柜系统,将继续为互联网、运营商、政府、军工、科研、金融等众多行业客户,提供更为一体化的解决方案和更优质的服务。
创新式“集中共享”设计理念
“集中共享”设计理念是TC5600-I做出的创新尝试。在集中式共享散热方面,TC5600-I采用了独有的“风扇墙”设计,可根据不同区域的节点负载状况动态调整风扇状态,有效降低散热系统功耗。
在集中式供电设计方面,TC5600-I采用了机柜级的电源冗余方案,且支持双路供电输入模式。保障电力的可靠性并可有效提高电源转换效率,使整机柜电源转换效率在正常运行状态下达到了90%以上。
在集中式管理设计方面,TC5600-I通过机柜级集中式管理模块RMC,可有效监控、管理整机柜各模块的状态信息、资产信息,极大的简化了系统管理工作,提高运维效率。
通过计算、存储、散热、供电、交换、管理六大模块融合实现了整机一体化生产、运输、交付,极大简化了交付、部署工作,交付效率提高10倍以上。
此外,TC5600-I在节点支持方面遵循融合理念,整机可兼容80个双路计算节点,40个均衡节点或40个大数据节点,此外还有AMD节点、GPU节点。丰富的节点类型满足了从IPDC、HPC到深度学习的多种场景需求。
曙光TC5600系列整机柜服务器是针对云计算、高性能计算和大数据的多用产品方案,融合了创新的计算、存储应用系统,随着用户需求的变化,打造一体化能耗管理、高密度集成的方案,代表着下一代云计算、高性能计算机的发展方向,“超高密度、绿色环保、高效低耗、一体交付、易于运维”等几乎成为新型服务器的标配。曙光TC5600系列整机柜服务器将成为大型企业、政府、运营商、能源、云计算、互联网等客户的理想选择。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。