至顶网服务器频道 04月17日 新闻消息(文/董培欣): 4月3号,在联想ThinkSystem服务器新品发布会上,有一张图片让我思绪万千。把我带到了十五年前头一次对联想服务器进行测试时的情景。
我比较善于对网络和网络安全产品进行网络应用性能测试。但可能有很少人了解,网络应用性能测试最早是用在服务器的Web应用性能测试之中。也就是在那个时候,我接触到了给我留下深刻印象的联想。
之所以对联想服务器印象深刻,是因为在那个时候,无论是计算性能测试,还是Web应用测试,联想服务器的总能排在前列。同样规格的处理器,联想的产品性能为什么会不一样?
在一次,参与联想1U服务器新品发布的时候,解开了我心中这个迷题。为了获得更好的电磁稳定性,联想对主板线路采用了更加复杂的回路设计,为了更好散热,在前面板空间让给更多可热拔插硬盘的时候,创新的采用鲨鱼鳃一样的进风,当时联想技术人员的讲解,至今还历历在目,记忆犹新。正是这一系列的技术展示,让我对联想服务器的技术水准印象深刻。遗憾的是随着网络应用测试的重点向网络和网络安全产品偏移,对服务器的关注减少,也就再也没有和联想的服务器有了接触。直到今年的“闪耀经典,智领未来”。
伴随着近几年,网络应用性能测试在向云计算领域的扩展,我又重新开始了对服务器产品的研究。于是有了这次和联想服务器“闪耀经典,智领未来”的接触。
这次接触给我的体验,可以用“天翻地覆”来进行形容。十几年前服务器,双路、四核、八线程,配上几十个G的内存,就已经是非常高的配置了。而现在,一颗CPU就可以提供28个内核、56个线程,内存更可以以“T”来计算,再乘以双路、四路、八路……。可以毫不夸张的说,现在一台高性能服务器的计算能力,完全可以和以前一个数据中心相媲美。
可是,随之而来会产生一个问题,如何对这些计算资源进行有效的运用。以前SAS、SATA通过Raid进行数据传输的带宽明显已经不足以支撑如此大量CPU的数据分配。如何解决,用内存进行数据存储,因此SAP HANA的内存数据计算开始大行其道。
但是内存资源毕竟有限,而且内存属于易失性存储,一但断电会造成数据丢失,怎么办?用闪存。于是在本次发布会上,联想推出了打造极限性能的“ALL Flash Plus”的全闪存服务器产品。
联想的全闪存服务器在使用第二代英特尔 至强可扩展处理器进行性能提升后,利用高达2933Mhz+的TruDDR4内存来大幅提升数据处理性能,同时利用英特尔 傲腾 数据中心级持久内存,既可以提升高效传输数据容量,又可以减少非易失性数据丢失风险。再加上SSD固态硬盘提升数据传输带宽、更进一步增大数据存储容量,从而形成了一套完善的全闪存数据解决方案。
正是由于联想服务器对高性能、新技术的孜孜不倦追求。目前联想ThinkSystem服务器产品,已经成为全球第一的136项世界纪录保持者。并且自2001年以来,总共打破300项以上的基准测试世界纪录。不但如此,联想服务器产品还荣获了可靠性和客户满意度的双料冠军,以及成为第一家针对服务器产品拿到15万小时MTBF(平均无故障时间)认证的厂商。
最后,我们也衷心的祝愿联想,可以继续保持以技术为先的优势传承,在未来的数据中心、边缘计算等领域,为大家提供出更加高效、更加智能的各类服务器产品。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。