现如今,家电产品也变的越来越同质化,但还是有些品牌的某个产品系列在性能、可靠性等方面大幅领先于竞争对手,比如电视要买H牌,空调要买G牌的等等。那么,是什么导致了几乎没有太大技术门槛的家电产品间存在如此大的性能差距?
家电设计还要懂流体动力学?
虽然现在大部分家电的技术已经日趋成熟,但是工艺细节的改进、新材料的引入等还是能极大提升产品在相关方面的技术指标。这就要求家电设计工作不仅要了解机械、电路,还需要熟知空气动力学、流体动力学、热力学、电磁学等等跨学科知识。通过对热、结构、流体、电磁场仿真优化分析,并解决各物理场之间的耦合作用,方能保障产品的稳定性、可靠性与耐用性,最终才能争取产品在市场中的优势与地位。
但是温度、磁场、力这些概念都是无形的,怎么才能在设计中优化各种无形的场?答案是通过模拟仿真软件。比如,某冰箱生产商运用 ANSYS仿真软件进行冰箱概念化设计,每个部件都经过ANSYS严格的数值分析模拟,考察冰箱在堆放、运输、门摆动、甚至向搁板上丢东西时各部件的物理形变,降低了能耗、材料和制造成本,使新开发的冰箱电耗降低 30%。同样的,利用Abaqus,LS-DYNA,MSC Nastran,PAM-CRASH、EDEM等软件的模拟仿真,在家电、汽车等的设计中都能极大提升性能。
作为国内最知名的家电厂商之一,美的在2014年成立智慧家居研究院,将美的的30个大类的家电,全部在一个系统中管理。为了能使美的家电在市场保持持续的领先,美的研究院也运用了越来越多的CAE/CFD(计算流体动力学)软件来辅助设计,但是有一个问题却经常困扰美的,那就是软件处理的效率。
GPU服务器加速设计优化
由于CAE/CFD软件基本上采用有限元法或有限体积法求解控制方程,在计算时涉及大量的前后时间步迭代以及交界区域处理,属于计算密集型,对CPU性能的要求自然是越高越好。并且一般来讲,CAE/CFD软件对内存容量有比较高的要求,至于对内存带宽的要求则是与单节点内的进程数直接关联的,进程数越多,内存带宽要求越高。
而在在I/O层面上,多数CAE/CFD软件在读操作时,由主进程读入数据,然后向从进程分发数据;在写操作时,由主进程统一收集从进程的数据,然后主进程写出数据。也就是说,只有主进程直接负责I/O操作。因此,CAE/CFD对I/O存储的压力一般。
通常,为了优化仿真效率,可以通过配置高主频CPU和四通道内存来分别提高CPU、内存的性能。但是对于美的,这样的效率的提升并不能满足需求,通过优化高计算需求的应用软件会使CPU的负载变为100%,但是效率的提升有限。传统CPU的核心数量较少,这就意味着并行计算能力不会太强,主频提升的“红利”已经慢慢消退,目前人们越来越趋向于采用多个低主频处理器进行集成进行高性能计算。
因此,通过GPU来运行CAE/CFD正在成为一种趋势,拥有数千小核心的GPU拥有更高的并行处理性能,这也成为进一步提升仿真效率的重要基础。
浪潮NF5568M4为何被美的选中
针对美的的需求,浪潮推荐美的研究院使用NF5568M4 GPU服务器来进行流体动力学仿真等操作。每台NF5568M4可搭载4块GPU卡,此次美的则是选用了2块NVIDIA Tesla K80的GPU卡,配置2颗E5-2640V3处理器,128GB DDR4内存以及4块4TB硬盘。
NF5568M4
为何选用4U高度?
作为4U4卡的GPU服务器,NF5568M4的4U高度,保证了高性能计算的前提下,提供更好的散热。且NF5568M4可以实现机架式-塔式互相切换,既可以放在办公室当工作站使用,也可放置在机房通过远程访问,对于美的家电设计师来说,这极大提升了工作环境的灵活性。
K80还是K40?
而在GPU卡的选择上,浪潮推荐采用Nvidia K80而不是采用更多的K40集群。从规格上考虑,K80的CUDA Cores数基本多了一倍(4992:2880),显存多了一倍(24GB:12GB),显存带宽也高了将近一倍(480GB/s:288GB/s),单精度性能多了一倍(8.74 TFlops:4.29 TFlops),双精度性能高了一倍(2.91 TFlops:1.43 TFlops)。综合来看,NVIDIA Tesla K80具有K40两倍的性能。
在美的家电设计中,一个拥有1400 万个单元的模型需要使用 65 GB 的 GPU 内存,这至少需要使用四个服务器节点,每个节点配备两块 Tesla K40 加速器。如果使用 Tesla K80 的话,同样的任务只需两个服务器节点即可,每个节点配备两块 Tesla K80 加速器。这样不仅满足了性能要求,并且将服务器数量缩减了一半,节省了空间占用。
SATA硬盘能够满足IO需求?
GPU计算每天会产生大量的数据,所以存储空间只要保证10TB以上,但是数据属于缓慢写入,并不需要太高的IO,所以采用大容量SATA来解决。NF5568M4支持8块3.5寸硬盘,并通过配置高速的阵列卡,使计算集群拥有500MB/s左右的IO吞吐,足以满足美的CAE/CFD软件的应用需求。
利用浪潮NF5568M4,美的家电设计系统与仅使用 CPU 的系统相比,实际应用程序的吞吐量提升 5-10 倍,同时帮助使用加速数据中心的客户节省 50% 的成本。在模型仿真时,与单纯使用 CPU 相比可实现 2 倍性能提升。
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
研究表明,现有的公开 AI 模型在描述大屠杀历史时过于简单化,无法呈现其复杂性和细微之处。研究人员呼吁各相关机构数字化资料和专业知识,以改善 AI 对这段历史的理解和表述。他们强调需要在 AI 系统中加入更多高质量的数据,同时在审查和信息获取之间寻求平衡。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。