还是一样的,如果想运行速度最快的计算机的话,2018年6月出笼的超级计算机500强榜单(https://www.top500.org/lists/2018/06/)表明,Linux是所有操作系统中最好的。500强榜单所有的机器都运行Linux。
Linux多年来一直统领超级计算机行业。但直到2017年11月Linux才彻底接管了超级计算。2017年11月的500强榜单第一次全部是Linux(https://www.zdnet.com/article/linux-totally-dominates -supercomputers/)。在此之前,IBM AIX(https://www.ibm.com/it-infrastructure/power/os/aix)还排在500强榜单底部,IBM AIX是个Unix变体。
展望未来,Linux毫无疑问将继续统治超级计算。根本就没有任何竞争。
假若有竞争的话,诸如红帽(https://www.redhat.com/en)的Linux公司也会帮助Linux保持领先地位。红帽帮助的最新头号超级计算机是美国能源部橡树岭国家实验室(https://www.ornl.gov/)的顶峰(Summit)超级计算机,顶峰超级计算机排在500强的“顶峰”,用红帽企业Linux(RHEL)运行所有超级计算机的资源,运行速度快而且也顺利。
但超级计算机硬件方面则另是一派景象。这里出现了架构巨变。
在最新500强排名中,56%的额外FLOPS(每秒浮点计算的英文缩写)都是用了NVIDIA Tesla GPU的结果(https://www.top500.org/news/new-gpu-accelerated- supercomputers-change-the-balance-of-power-on-the-top500/)。具浮点神威的GPU在超级计算机性能上胜过CPU,这是第一次。例如,新的超级计算冠军顶峰计算机的主板运行两个IBM Power9 CPU和六个V100 GPU。根据NVIDIA的资料(http://www.nvidia.com/page/home.html),顶峰计算机峰值性能(187.7 Petaflops)中的95%源自该系统27,686颗GPU。
Sierra超级计算机(https://computation.llnl.gov/computers/sierra)的运算不是那么依靠NVIDIA,GPU密集小些,Sierra现在是全球第三快的超级计算机,速度达到71.6 Linpack Petaflops。Sierra的双插座Power9节点中只有四个V100 GPU,不是六个V100 GPU。但Sierra的17,280颗GPU仍然是系统性能的大头。
展望未来,Linux将继续称霸, 而GPU将变得日益重要,两种趋势都会持续。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。