至顶网服务器频道 04月02日 新闻消息(文/李祥敬):在当今时代,随着云计算、大数据、人工智能(简称“ABC”)等技术的深入发展,我们步入一个数据大爆炸的时代。为了处理海量数据,企业需要高度可扩展的低成本存储解决方案。而软件定义存储是一种合适的解决之道,特别是Ceph技术的崛起,为软件定义存储提供了强有力的支撑。
Ceph是一个开源分布式存储平台,提供对象存储、块存储和文件存储功能,可以用于构建公有云和私有云环境。正是Ceph提供的优质特性,互联网公司以及运营商、政府、金融、广电、能源、游戏、直播等行业客户纷纷将Ceph与自身的业务系统相结合,围绕Ceph的生态圈日渐壮大。
作为开源软件的领导者,SUSE也推出了基于Ceph的SUSE Enterprise Storage。SUSE Enterprise Storage是一款高可扩展的、有弹性的基于软件的存储解决方案,它使企业可以摆脱专有的、以硬件为中心的存储解决方案,转而选用一种功能上可以媲美中高端产品的、软件定义的存储解决方案。
SUSE杰出工程师、Ceph顾问委员会成员Lars Marowsky-Brée
SUSE杰出工程师、Ceph顾问委员会成员Lars Marowsky-Brée告诉记者,SUSE在整个Ceph领域是举足轻重的参与方。SUSE一直致力于把Ceph打造成具备企业级高可用性、高稳定性、高可扩展性的软件定义存储解决方案,让用户可以方便部署。
SUSE在整个开源领域是领军企业,那么在Ceph领域扮演何种角色呢?
Lars表示,SUSE是Ceph开源社区非常忠诚、参与度非常高且时间很长的成员,SUSE非常紧密地跟整个Ceph社区进行合作,比如SUSE编写的源代码直接给到开源社区,再通过开源社区引入到我们的产品开发中等。“同时,我们也跟Ceph顾问委员会有非常紧密的关系,跟他们进一步携手共同开拓相关的解决方案。”
在Lars看来,Ceph开源社区跟其他社区不同之处在于,Ceph社区有非常强的组织能力,它一切都是井井有条的,这个社区最初是由一些研发人员发起的,发起的第一天就秉承开放的态度,经验丰富的工程师和杰出的开发人员在这个社区里面,合作非常紧密,也非常顺畅,SUSE也积极参与其中。“我们乐于看到整个社区不断发展壮大,新的技术能够促进更多商业化的应用。”
Lars表示,我本人是Ceph顾问委员会成员之一,作为顾问委员会,我们会积极参与整个社区各种各样的事务。我认为整个开源Ceph社区管理运作非常良好,是非常棒的一个社区。大家的目标是一致的,我们有相同的目标,也许视角不一样,有的站在商业化的角度,有的站在技术层面,但是大家的合作非常紧密。
针对中国市场,目前中国企业对Ceph的贡献度是非常大的,SUSE也与中国的合作伙伴一起推动Ceph的落地。“我认为中国是非常有潜力且巨大的市场,新的应用和解决方案层出不穷,SUSE可以和这些合作伙伴开展更多、更广泛的客户拓展。”Lars说,“打造Ceph生态系统离不开我们非常好的合作伙伴,例如SUSE和SAP就联手基于Ceph的存储技术打造IoT解决方案。”
现在包括区块链、人工智能这样一些新的技术会给企业数据、存储等带来新的需求和挑战,对于Ceph来说有哪些发展机遇?
Lars表示,不管是人工智能还是物联网都会给我们带来海量数据存储的问题,Ceph正是存储这些海量数据的应对之策。比如说机器学习要把海量数据输入到机器,这样机器才能不断地学习。而作为分布式存储解决方案,Ceph非常适合AI、机器学习的应用场景。反过来,AI和机器学习作为一种工具能够促进和提升Ceph性能,这是相互促进的过程。
同时,现在存储硬件技术不断革新。Lars表示,硬件包括芯片不断的进化会促使Ceph在软件层面灵活应对硬件层面的变化,底层硬件的突破也会让Ceph发挥更强大的作用。
另外,Ceph独特的可扩充结构使它极为适合云。这也是为什么Ceph正快速得到业界接受并正被集成到Linux内核、OpenStack和其它许多云平台的原因。对此,Lars说,Ceph在OpenStack中的完美应用是一种“天作之合”。未来Ceph在公有云方面还会有进一步的发展和突破,我们会看到越来越多的公有云供应商在积极利用Ceph让公有云变得更高效、安全、便捷。“当然,公有云提供商需要像SUSE这样能够值得信赖的合作伙伴帮它们共同打造一个公有云生态环境,SUSE在未来会以非常开放的态度积极拥抱开源,助公有云的发展一臂之力。”
总之,未来,Ceph功能会越来越丰富,应用数据量越来越大,整个行业应用场景也越来越广泛,特别是金融、医疗、媒体、安防、运营商等市场。
在采访最后,Lars表示,企业选择了Ceph,就说明他走在了正确的道路上。因为Ceph的扩展性是非常强的,可以帮助企业应对海量数据挑战。同时,作为开源技术,Ceph让企业不会被某个专属厂商锁定。基于开放接口打造的合作伙伴生态圈让企业能够更好集中精力做更擅长的事情取得商业上的成功。
“我建议企业应该尽早了解Ceph并且应用Ceph,尤其是数据增长量非常快的企业,比如互联网企业数据增长量非常快,它需要非常好的存储解决方案。还有就是数据类型非常多样化的企业非常适合用Ceph。”Lars如是说。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。