企业技术解决方案是基于这样的认知的:即大型企业面临持续的、经常不断变化的挑战。大多数企业IT厂商的产品和服务旨在帮助客户成功解决现有的问题和数字化转型的挑战。最优秀的厂商具有远见、技能和专业知识,可以帮助企业有效地为即将到来的更大难题做好准备。
IBM商业价值研究院(IBV)最近发布了一份题为《量子时代安全性》的报告,提供了有关此过程如何运作的洞察。该报告研究了网络犯罪分子等其他有权使用量子级工具的不良行为者所带来的潜在灾难性危险,还讨论了IBM正在采取哪些措施来解决这些问题,帮助企业保护他们的IT资产和基础设施免受量子网络威胁。
IBM专注于量子安全
IBM一直在积极开发一系列高级安全产品,其中包含IBM Quantum Safe服务,旨在抵御基于量子的加密破解技术。该服务适用于去年4月推出的IBM z16大型机,这是业界首个量子安全企业级系统。
此外,IBM花费数年时间建立了一支由顶级密码学专家组成的全球团队,以带头制定量子安全方案和准备计划。在美国国家标准与技术研究院(NIST)选择用于后量子密码学标准化的四种算法中,IBM为其中三种算法的开发工作做出了贡献,并且IBM还是GSMA后量子电信网络工作组的创始成员。
量子计算的好处和危险
这份IBV报告开篇提出了一个简单的前提:“量子计算正在从幻想发展到可行。”
从好的一方面来看,新兴的量子解决方案可以帮助解决机器学习、材料科学、药物研究和过程优化等领域的棘手问题,如果未来这些变成了现实,那么潜在的科学、社会和商业利益将是巨大的,非常值得追求下去。
然而,与任何技术一样,量子工具可以用于好事,也可以用于坏事。关于其危险性,IBV报告指出,在错误的人手中,“量子计算对支持几乎所有数字交易的经典加密协议构成了生存风险”。
因此,RSA和ECC公钥加密(PKC)等常见的可信数据加密机制有可能很容易遭到攻击,危及组织的信息和金融资产。
正如世界经济论坛去年8月所说的,“鉴于到2025年数字经济的价值预计将达到20.8万亿美元,其影响力可能是惊人的”。
这种情况下的另一个因素是多种形式信息的长期价值,包括与国家安全、商业战略、知识产权、公共基础设施、医疗记录和产品开发相关的数据。IBV报告表明,这些资产可能已经在所谓的“现在收获,稍后解密”攻击中被泄露,目的是一旦量子解密解决方案可行就将这些数据变现。
对于从大型企业到政府机构和实体、从公共事业到电信提供商的各种组织来说,为未来使用量子级加密工具支持的网络攻击做好准备是至关重要的。
构建“量子安全”密码学解决方案
那么这份IBV报告建议企业应如何应对这些危险呢?
分析总结
IBM在量子安全产品和服务方面的工作,以及对高级安全开发的持续投资,表明IBM正在做它最擅长的事情。虽然很多企业IT厂商倾向于将产品团队和创造区分开来,但IBM高度专注于将软件、基础设施、数据分析、以及把AI集成到可行的新业务解决方案和服务中,这对于那些希望IBM帮助解决现有关键业务问题的众多企业来说至关重要。
同样重要的是,IBM对下一代技术的追求旨在探索新的商业机会和问题。IBM一直是商业量子系统开发的领头羊,IBM一直以来所汇集的洞察力,很可能是新一代IBM z16大型机提供量子安全服务的基础。
IBV新发布的《量子时代安全性》报告的结论表明,IBM正在做着和过去相同的事情,从本质上讲,IBM正在利用大量投资、洞察力和发明创造来帮助企业客户了解、准备并成功应对未来的各种变化和挑战。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。