技术的快速发展令人目眩,对商业的影响深远而难测。ThoughtWorks科技棱镜未来技术趋势分析报告应运而生。
作为一家软件和数字化转型咨询公司,ThoughtWorks必须领先于技术发展趋势,这样才能帮助我们的客户为企业建立战略优势。我们的咨询顾问和客户遍布全球,形成一个庞大的网络,确保我们能对未来技术趋势的发展进程和潜在影响建立广泛视野。我们将在本报告中分享对技术趋势的洞察,这些见解来自于为期五年的对大量客户的调查研究,让外界能一窥为何我们能够通过前沿技术帮助企业实现转型。
科技棱镜未来技术趋势分析报告涵盖120多个独立技术趋势;为了帮助您深入理解这些趋势,我们分六个“视角”来进行分析。这些视角将帮助您重点了解各个发展趋势对贵企业意味着什么,以及您需要如何做好准备。这些视角可以单独使用,也可以相互结合以形成更多的视角,开辟全新的调查途径和思路。
下面是我们节选“计算结构的变革”的内容,更多完整内容可以参见报告全文。
计算的边界正在扩大,这就为企业带来了无限的可能性。新兴的计算环境不仅为挖掘前所未有的数据分析和处理能力提供了机会,而且也为构建计算架构以更好地满足业务需求打开了机遇之门。
技术透镜未来技术趋势分析为了适应互联网及其所有用户的未来需求,计算领域正在发生变化。现在,数据处理不再仅仅集中在云服务中,而且还会发生在网络边缘、设备之中、跨多个云和托管服务。随着量子和生物计算的兴起,甚至有望实现基于DNA的存储,未来计算领域的发展可能会更加激动人心。
在过去,只有大企业才需要大规模的数据处理。自智能手机出现和物联网设备普及以来,这些设备产生的数据海量增加。数据分析不再是企业数据仓库的专属领域;在由人、设备、汽车、工厂和城市组成的互联网络中,数据可以存在于任何地方。数据越多,对计算能力的要求也就越高。
除了数据和计算位置的变化,计算机体系结构也在不断演进。对移动性的推进大大推动了高效能芯片的开发,甚至包括同时配备“大/小”计算内核的芯片设计,这些计算内核能根据负载进行优化,以实现高性能和高效能。
机会
企业可以通过做出明智的计算选择,来优化IT成本,并且为消费者提供更快响应服务。在企业环境中,并非所有部署方案都能达到相同效果。
尽管云计算容易实现高可用,但数据的实际位置和处理方式依然重要。创新的网络技术无法克服基础的物理问题;与部署在本地甚至部署在家庭或工作场所的数据中心相比,部署在地球另一边的数据中心延迟总是会更高。
这意味着,根据您选择在何处放置数据、如何移动数据以及如何使用数据进行计算,成本和客户体验将会千差万别。选择最合适的硬件(包括芯片类型、大小和内存)将直接影响所需的实例或虚拟机的数量。一些应用领域(医疗保健、金融服务、电信和工业物联网)要求延迟更低,集中式平台无法满足这种要求,因此就需要配置更多的本地计算资源。
无论采用何种资源架构,务必牢记,最终客户将会认为这些都是您的责任。消费者希望他们的联网设备能正常工作,如果由于云提供商宕机,他们无法按响门铃或是解锁联网汽车,他们会责怪门铃供应商或汽车供应商,而不会归咎于提供底层计算的公司。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。