实时数据监控分析和DevOps工具厂商Splunk今天发布了Splunk Connected Experiences和Splunk Business Flow产品,让客户从移动设备就可以访问数据和信息。
除了让客户可以更容易地通过移动设备访问仪表板和获得洞察之外,Splunk还涉足了增强现实(AR)技术,这种技术可以利用移动设备的摄像头将图像叠加于现实物体上。Splunk利用这种技术,让客户可以直接通过服务器和机架直接查看服务器负载和其他分析信息。
Splunk首席技术官Tim Tully表示:“移动和增强现实技术让人们现有的工作方式和期望的工作方式快速发生变化。企业组织应该采用这项技术在当前和未来保持竞争力。”
这款名为Connected Experiences的产品可以从服务器日志和其他数据源收集数据,一目了然地提供关于服务器的信息以及服务器内部运转的信息。Business Flow则提供了网络数据驱动的运营智能,帮助企业组织实现了基于服务器使用情况的端到端业务生命周期可视化。
Splunk AR界面让任何拥有移动设备的客户可以扫描服务器机架上的二维码或者NFC标签,之后当客户查看机器、机架或者其他设备的时候,就会实时叠加来自仪表板的弹出信息。
在移动设备上访问Splunk仪表板意味着现场技术人员可以详细检查信息而使用键盘和显示器,他们只将手机或者平板电脑连接到机架或者机器就能获得即时信息。
此外,当技术人员站在故障设备面前的时候,应用就会弹出允许深入查看的仪表板。这个AR界面非常适合于显示当前处理使用、I/O速率、处理器温度和其他健康数据等信息,而且有仪表板可用意味着可以快速得到更深入的分析结果,特别是依赖于网络视图的信息。
Tully表示:“我们的愿景是通过这些关键技术,让人们可以随时随地通过Splunk获取数据。我们这些最新的创新都是基于Splunk的强大平台打造的,通过简化数据访问强化了调查的功能。”
AR技术在工业和企业中的应用已经有了很多成功的案例,包括帮助工人获得修理或配置设备的操作信息,这也成为构建UpSkill平台的一部分。这让远程专家可以通过例如Scope AR远程协助平台获得技术支持。
Splunk的AR应用也适合于这种场景,为现场技术人员在查看服务器故障的时候提供额外信息。
例如,客户可以在仪表板上看到数据流或者处理器温度的变化。但是,当客户在服务器集中进行实际操作时,弹出的信息本身会提供新的态势感知能力。
这款AR应用程序现在可通过App Store免费下载,适用于iPhone和iPad。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。