IBM第一季度业务几乎所有方面都有所改善,但缺少让投资者眼前一亮的惊喜。
正如预期的那样,IBM在连续22个季度下滑之后开始连续第2个季度收入增长,但是这一增长主要是汇率波动的结果。收入和每股收益均超过此前分析师的预期,但IBM并未提高全年预期,反而重申了2018年每股盈利13.80美元的收入指引,市场预期为13.83美元。
这似乎有些令投资者失望,让IBM在盘后交易中下跌超过5%。
根据财报,IBM第一季度营收为191亿美元,比预测高出3亿美元,比去年同期增长5%。不过调整汇率后,销售额是持平的。每股2.45美元的利润略低于市场预期的2.42美元。
云收入表现较好,比一年前增长14%至42亿美元。但是,这远远落后于AWS的40%多增长率,以及微软Azure部门接近三位数的增长率。
总体而言,IBM实现了此前承诺实现的,但并没有太多超出期望的。备受关注的认知解决方案业务(包括安全、分析和垂直平台)收入增长了6%。认知系统是IBM迄今为止盈利最多的业务,毛利率超过76%。
利润相对较低的全球商业服务部门销售额攀升4%。系统销售继续得益于新型大型机产品线,实现8%的增长,大型机收入增长54%。
不过不变汇率计算的话,增长情况就比较平淡了。例如,在货币调整之后,认知解决方案收入仅增长2%,而全球商业服务收入实际上是缩减了。
对于希望看到增长的投资者们来说,好消息是IBM对分析、安全、云计算和认知产品和服务的战略业务占收入的47%,高于去年同期的46%。IBM首席财务官James J. Kavanaugh说:“IBM现在是一家认知解决方案和云平台公司。”
该季度IBM的战略业务收入增长15%,按固定货币调整后增长10%。亮点在移动和安全方面,增长率分别为14%和60%,不过基数较小。
但是,作为最主要的一项战略业务,IBM在分析业务方面仍然面临挑战。第一季度分析收入达到48亿美元,增长率仅为4%,上一季度为6%,被IBM前任首席财务官称为“令人失望”。
存储硬件在连续四个季度增长之后出现销售额的下滑,而这主要是受到了竞争和价格压力的影响。“我们的存储业绩令人失望,”Kavanaugh说,但他预测接下来这部分业务会有所改善。
“这是一场争夺市场份额的战役。不过我们对今年晚些时候推出的新产品感到满意,我们已经在投入市场方面采取了重要措施。”他补充说,IBM确实看到了软件定义和云存储的“强劲增长”。
不过近几年来,IBM一直被实现增长的问题所困扰。在逐步退出硬件销售、剥离其芯片业务并在云计算中站稳脚跟的过程中,IBM放弃了很多低利润业务,并专注于稳定增长。虽然本季度的业绩并没有能让投资者欢呼的理由,但IBM强化了公司保持财务状况良好的公司形象。
Kavanaugh说:“我们的资产负债表非常抢眼,我们拥有所需的灵活性,强劲的业绩和现金流,我们今年我们走向了正轨。”
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。