至顶网服务器频道 09月29日 新闻消息(文/李祥敬):今年4月11日,IBM召开中国论坛,发布“商业人工智能”战略,为“助力行业转型”和“赋能专业人士”提供领先的认知和云平台解决方案。沿承这一战略的发布,IBM系统部在IBM Systems创行者高峰论坛上发布了从“硬件产品”提供者向“架构解决方案”交付者的业务转型战略,将以面向人工智能、区块链、云计算、开源数据库等领域的基础架构解决方案,助力行业企业获得IT系统的“变革”与“构建”两大能力,智胜认知时代下的“架构之役”。
其中,面向人工智能的软硬件一体化架构方案——IBM认知系统(Cognitive Systems)借助唯一拥有CPU GPU NVLink的面向高性能计算的IBM Power Systems架构,提供人工智能相关工作负载所需的高性能计算力。此外,认知系统集成了PowerAI深度学习框架,提供预编译的主流深度学习软件工具包,同时简化安装、部署,并针对NVidia GPU及NVLink优化性能。而认知系统中包含的BlueMind深度学习平台具有丰富的深度学习功能,基于Spark大数据平台框架,能够以领先的并行效率和扩展性能进行深度学习平台的资源管理、调度,助力用户在集群或云环境中快捷、高效地开发深度学习应用。
IBM副总裁、IBM中国系统开发中心总经理谢东博士表示,当人工智能发展到今天,如何把人工智能技术和企业用户、行业应用结合起来,这是IBM的一个切入点。IBM不光是研究人工智能算法、人工智能平台本身,而是把这些技术如何真正和各个行业的应用结合起来,并且使这个行业尽快采用人工智能技术。
IBM大中华区硬件系统部Linux系统技术总监徐宁补充说,不管是人工智能,还是认知计算,IBM强调与行业的融合。我们希望站在行业需求的角度解决行业的痛点。现在所谓的AI,最大的好处是把以前人们认为机器干不了的事情现在由机器干了。
“我们提供的这套解决方案一个最大的特点是‘平台+服务’,平台的软硬件让人工智能具有更好的伸缩性,服务让人工智能在行业中落地。”谢东说,“同时,我还要强调IBM技术的领先性和开放性。技术的领先性,不管是Power系统,还是PowerAI深度学习框架、BlueMind深度学习平台,IBM走在了技术前沿。在开放性方面,IBM在人工智能有大量投入,同时IBM也会把开源社区的成果融入到开放的集成环境里。”
IBM Power Systems基于搭载了NVIDIA NVLink的POWER8处理器,通过高速、节能的NVIDIA NVLink标准,新系统实现了POWER8处理器与NVIDIA Tesla P100 Pascal GPU的连接。NVIDIA NVLink协议融入芯片设计,并纳入了整体系统设计,提高了GPU与GPU之间的连接带宽,缩短了企业利用高级分析、深度学习、人工智能等应用获得洞察所需要的时间。
而IBM推出的PowerAI深度学习软件基于Power Systems而构建和优化,可帮助数据科学家与开发人员解决所面临的挑战,具体来说:它可以提供丰富的工具和数据准备功能,简化开发体验,还可以将AI系统训练所需的时间从数周缩短到数小时。
BlueMind深度学习平台是基于Spark的分布式深度学习平台,它是业内业界支持最全面的分布式深度学习平台(支持Caffe,TensorFlow,Theano,Torch),拥有优异的并行效率和扩展性能,在大规模集群中可以保持加速率在80%以上。同时BlueMind能够提供专业的神经网络和超参数优化建议丰富的深度学习功能,友好的用户GUI界面,为不同深度学习框架提供统一的inferencerestful API。
相对于业界其他的深度学习平台,BlueMind的优势是显而易见的。它基于Spark大数据平台框架,能够进行深度学习平台资源管理、调度,同时具备多租户功能以及GUI界面。在深度学习模型管理,超参数搜索方面拥有较明显优势。而且,BlueMind支持业界所有主流深度学习框架,这是其他一些深度学习平台所不具备的。包括先进的硬件设施支持,以及IBM丰富的深度学习知识库,都能够帮助开发人员更好地构建深度学习应用,实现更高的价值,使企业获得更强的行业竞争力。
目前,IBM认知系统已在金融、医疗、制造等多个行业建立了成熟的应用场景,为企业提供质量/监控监测分析、产品深入优化、个性化设计研发、视频/图像识别等人工智能应用方案。比如厦门市第二医院应用IBM认知系统所搭建了“医疗影像辅助治疗系统”,这一系统将以秒级的读片时间大幅提升该院的诊疗效率与精准度,助力其实现标准化、专家化、快速的医疗影像辅助诊疗。
厦门市第二医院医学影像科主任郭岗表示,我们在数字化方面快速发展,希望借助自身积累的数据和经验,通过深度学习,实现两个方面的目标,一个是提高看病的效率,一个是提高看病的准确率。而IBM认知系统正好满足了我们的需求。
“未来,厦门二院还将与IBM共同成立联合实验室,基于IBM认知系统的领先架构能力及全套组件探索3D影像识别、CT智能化检测、磁共振智能化研究等方面的应用前景,致力于促进分级诊疗的进一步实现。”郭岗说。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。