(2024年6月26日,北京)近日,IBM凭借其旗舰Granite系列模型,在2024年第二季度的《Forrester Wave™:语言AI基础模型》报告中,被评为“强劲表现者”。点击链接即可免费下载报告副本。
随着企业从生成式AI的试验阶段转向生产阶段,他们正在寻找基础模型的最佳选择,他们希望这些模型能够提供可信、性能优越且成本效益高的生成式AI。企业认识到,如果基础模型不可信,他们就无法扩展生成式AI。
IBM® Granite™ 是IBM的旗舰基础模型系列,基于仅解码器的Transformer架构。这些模型在涵盖互联网、学术、代码、法律和金融等领域的可信企业数据上进行训练,可以在IBM watsonx™、RedHat®、其他模型市场以及Hugging Face和GitHub等开源平台上获取。
IBM对AI信任和可靠性的承诺和方法,受到Forrester的认可
虽然大多数模型提供商专注于提高性价比,但IBM在设计和交付各种用例和应用的模型时,优先考虑信任和透明性,同时仍能实现合适的性价比。IBM痴迷于帮助客户取得生成式AI使命的成功,其实现这一承诺的方法是:正确地构建人工智能,提供正确的人工智能。
Forrester认为,Granite系列模型为企业用户提供了对基础训练数据的一些最稳健和清晰的洞察。这对于有效地改进特定用例和领域的模型行为,以及保护企业免受训练数据中任何未授权内容带来的风险至关重要。
这一认可验证了IBM在交付企业级基础模型方面的差异化方法,帮助客户加速生成式AI在其业务工作流程中的应用,同时减轻与基础模型相关的风险。
此外,Forrester给出的关于潜在改进领域的建设性反馈也非常及时,因为IBM正以开源创新重振其模型策略,从而在现有产品的强大基础上,可以迅速扩大市场影响力,为众多企业客户、合作伙伴和开发人员提供服务,并取得了显著的进展。
2024年,IBM在促进基础模型的增长和转型之旅中,积极寻求来自Forrester等行业专家、客户和人工智能生态系统的意见,凭借开放的心态和演绎推理不断探索。
IBM凭借其差异化的模型方法,在现有产品中排名第二:
IBM Granite模型在此次Forrester Wave评估中,在内容语料库过滤、知识产权、模型透明度和一致性方面获得了满分。Granite模型受隐私和负责技术办公室的管控,根据AI伦理和原则进行训练和调优,并采用了IBM Research®创新的AI对齐技术。
由于这些固有特性以及watsonx这一强大可靠的AI和数据平台的支持,以及通过红帽® OpenShift®的混合部署选项,IBM模型在企业就绪性、治理和安全性、应用程序开发和模型管理方面获得最高评分。这也与最近斯坦福透明度指数的结果一致,该指数认可Granite模型在开放性和可信度方面的优异表现。
Forrester对于IBM Granite的洞察:
IBM继续通过引入第三方模型来扩展其基础模型库,以增强多模态和多语言能力,并提供自带模型(BYOM)的选项。此方法与其Granite模型系列的研究开发和开放创新相辅相成。
请阅读最近在IBM THINK大会上宣布的与第三方模型合作伙伴关系相关的更多消息。IBM业务发展和战略合作伙伴团队还将继续签署特定的商业和独立软件供应商协议,以扩展平台上的模型选择。 正如 Forrester 所言,在基础模型方面,选择和灵活性将成为企业决策的关键因素。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。