共有34种设计方案可供选择,如何开启机器学习之旅任君考量。
为了引导技术人员和工程师们积极尝试自家AI加速硬件,英特尔公司已经整合出一系列软件参考套件,宣称能减少在其芯片之上部署机器学习系统所需要的时间和资源。
如大家所想,这34种开源参考套件能够解决各种常见的AI/机器学习工作负载,包括支持聊天机器人和他生成式AI大语言模型,以及处理对象检测、语音生成和财务风险预测等更为普遍的任务类型。
英特尔指出,他们与埃森哲合作开发的这些参考套件均包含必要的模型代码、训练数据、库、oneAPI组件以及面向英特尔硬件的具体实现指令。根据英特尔方面的介绍,这些参考套件还将根据社区的反馈意见定期保持更新。
但这里需要澄清一点:这些套件似乎均为纯软件。需要由客户提供(内置英特尔芯片的)硬件,再配合给定的套件在其上构建AI/机器学习应用程序。
英特尔当然也做好了战斗准备,手中掌握着大量可运行此类AI应用程序的加速器和GPU,包括Habana Gaudi 2训练处理器、Ponte Vecchio GPU以及内置在英特尔Sapphire Rapids至强Scalable处理器当中的高级矩阵扩展加速器。
尽管一直在围绕生成式AI开展大规模宣传,但英特尔的加速器似乎始终没能像英伟达的GPU那样受到公众的广泛关注和使用。而好消息是,英伟达家的GPU被大量用于训练那些规模恐怖、知名度极高、疯狂吞噬GPU资源的大语言模型(各大主要云服务商也在主动争夺英伟达资源,采购数以万计的GPU和加速器),因此一定会有很多客户无法以合理的价格和供应量获取英伟达产品,这样英特尔也就有了占领市场份额的机会空间。
根据技术外媒体The Next Platform的报道,英伟达的H100 PCIe卡(这甚至还不是英伟达家最顶级的GPU版本)在eBay上的竞价已经高达4万美元。
因此,只要英特尔能够降低在其加速器上部署AI工作负载的障碍,那这位x86技术巨头应该有能力说服客户接受他们的部件,特别是那些更昂贵的旗舰产品。
当然,采取这种曲线对抗策略的不只有英特尔一家。英伟达在GPU加速的软件开发与商业化方面已经取得了巨大成功。去年,英伟达CFO Colette Kress就明确强调了此类订阅软件收入,将对推动GPU芯片巨头实现万亿级别收入的重要意义。
AMD也在积极推出自己的AI GPU和加速器产品。今年6月,AMD方面详细介绍了Instinct MI300 APU与GPU,这些产品将在HPC和AI/机器学习领域同英伟达展开正面竞争。除了新款芯片之外,这家芯片制造商还宣布与Hugging Face建立战略合作伙伴关系,由后者负责开发用于构建机器学习应用程序的工具,并针对AMD的Instinct GPU、Alveo FPGA、以及Epyc与Ryzen CPU对目前几种主流AI模型做出优化。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。