还可能取代整个业务部门。
作者:Tobias Mann
更新时间:世界协调时2024年4月10日星期三08:29
英特尔公司首席执行官Pat Gelsinger在本周二的英特尔愿景主题演讲中描述了一个场景,人工智能最终将使整个办公室甚至可能是整个企业实现自动化。
他将此描述为人工智能功能时代,在这个时代里,针对特定应用模型、经过高度调教的代理开始与其他代理互动,并完成任务。他设想道:“实际上,整个部门都将成为人工智能自动化解决方案。”“也许我们会迎来一个新时代,会出现首个价值十亿美元的、只有一个人的公司。”用StartupLand 的说法,这就是“独角兽”。
当然,Gelsinger更希望用于训练和运行这些人工智能代理和功能的硬件是由英特尔创建的,或者至少是由英特尔制造的。在大约100分钟的主题演讲中,他谈到了能够在家中运行模型的AI PC、能够运行LLama2-70B 等小型聊天机器人的Xeon 6服务器,以及Habana 团队的旗舰产品Gaudi3加速器等。英特尔认为,后者能够与英伟达的H100相媲美。
Gelsinger寄希望于人工智能基础设施和服务的广泛应用来推动英特尔未来的发展。他预测说:“我简单地称之为:每家公司都会成长为一家人工智能公司,这将成为半导体潜在市场范围不断扩张的推动力,到这个十年末,半导体潜在市场规模将从约6000亿美元增至 1万亿美元以上。”
正如Gelsinger后来指出的那样,要想销售硬件并在人工智能基础设施市场中占据重要份额,英特尔必须提供切实的业务成果。
埃森哲的首席人工智能官Lan Guan认为,这项技术最大的障碍之一是“价值实现模糊不清”。
这种说法不足为奇。用于训练和运行大型语言模型(比如微软的Copilot 和谷歌的 Gemini)的人工智能加速器成本高得惊人。
Guan在台上对Gelsinger表示:“很多客户告诉我,他们很难从人工智能投资中实现价值。”
正因为如此,用人工智能取代所有知识型员工的想法无疑对企业来说是一个诱人的前景,而对员工来说则太过可怕。
英特尔非常清楚这一点。这家X86巨头已经承诺,到2030年,将培训3000万人从事人工智能工作——无论是目前的工作,还是新的工作。上周,这家芯片公司与其他科技巨头一起组成了一个联盟,以确定哪些工作最有可能在初期被人工智能淘汰,哪些工人可以接受再培训。
Gelsinger认为,好消息是这些变化不会在一夜之间发生。似乎在人工智能功能来取代我们的工作之前,还有很多工作要做。
他认为:“我们看到企业人工智能转型就发生在我们身边,但我们认为它分为三个不同的阶段展开。”
他将第一个阶段描述为“人工智能副驾驶时代”,在这一阶段,微软、谷歌等公司推出的智能助手将帮助提高工人的工作效率。 Gelsinger指出:“我们预计这类功能将使生产力提高 25%。”
他预测,下一步,人工智能代理将崛起,它们可以处理更复杂的任务,并实现整个工作流程的自动化——比如生成业务报告。他最后表示,只有到了那个时候,我们才能开始将它们串联起来,形成人工智能功能。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。