Nvidia首席执行官黄仁勋在GTC大会上公布了未来三代GPU技术路线图,揭示了计算能力提升面临的巨大挑战。从芯片制程到散热和供电,Nvidia正通过增加硅片数量、提高封装密度等方式来突破摩尔定律的限制。这些努力也反映出当前AI计算发展所面临的瓶颈,以及未来数据中心设计的发展方向。
Amazon 发布了名为 Nova Act 的通用 AI 代理,可独立控制网页浏览器执行简单操作。同时推出 Nova Act SDK,供开发者构建原型。Nova Act 将为即将升级的 Alexa+ 提供核心功能。Amazon 称这是研究预览版,开发者可通过 nova.amazon.com 访问工具包。Nova Act 在内部测试中表现优异,是 Amazon AGI 实验室的首个公开产品。
aiOla 推出了一款名为 Jargonic 的新型自动语音识别模型,专为企业使用而设计。这个模型能够处理专业术语、背景噪音和各种口音,无需大量再训练或微调。Jargonic 采用独特的关键词识别系统,可以零样本适应企业特定词汇。在多项基准测试中,Jargonic 在准确性和专业术语识别方面都优于主要竞争对手。这款模型现已通过 API 向企业客户开放使用。
AI 视频创业公司 Runway 发布了最新的 Gen-4 视频合成模型,声称解决了 AI 视频生成的几个关键问题。该模型能够在不同场景中保持人物和物体的一致性,并允许从多个角度拍摄同一环境或主题。这一突破性进展有望为创意专业人士提供更实用的 AI 视频制作工具。
OpenAI 推出的 4o 图像生成器引发了一场 AI 动画热潮。这一发展不仅展示了 AI 辅助视觉创作的能力和局限性,还引发了版权问题的讨论。与之前主要聚焦于艺术诠释和风格转换的 Dall.E 模型不同,4o 图像生成器似乎旨在解决特定的专业痛点,尤其是在文本渲染和多图像一致性方面。随着各大 AI 平台开发出各自的专长,这一领域变得日益拥挤,同时也揭示了生成式 AI 的进展和持续挑战。
随着人工智能技术的发展,深度伪造内容在网络上大量涌现,可能对我们的健康造成潜在威胁。从虚假名人代言到有害的AI生成医疗建议,深度伪造正在助长一波危险的虚假信息浪潮。本文探讨了深度伪造在医疗保健领域的负面影响,以及如何在这个充满虚假信息的时代保护自己的健康。
INCYMO.AI 推出了一个革新性的 AI 驱动创意平台,专注于移动游戏广告制作。该平台基于 10 万多个市场验证广告的数据分析,通过 AI 技术为游戏营销人员提供创意构思和广告生成服务。在创意疲劳、用户获取成本上升和隐私限制的当前环境下,该平台为游戏营销开辟了一条数据驱动的全新道路。
Databricks 与 Palantir 签署合作协议,开发出更优的大语言模型微调方法,并与 Anthropic 达成为期五年的战略联盟,将 Claude 大语言模型整合到其数据湖平台中。此次合作将为企业客户提供更强大的 AI 能力,包括军工级安全性、高效的模型训练以及全面的数据治理,助力企业打造专属 AI 应用。
随着人工智能的崛起,我们的职业和个人生活正在发生变革。AI正逐渐渗透到我们的屏幕和思维中。在2025年复杂的政治格局下,我们似乎正生活在一个科幻场景中。这引发了一个不适的问题:我们还能保持多久的主导地位,而不是沦为按剧本行事的演员?AI的持续整合带来了一个微妙却重要的风险:能动性衰退。
据报道,苹果正在开发一项名为 Project Mulberry 的新项目,旨在通过 AI 技术"复制"用户的真实医生。该项目将以健康教练的形式出现在升级版的健康应用中,预计在 iOS 19.4 中首次亮相。这个 AI 健康教练将利用苹果已有的用户健康数据,提供个性化的健康建议。这是蒂姆·库克长期愿景的一部分,即让苹果在医疗保健领域做出最大的社会贡献。
Experian信用局采用了一种审慎的AI应用方法,开发了内部流程、框架和治理模型,帮助其测试和大规模部署生成式AI。这种方法融合了先进的机器学习、代理式AI架构和基层创新,改善了业务运营,并为约2600万美国人扩大了金融服务的可及性。Experian的AI之旅展示了传统数据公司如何转型为AI驱动的平台企业,为负责任的AI治理提供了蓝图。
ChatGPT等大语言模型聊天机器人虽然革新了工作方式,但仅限于对话层面。新一波AI浪潮将带来能执行复杂多步骤任务的AI代理,它们可以与其他系统交互,甚至编写代码创建工具。这将对工作方式产生巨大影响,可能导致更多工作岗位被取代,也可能帮助解决重要问题。本文探讨AI代理如何影响日常工作和长期职业前景。
本文探讨了人工智能对世界的影响,以及我们如何理解和应对这一技术变革。作者介绍了三种主流的AI发展方法,并提出了一个新的类比 - 我们都站在一座桥上,需要共同努力以避免失败。文章还讨论了AI带来的主要挑战,包括就业替代、心理健康问题、错误信息传播以及地缘政治竞争等。作者呼吁我们在拥抱AI发展的同时,也要保持人性价值。
Aflac 公司是美国最大的补充保险提供商,年收入达 190 亿美元。首席信息官 Sheila Anderson 加入公司两年多来,在推进公司技术、人才和流程方面发挥了关键作用。她统一了技术组织,改进了治理和财务透明度,重新评估了云战略,优化了人才结构,并推动了数据和 AI 创新。Anderson 正引领 Aflac 向着结合使命驱动传统和前沿技术的未来迈进。
CoreWeave从一个小型加密货币挖矿项目起步,凭借对GPU基础设施的深刻理解和开源AI社区的支持,迅速成长为领先的AI训练基础设施提供商。尽管IPO定价低于预期,但仍创下AI相关上市公司的最高融资记录。公司面临巨额债务压力,但对未来前景保持乐观。
新研究提出AgentSpec框架,通过定义结构化规则来提高AI代理的可靠性和安全性。该方法可防止90%以上的不安全代码执行,确保自动驾驶场景合规,消除风险行为,并具有毫秒级开销。AgentSpec有望改善企业环境和自动驾驶等领域的AI代理应用,为未来实现持续可靠的环境代理铺平道路。
最新研究发现,AI搜索引擎在引用新闻源时存在严重缺陷,不仅会捏造引用,还会减少原发布者的流量。这一问题对新闻业和公众对新闻的信任度有重大影响。研究显示,付费版AI聊天机器人表现比免费版更差,给出的错误答案更加自信。这些AI工具还经常伪造链接或引用文章的重印版本,而不是直接链接到原始来源。研究人员呼吁AI开发者提高透明度和引用准确性。
OpenAI为ChatGPT用户添加了期待已久的内部知识源引用功能。ChatGPT Team用户现可在测试期间直接连接内部知识库,引入公司特定信息。这项功能将使ChatGPT能够理解公司内部术语,执行语义搜索,直接链接内部资源,并提供最相关、最新的上下文信息,从而更好地回答企业用户的问题。
Google 最新旗舰语言模型 Gemini 2.5 Pro 发布后被其他 AI 热点掩盖。然而,实际测试表明,它在长文本处理、多模态推理和数据分析等方面表现出色,可能是目前最佳的推理模型。其百万级别的上下文窗口、强大的代码能力和详细的推理过程,为企业级应用打开了新的可能性,有望推动 Google 在生成式 AI 竞赛中领先。
OpenAI 本周为 ChatGPT 添加了 AI 图像生成功能,用户可直接在对话中创建图像。由于使用量激增,CEO Sam Altman 表示公司的 GPU "正在融化",不得不临时限制使用频率。新功能支持工作相关图像创建,如信息图表等,但在图像编辑精确度等方面仍存在限制。值得注意的是,大量用户正在使用该功能创作吉卜力动画风格的图像。