机器人初创公司Figure AI近日对其人形机器人进行了长达数天的全程直播,机器人持续自主完成扫描条形码并将包裹放置传送带的任务。该演示迅速在科技爱好者中引发病毒式传播,观众纷纷为机器人取名,公司也趁势推出周边商品。机器人依托Helix 02神经网络系统实现全身控制,所有AI推理均在设备本地完成。直播开始48小时后,机器人实现了无故障连续自主运行,期间还上演了机器人与人类实习生同台竞技的环节。
未来数十年,数十亿台AI驱动的自主机器人将走进工厂、仓库、养老院及家庭。2025年,机器人领域投资已达创纪录的407亿美元。然而,从演示视频到真实落地之间仍存在巨大鸿沟。作者认为,机器人领域的重大突破不会来自单一的ChatGPT式飞跃,而将依赖多种AI工具协同配合的系统工程,包括智能体架构、高质量训练数据、新型执行器以及大量真实场景部署经验的积累。
随着AI技术加速落地企业,Forrester研究指出市场正从任务级自动化转向流程编排。Camunda在阿姆斯特丹年会上发布ProcessOS——一款智能体操作系统,可重构并持续优化业务流程。其内部应用将"报价到回款"流程每笔交易耗时从5小时大幅压缩,节省6000人时。巴克莱银行也借助Camunda平台,通过确定性与智能体编排相结合,将原本耗时数月的客户尽职调查流程实现端到端自动化,大幅提升合规效率。
Figma正式推出内置AI智能体,用户可通过自然语言提示在协作画布中生成新设计、编辑现有内容或自动化重复任务,并支持多个智能体同步并行工作。该AI助手基于专为设计场景微调的模型,能够理解设计上下文与元素。Figma还与OpenAI、Anthropic达成合作,集成Claude Code等AI编程工具。面对Canva、Adobe等竞争对手,Figma 2026年第一季度营收达3.334亿美元,同比增长46%。
SAP在Sapphire 2025上承诺推出Knowledge Graph、Joule Studio和AI Agent Hub等工具,虽已技术上线,但实际采用率远低于预期。核心问题在于原架构过于侧重低代码易用性,缺乏专业代码灵活性和复杂审批流程支持。目前SAP正推出2.0版本大幅升级,新版Joule Studio支持LangGraph、AutoGen等主流框架,并原生理解SAP专有代码模型。Joule Studio正式版预计于第三季度发布,较原计划延迟约一年。
随着AI系统能力不断增强并深度融入生命科学领域,其被滥用于生物技术的风险日益引发关注。为此,Helena与兰德公司AI安全与技术中心于2026年1月联合举办专题研讨会,汇聚22位AI研究人员、生物技术专家、生物安全专家及伦理学家,共同围绝AI与生物学交叉领域的风险链,制定涵盖技术、政策、运营等层面的高影响力缓解策略,并形成初步实施路线图,为政策制定者和行业参与者提供实践指导。
OpenAI宣布采用两项新措施应对AI生成图像难以辨别的问题。一是支持C2PA开放标准,在图像元数据中嵌入AI生成标识;二是与谷歌合作引入隐形水印技术SynthID,该水印在截图、缩放或数字处理后仍能保留,更难被恶意删除。两种技术互为补充,共同提升图像来源的可追溯性。OpenAI还预告将推出公开验证工具,供用户检测图像是否由AI生成,未来计划扩展至其他AI工具。
英国AI药物发现研究联盟OpenBind近日发布了首个实验数据集和预测AI模型。该项目旨在打造全球最大规模的药物与蛋白质相互作用数据库,规模是近几十年同类项目的20倍。首批成果包含699种化合物与EV-A71肠道病毒蛋白结合的X射线图像,以及601种化合物的结合强度数据。通用预测模型OpenBind v1预计月底发布。该联盟获英国政府800万英镑资助,成员涵盖牛津大学、哥伦比亚大学等顶尖机构。
Romark Logistics选用Dexory旗下AI驱动的仓库可视化平台DexoryView,提升其Hazleton仓库的库存管理能力。该平台借助自主机器人与AI数字孪生技术,在不影响日常运营的前提下实现实时库存盘点,大幅缩短盘点周期,释放人力专注于差异处理与流程优化。双方计划将合作扩展至更多仓库设施,持续推动仓储运营智能化升级。
谷歌在I/O开发者大会上宣布对Workspace进行全面升级,推出多项AI新功能。Gmail新增Live语音助手,可快速检索邮件信息;Docs Live支持语音协作头脑风暴,并可调取Drive、Gmail等内容辅助写作;Keep引入对话式便签功能,由Gemini 3.5 Flash驱动,将碎片想法整理成结构化笔记。此外,全新图像编辑应用Google Pics支持精准对象分割与文字编辑。个人智能代理Gemini Spark也将优先向Workspace用户推出。
谷歌正式发布Gemini Spark,这是一款基于Gemini 3.5 Flash模型打造的全天候个人AI助手,深度集成Gmail、Docs、Slides等产品生态。Spark可在后台持续运行,帮助用户整理收件箱、监控信用卡账单、汇总会议记录,并生成每日简报。同时支持MCP协议接入Canva、OpenTable等第三方平台,未来还将扩展自定义子代理与本地浏览器操作等功能。
谷歌在I/O大会上发布Gemini 3.5 Flash模型,并宣布其正式向多款产品推送。该模型每秒可输出近300个令牌,性能媲美上一代Pro级大模型。谷歌同步推出首个专属AI智能代理Gemini Spark,支持跨设备全天候运行,可调取Gmail、Drive等数据自动完成任务。此外,谷歌还发布了Gemini Omni Flash,定位为真正的多模态统一模型,目前主要应用于视频生成,未来计划扩展至图像、音频等多种输出形式。
谷歌的AI内容水印技术SynthID自发布三年来,已为1000亿张图片和视频及相当于6万年时长的音频添加标记。如今,OpenAI将在GPT-2图像中使用SynthID,英伟达将其集成至Cosmos模型,Kakao和ElevenLabs也加入合作。谷歌同步推进C2PA标准,并计划将SynthID检测功能整合至Circle to Search、Lens及AI模式,还将推出面向企业合作伙伴的AI内容检测API。
谷歌与非营利机构FutureHouse近日在《自然》杂志上分别发表论文,介绍各自研发的AI科研辅助系统。谷歌的Co-Scientist基于Gemini模型,采用"科学家在环"机制,辅助研究人员筛选白血病潜在治疗药物;FutureHouse的Robin系统则能在30分钟内分析551篇论文,并通过Finch工具自动处理部分生物实验数据,成功为黄斑变性找到候选药物。两款系统均旨在应对科研文献爆炸性增长的挑战,而非取代科学家。
全球风险与理赔管理公司Sedgwick将AI工具整合至旗下遗留系统,以处理海量案例文档。该公司于2023年推出"Sidekick+"平台,基于OpenAI GPT-4技术,帮助理赔员快速摘要与分析文档,并新增智能代理功能。系统通过已有的服务与API架构实现无缝集成,同时在数据安全、防止幻觉及可追溯性方面设有严格防护机制,确保决策全程有人工参与,文档摘要准确率高达98%至99%。
谷歌宣布对AI Studio进行重大升级,用户现在可以通过自然语言提示创建原生Android应用,并借助内置模拟器实时预览,还可连接真实设备进行安装测试。初始版本聚焦于习惯追踪、学习测验等实用工具类应用,以及调用摄像头、GPS的硬件功能类应用和基于Gemini API的AI应用。若需上架Google Play,仍须符合平台既有审核标准。
谷歌在Google I/O大会上发布"通用购物车"功能,支持跨零售商(包括Sephora、Target、Walmart等)和谷歌旗下产品(如Gemini、YouTube、Gmail)统一管理购物需求。该购物车基于Gemini运行,可追踪价格、提醒补货、识别商品兼容性问题,并通过Google Pay整合忠诚度计划与支付方式。此外,谷歌还推出AI购物代理,可在满足用户设定条件时自动完成购买,但消费者信任度仍是最大挑战。
Gartner调研逾1.2万名企业员工后发现,缺乏完善AI人才战略的企业,到2027年将有半数面临核心AI人才被竞争对手挖走的风险。报告指出,AI生产力提升并未惠及企业各层级,近四分之三的高效AI用户集中在管理层。Gartner建议CIO与CHRO协作审计AI战略,HR应深度参与AI治理。员工对自身角色的信心与透明沟通,是推动AI正向落地的关键驱动力。
谷歌在I/O大会上宣布,Gemini AI助手将能够调用沃尔沃即将推出的EX60 SUV的外置摄像头,帮助车主理解周围环境。首个应用场景是解读复杂的停车标志,告知车主可停车时长、是否需要特定许可证等信息。未来还可识别路标、车道标线及周边地标。该功能基于高通骁龙芯片及谷歌Android Automotive系统实现。此外,沃尔沃也将率先获得谷歌地图全新沉浸式导航功能。
谷歌在2026年I/O大会上发布多项AI新功能,包括全天候运行的AI助手Gemini Spark和每日简报Daily Brief,均深度整合Gmail、日历、云端硬盘等个人数据。谷歌通过简单的选择加入机制,将跨平台个人数据转化为AI竞争优势。Gemini Spark还计划接入用户本地Mac文件及Canva、Spotify等第三方服务。这一切的核心问题在于:用户是否愿意将私人数据托付给AI系统,以及个人隐私边界究竟在哪里。