Salesforce正从部署大型语言模型转向开发专业化、高效且可信的AI智能体,以解决特定商业挑战。该公司首席科学家表示,AI的真正价值不在于底层模型,而在于构建其上的智能体能力。Salesforce将智能体分解为记忆、推理大脑、用户界面和功能调用四个关键组件,并开发了大型动作模型来提升API调用准确性。公司还推出企业通用智能概念,专注于商业关键领域的智能体能力突破。
MemVerge发布开源MemMachine软件项目,为大语言模型和AI智能体提供跨平台长上下文记忆层。该软件虚拟化DRAM,结合服务器CPU内存与外部存储层,支持情景记忆、语义记忆、程序记忆和档案记忆四种模式。在LoCoMo长上下文记忆测试中,MemMachine准确率达85%,领先于ChatGPT等竞品,旨在将AI助手从一次性聊天机器人转变为可信赖的上下文感知协作伙伴。
当前世界充满变数,IT领域除AI外鲜少受到关注。从气候变化到地缘政治紧张局势,IT在公众讨论中边缘化。这在技术变革关键时刻十分危险。CEO、高管和媒体对IT缺乏深度思考,普遍持"不坏就别谈"的态度。CIO需要重新获得利益相关者关注,克服对IT运营的冷漠和无知。技术文盲问题严重,大多数人从未构建过IT系统。IT行业需要重新赢得人心,大幅提升公众IT知识水平。
技术驱动的变革比以往更加频繁,但成功并不能得到保证。Gartner研究显示,只有五分之一的组织能够在75%或更多时间内从转型项目中获得预期收益。其余都是昂贵的失败。有效的变革管理能够提高技术采用率,服务于业务目标。变革管理不再是边缘活动或软技能,而是决定新举措是否能够创造商业价值的核心绩效学科。
Google Photos正向美国Android用户推出会话式编辑功能,用户可通过语音或文字提示来编辑照片,而无需手动操作。该功能首先在Pixel 10手机上推出,现已扩展到更多设备。用户需将Google账户设置为英文,并开启人脸分组和位置估算功能。通过点击"帮我编辑"按钮,用户可直接说出编辑需求,如去除背景中的陌生人、调亮颜色或消除眩光。该功能使用先进的Gemini技术,并提供原图与编辑后照片的对比显示。
本文深入分析了斯坦福大学AI安全中心举办的研讨会所展示的AI安全领域最新进展。文章探讨了AI安全的两个重要方向:构建更安全的AI和让AI变得更安全,强调这两种方法需要有机结合。通过分析物理AI(如人形机器人)与生成式AI结合的安全挑战,以及可达性分析在AI安全中的应用,展现了当前AI安全研究的前沿技术和实际应用场景。
谷歌搜索宣布向西班牙语用户推出AI模式功能,这是其AI驱动的搜索体验。该功能允许用户使用自然语言查询提问、进行对话交流、上传图片和深入探讨复杂话题。此次西班牙语版本推出是继8月份谷歌将AI模式扩展到全球180个国家之后的又一重要举措。谷歌正在快速推广AI技术,同时还为Android用户带来对话式照片编辑功能,并将更实惠的Google AI Plus订阅计划扩展到40个国家。
许多企业停留在AI试点阶段,无法实现企业级转型。成功扩展AI需要从孤立项目转向集成平台建设。关键在于掌握五大核心要素:建立统一数据治理平台、实现系统互操作性、构建MLOps自动化流水线、采用微服务架构设计,以及建立AI治理体系和跨职能协作团队。成功的AI策略20%依赖算法,80%依赖基础建设。
微软推出突破性的微流控冷却技术,可将GPU芯片最高温度降低65%,效果比传统冷板冷却技术高出三倍。该技术在硅芯片上直接蚀刻微小液体通道,模仿叶脉结构实现高效散热。微软计划将此技术集成到未来自研芯片中,有望显著降低数据中心运营成本并提升能效。此外,微软还扩展了中空光纤产品,相比传统单模光纤可提供47%更快的数据传输速度和33%更低的延迟。
谷歌开发工具项目经理Ryan Salva分享了AI工具如何改变编程方式的见解。他负责Gemini CLI和Gemini Code Assist等工具,引导开发者进入代理编程新时代。最新研究显示,开发者开始使用AI工具的中位时间是2024年4月,恰好对应推理模型的兴起。Salva认为工具调用能力是关键突破,让模型能够自我纠错。他预测未来开发者将更像架构师,专注于将复杂问题分解为可解决的任务。
数据管理公司Komprise正式发布智能AI摄取产品,作为其智能数据工作流摄取引擎的组成部分。该工具旨在解决非结构化数据混乱问题,通过过滤器消除低质量和敏感数据,具备敏感数据分类功能和内置个人身份信息处理能力。基准测试显示其摄取性能比AWS DataSync高出一倍,可自动维护审计跟踪,支持数据治理和合规报告,有效提升AI系统的数据质量和处理效率。
随着智能AI代理技术的发展,IT运维专业人员可以通过自然语言而非传统工具来执行日常管理任务。本文介绍了六个关键的模型上下文协议服务器,包括文件系统操作、MySQL数据库管理、数据备份管理、SSH远程登录管理、Prometheus监控以及服务台管理等应用场景,展示了如何利用这些工具简化IT运维流程,提高工作效率。
无论是开发AI游戏引擎、营销推荐系统还是个人导师,AI项目实施都面临诸多挑战。大型创新项目成本高昂,决策者倾向于规避风险;数据隐私和算法偏见带来法律风险;界面设计需要平衡用户控制与AI自主性;获得组织内部支持困难,许多人对AI缺乏信任;竞争环境下各方缺乏协作。尽管存在这些障碍,LLM等AI工具仍具有巨大变革潜力,值得持续探索。
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
谷歌DeepMind发布第三版前沿安全框架,加强对强大AI系统的监管。新版本重点关注操控能力,并扩展安全审查以覆盖模型抵抗人类关机或控制的场景。框架新增有害操控关键能力级别,解决先进模型可能大规模影响人类信念和行为的问题。更新还加强了对错位和控制挑战的审查,要求在模型达到特定阈值时进行安全案例评估,确保在发布前充分识别和缓解潜在风险。
新墨西哥州多纳安娜县委员会以4-1票数通过了一项1650亿美元的工业收入债券方案,为大型AI数据中心项目提供税收优惠。该项目由奥斯汀BorderPlex Digital Assets公司和蓝枭资本旗下STACK Infrastructure合作开发,将在美墨边境附近建设四个数据中心及相关能源设施。项目采用自筹资金模式,预计创造2500个建筑岗位和750个永久职位,年底前可能开工建设。
人工智能驱动的AI工厂正成为数据中心新蓝图,将计算、互连和软件整合为优化的生产系统。硬件软件栈围绕CPU-GPU融合设计、高带宽结构重构。英伟达与英特尔的合作重新定义数据中心主板架构,将CUDA深度整合到企业栈中,巩固了英伟达的市场地位。这一联盟为英伟达带来巨大优势,Intel获得AI开发者关注,而AMD需要完善GPU软件策略。CUDA正快速成为行业标准,企业将推动符合其约束条件的AI工厂建设。
OpenAI与英伟达宣布战略合作,计划部署至少10千兆瓦的英伟达系统用于AI基础设施建设,英伟达将投资高达1000亿美元。该项目耗电量相当于10座核反应堆的发电量,需要400-500万个GPU,远超现有数据中心规模。首个千兆瓦系统将于2026年下半年上线。这一雄心勃勃的计划将显著增加全球能源消耗,面临电网连接瓶颈等实际挑战。