在Chiplet架构中,芯片设计者可通过选择性替换计算、内存或I/O芯粒来获得技术升级,同时保持其他芯粒稳定,从而节省时间与成本。常见策略包括:保持I/O芯粒不变,将计算芯粒从5nm升级至3nm以提升性能;或替换内存芯粒从LPDDR5X升至LPDDR6。由于互连标准演进速度加快,I/O芯粒的替换也日益普遍。具体选择取决于应用场景、成本及产品灵活性需求。
随着芯片设计日趋复杂,片上可观测性(即裸片内可见性)正成为保障高性能系统性能、可靠性与安全性的关键手段。来自Arteris、Cadence、Synopsys等多家半导体企业的技术专家围绕这一议题展开深度讨论,涵盖Chiplet架构带来的可视化挑战、汽车与航空航天领域的实际应用案例,以及异构集成系统中跨芯片监控的复杂性,探讨了如何实现从单颗芯片到完整系统的全链路可观测能力。
奢华手机品牌Vertu发布折叠屏新机Alphafold,搭载基于开源项目构建的Hermes AI智能体,可连接ERP、CRM等企业系统,支持审批、排期、销售追踪等工作流自动化。机身提供小牛皮、鳄鱼皮、18K金及天然钻石等多种定制版本,最高售价达46800美元。设备搭载骁龙8 Gen 4芯片、专有A5安全芯片及6500mAh电池,支持GPT、Claude、Gemini等多款AI模型调用,首批115台本周起向美国等主要市场发货。
SAP在Sapphire 2026大会上推出全新托管版Joule Studio,为用户提供开箱即用的AI智能体构建与部署环境,无需手动配置。新版本新增Cursor、Claude Code等编码工具支持,引入AutoGen和LlamaIndex代理框架,并实现Agent2Agent协议双向互通。SAP还发布了面向S/4HANA和Ariba的领域专属基础模型SAP Domain Models,并为所有客户提供12个月免费设计访问权限,正式版计划于2026年第三季度上线。
在红帽峰会上,Red Hat宣布推出专属AI技能仓库及订阅感知技能包,将20余年的RHEL支持知识、CVE数据、产品生命周期等信息封装为可复用的智能体技能模块。这一举措旨在将AI从对话助手升级为能够自主感知、决策并执行端到端工作流的企业级"超级用户"。依托RHEL、OpenShift和Ansible构建的技术栈,Red Hat正将现有基础设施工具重塑为明日的智能体运行平台。
GitLab正围绕"AI智能体时代"全面重构其平台战略。CEO Bill Staples援引"杰文斯悖论"——即效率提升反而推动总需求增长——认为AI降低软件生产成本后,软件需求将爆发式扩大。为此,GitLab正推进平台API化重构、智能体编排系统开发,并裁员调整组织架构。公司认为其真正优势在于多年积累的企业上下文数据,而非单纯的代码生成能力。
OpenAI宣布将Codex扩展至iOS和Android版ChatGPT应用,此前该功能仅限桌面端、CLI工具及网页端使用。移动端通过安全中继层连接本地或远程运行Codex的设备,实时同步桌面环境状态,继承桌面端全部功能与安全策略。Codex目前每周活跃用户超400万,本次更新面向免费及Go计划用户开放,暂仅支持macOS连接,Windows支持即将推出。此外,新增远程SSH企业环境接入、程序化访问令牌及HIPAA合规支持等功能。
Pulumi CEO乔·达菲表示,一年前几乎无人将"智能体AI"与"基础设施"联系在一起,而如今AI智能体已驱动其平台20%的运营操作。本次Pulumi发布多项专为"智能体基础设施时代"打造的功能,包括支持智能体自助注册的临时云账户、简化CLI调用的npm包、单资源快速创建命令,以及与Atlassian、Datadog等平台的集成目录。其自研基础设施智能体Neo已帮助客户在一小时内完成500个Terraform工作区迁移。
SAP在2026年Sapphire大会上正式推出AI Agent Hub,通过Joule Studio向更多客户开放。该平台作为厂商无关的统一管控中心,可自动发现并管理来自微软、Salesforce、Anthropic、OpenAI及SAP自身等各厂商的AI智能体、大语言模型和MCP服务器。核心功能包括智能体注册表(已正式上线)、治理工作流、身份访问控制及AI可观测性(后两项计划于2026年第三季度上线),旨在解决企业面临的智能体蔓延与缺乏统一审计追踪的难题。
新加坡电信运营商星和(StarHub)正在开发一项全球首创的基于SIM卡的AI治理服务,计划于今年年中启动试验。该服务通过为用户设备上运行的每个AI代理分配唯一实时身份标识,实时监控其通信行为与数据共享情况,并在AI代理出现恶意行为时即时切断连接。除消费端外,该方案还面向自动驾驶、手术机器人、工业制造等关键基础设施场景,并计划推出"AI信任套餐",为数据泄露事件提供保险保障。
Gemini应用近期推出多项更新:新增"Flare"和"Glow"两种语音选项,替代原有的Nova和Lyra;语音选择界面由轮播改为列表形式,并移除了语音描述文字。与此同时,安卓小组件图标全面焕新,采用Neural Expressive风格的细线条设计,涵盖麦克风、摄像头、相册等多个功能图标。此次更新通过服务端推送,适用于最新版本Gemini应用。
非营利研究机构Biohub发布了一款AI驱动的蛋白质生物学"世界模型",可用于预测、设计和发现新疗法。该模型基于68亿种蛋白质图谱,支持蛋白质结构预测与分子设计,可将新型蛋白质结合物的发现周期从数月压缩至数天甚至数小时。目前,该工具已向全球研究人员免费开放,并已在癌症和免疫学领域五个重要靶点上实现36%至88%的命中率。
TeraWulf位于安大略湖畔的Lake Mariner数据中心园区,占地180英亩,建于原煤电厂旧址之上,总面积约12万平方米,规划容量750MW,将部署约10万块GPU。该园区拥有两条独立的345kV电网接入,是选址的核心优势。项目每兆瓦资本支出高达1000万美元,采用直接液冷技术应对极高的GPU热密度,并配备175台大型冷凝装置。1600名工人两班倒、全天候施工,建设强度被现场高管形容为达到"中国水准"。
随着AI工厂大规模建设,GPU对电力和冷却的需求正推动直接液冷成为行业标配。AI集群对电网造成前所未有的压力,互联周期从两年延长至七至十年。为应对缺口,业界转向天然气涡轮和小型模块化核反应堆,但碳排放隐患不容忽视。与此同时,直接液冷采用闭环系统,几乎无需持续用水,并推动行业效率指标从传统PUE转向"每瓦算力Token产出",成为未来竞争的核心衡量标准。
本文记录了作者从纽约布法罗出发,前往位于安大略湖畔、装机容量达750兆瓦的TeraWulf人工智能数据中心的实地探访经历。这片土地曾是20世纪重工业的核心地带,如今废弃的发电站旁,五栋新建筑的钢铁骨架正在拔地而起。1600名工人轮班作业,铺设长达350英里的重型电缆,建设密集的液冷管道系统,将这片工业遗址改造为服务于GPU芯片冷却的现代AI算力工厂。
AI工作负载对GPU的散热需求已超越传统风冷极限,液冷技术正成为数据中心强制标准。单颗GPU功耗突破700W后,直接液冷不再是可选项。与此同时,800V直流配电架构正取代传统低压交流方案。这一变革使企业自建本地数据中心的成本与复杂度急剧攀升。对于CIO而言,大规模模型训练宜外包至超大规模云服务商,而本地推理场景可通过模块化液冷方案实现,混合部署或将成为企业AI基础设施的主流路径。
AI基础设施初创公司Tensormesh完成2000万美元融资,投资方包括英伟达、AMD和CoreWeave及多家风投机构,累计融资额达2450万美元。该公司通过KV缓存技术,将大语言模型处理提示词时产生的中间数据存储复用,避免GPU重复计算,可将推理延迟和算力成本降低10倍。其旗舰SaaS产品Tensormesh Inference已正式发布,支持无服务器API、专用GPU及企业定制化部署,部分用户缓存命中率已超70%。
Unravel Data Systems发布Arvix AI,这是一款嵌入其平台的智能代理系统,可自动分析工作负载、重写代码、优化基础设施配置,并在部署前验证变更。该系统支持Databricks、Snowflake和BigQuery三大主流数据平台,帮助企业降低云数据与AI基础设施成本。与传统推荐引擎不同,Arvix AI具备自主优化能力,无需人工介入即可持续发现并修复问题,且已包含在现有平台中,无需额外付费。
在纽约布法罗郊外一座退役煤电厂的旧址上,TeraWulf正在打造名为"Lake Mariner"的AI计算园区。该园区占地约180英亩,目前已建成四座数据中心机房,总容量达500MW,计划扩展至750MW。园区采用液冷技术与模块化供电架构,部署了英伟达芯片、施耐德电气硬件及Motivair冷却系统,并主要依托尼亚加拉水电,实现约90%的零碳电力供应。
YouTube宣布对AI内容标签系统进行重大升级:将AI披露标签移至更显眼的位置——长视频中标签将显示在播放器正下方,Shorts中则以悬浮覆盖层形式呈现。此外,平台将于本月推出新的内部检测机制,自动识别并标注未经创作者主动申报的写实AI生成视频。若内容使用了YouTube自有AI工具或含有C2PA元数据,相关标签将永久保留。此次更新不影响创作者的变现资格或推荐算法。