Perplexity本周发布的Comet AI浏览器标志着智能代理应用时代的到来。该浏览器采用AI原生设计,配备能够理解网页内容的AI助手,可在侧边栏中实时回答用户问题。OpenAI随即宣布将推出自己的AI浏览器,验证了这一趋势。智能代理应用不同于传统的AI功能增强产品,而是围绕AI能力重新构建整个工作流程。企业需要从SEO转向AEO优化,为AI发现做好准备。
检索增强生成(RAG)正成为AI领域的关键技术,通过结合外部信息检索与大语言模型的生成能力,解决传统模型仅依赖训练数据的局限性。RAG允许模型实时访问外部数据库或文档,提供更准确、更新的信息。该技术可应用于企业文档查询、个人化AI助手等场景,通过向模型提供特定领域知识来获得精准结果。微软专家指出,RAG有助于结合知识与推理、提高模型使用效率,并支持多模态应用。
来自上海交通大学和浙江大学等机构的研究团队开发出首个AI"记忆操作系统"MemOS,解决了AI系统无法实现人类般持久记忆和学习的根本限制。该系统将记忆视为核心计算资源进行调度、共享和演化,在时间推理任务中相比OpenAI记忆系统性能提升159%。MemOS采用三层架构设计,通过标准化记忆单元实现跨平台记忆迁移,有望改变企业AI部署模式。
存储行业近期动态频繁,Arctera、Wasabi和TD SYNNEX联合推出渠道专属数据保护解决方案;AWS启用EC2环境SAN启动功能;Broadcom发布VMware Cloud Foundation 9.0版本;Commvault与Kyndryl合作提升网络弹性服务;CTERA成为首家支持模型上下文协议的混合云存储供应商;多家企业获得新一轮融资,推动AI基础设施和数据管理技术发展。
文章阐述了数据中心由传统向多样化转型,着重介绍了Intel Xeon 6 CPU采用P核与E核双架构,在AI、高性能计算及云边端场景中实现高效节能的创新应用。
本文介绍了 Sakana 针对语言模型提出的全新 CTM 架构,通过内部短时记忆和自适应运算,令模型推理更接近人类思考方式。
Salesforce正通过构建完整的AI全栈体系,将SaaS升级为服务即软件,全面整合智能、记录与交互系统,实现企业生产效率大幅提升。
Nvidia 推出基于 BlueField 处理单元的 DOCA Argus 框架,实现对 AI 工作负载的无代理实时威胁检测,并与 Cisco 合作,为 AI 基础设施提供全方位安全防护。
Ocient成功融资4210万美元,加速研发基于NVMe SSD与计算近接存储架构的绿色、低成本大数据与 AI 分析解决方案。