人工智能 关键字列表
Liqid发布支持CXL 2.0内存池的可组合GPU服务器

Liqid发布支持CXL 2.0内存池的可组合GPU服务器

Liqid发布了新产品,支持主机服务器应用程序访问由GPU、内存和存储池构建的动态编排GPU服务器系统,专注于AI推理和代理应用。该公司从PCIe Gen 4架构升级至PCIe 5,支持CXL 2.0内存池化。新产品包括Matrix软件、可组合GPU服务器、可组合内存和I/O加速器等。系统提供两种配置:UltraStack可为单台服务器提供最多30个GPU和100TB DRAM;SmartStack可在最多20个服务器节点间池化30个GPU。

Uber携手Lucid和Nuro部署2万辆自动驾驶出租车

Uber携手Lucid和Nuro部署2万辆自动驾驶出租车

Uber宣布与Lucid和Nuro合作部署至少2万辆自动驾驶出租车。Lucid负责制造基于Gravity电动SUV的改装车辆,Nuro提供自动驾驶软件。车辆搭载英伟达DRIVE Thor芯片的Nuro Driver模块,具备L4级自动驾驶能力。该服务将于2026年底在美国单一城市启动,随后6年内部署超过2万辆车辆。

Mistral的Le Chat聊天机器人推出"深度研究"模式,生产力大幅提升

Mistral的Le Chat聊天机器人推出"深度研究"模式,生产力大幅提升

法国AI实验室Mistral为其Le Chat聊天机器人推出多项新功能,包括"深度研究"模式、原生多语言推理和高级图像编辑功能。深度研究模式将Le Chat转变为协调研究助手,能够规划、澄清需求、搜索和综合数据。该功能面向消费者和企业用户,可进行详尽的旅行规划分析和企业研究。Mistral专注于将Le Chat集成到企业生态系统中,支持本地数据连接,无需上传至云端。新增的项目功能帮助用户组织聊天、文档和想法,多语言推理现已支持法语、西班牙语、日语等。

AWS为S3新增向量存储桶以降低RAG存储成本

AWS为S3新增向量存储桶以降低RAG存储成本

AWS为S3对象存储新增向量存储桶功能,旨在降低Amazon OpenSearch Service中低频访问向量的存储成本。该功能专为向量数据存储设计,可将上传、存储和查询向量的总成本降低90%。新的向量存储桶提供专用API,无需预配置基础设施即可存储和查询向量数据。每个存储桶最多支持10000个向量索引,每个索引可容纳数千万个向量。该功能已与Amazon Bedrock Knowledge Bases集成,支持构建RAG应用程序,并可与OpenSearch Service协同工作以优化成本。

谷歌计划重塑安卓与ChromeOS:双平台融合之路

谷歌计划重塑安卓与ChromeOS:双平台融合之路

谷歌澄清ChromeOS不会完全转变为Android,而是基于Android底层技术构建ChromeOS体验,实现更高性能和更好的设备协同。新的统一代码库将减少开发工作量,简化AI功能访问,同时保持ChromeOS的安全性和管理能力。这一变化可能影响入门级Chromebook的硬件要求,但将为两个平台带来显著优势,包括更好的Android应用兼容性和多用户支持。

Hammerspace推动开放闪存平台重新思考AI数据存储

Hammerspace推动开放闪存平台重新思考AI数据存储

开放闪存平台(OFP)旨在用直接访问的闪存盒替代全闪存阵列,每个闪存盒配备控制器DPU、Linux系统和并行NFS软件。该倡议由Hammerspace主导,针对新云、超大规模和AI公司在数据中心设计演进中面临的基础设施限制。OFP通过结合IPU/DPU技术、闪存优化机箱和Linux协议,提供高密度、低功耗的存储解决方案,满足AI应用从PB级向EB级数据容量需求的扩展。

当今十大最具影响力的ERP厂商

当今十大最具影响力的ERP厂商

ERP系统市场近年来相对稳定,但AI正在改变一切。供应商们正竞相在产品组合中嵌入AI功能,构建包括可组合应用、集中数据存储和可扩展云平台的生态系统。Oracle凭借AI投资超越SAP成为ERP收入领导者,而AI代理已从实验阶段进入实际应用,能够管理整个工作流程并进行自动化决策。本文盘点了Oracle、SAP、微软等十大最具影响力的ERP厂商及其AI战略。

Google和McKinsey发布AI心理健康指南,推动治疗任务分担模式

Google和McKinsey发布AI心理健康指南,推动治疗任务分担模式

面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。

研究人员发布新算法,无损提升AI性能高达2.8倍

研究人员发布新算法,无损提升AI性能高达2.8倍

以色列魏茨曼科学研究所、英特尔实验室和d-Matrix研究人员开发出新算法,能显著降低大语言模型服务成本。该算法基于投机解码技术,无需专门的草稿模型即可将令牌生成速度提升2.8倍。研究提出三种方法:令牌级交集、字符串级精确匹配和字符串级拒绝采样,解决了不同模型词汇表匹配问题。算法已集成到Hugging Face框架中,开发者仅需一行代码即可使用。

AWS推出Bedrock AgentCore平台助力企业构建AI智能体

AWS推出Bedrock AgentCore平台助力企业构建AI智能体

AWS在纽约峰会上发布Amazon Bedrock AgentCore,这是一个企业级AI代理构建、部署和运营平台。该平台支持开源框架如CrewAI、LangChain等,提供运行时、内存、身份管理、可观测性等核心服务。Box、巴西伊塔乌银行等企业已开始使用该平台构建生产级应用。平台采用按需付费模式,目前在部分AWS区域提供预览版,2025年9月16日前免费试用。

Uber与百度合作推出数千辆自动驾驶出租车

Uber与百度合作推出数千辆自动驾驶出租车

网约车巨头Uber宣布与中国科技公司百度达成多年战略合作,计划在美国和中国以外地区推出数千辆自动驾驶出租车。服务将从今年晚些时候开始,首先在亚洲和中东的未指定国家推出。百度的Apollo自动驾驶汽车已在中国11个城市运营,成本仅为3.7万美元,远低于行业平均的20万美元。用户可选择乘坐自动驾驶车辆或人工驾驶车辆。

构建基于偏好和技术转换的变革

构建基于偏好和技术转换的变革

科技专家Sungjoo Yoon在TED演讲中提出"偏好原理",认为了解用户喜好信息越多,就能创造更强大的技术。他将市场变化比作"地壳运动",从1969年命令行界面到80年代GUI,再到90年代网络界面,技术发展都遵循这一规律。自然语言处理能建立信任,而AI智能体时代的到来意味着非人类参与者将在人类主导的世界中发挥作用。

微软Copilot Vision AI可全屏扫描识别内容

微软Copilot Vision AI可全屏扫描识别内容

微软推出了Copilot Vision AI新功能,该技术能够扫描和分析用户屏幕上的所有内容。这项AI视觉技术可以实时理解用户正在查看的信息,包括文本、图像和应用程序界面,为用户提供更加智能化的交互体验和个性化建议。此功能的推出标志着AI助手向更深层次的用户体验集成迈进。

马斯克的xAI与沙特Humain就数据中心交易进行洽谈

马斯克的xAI与沙特Humain就数据中心交易进行洽谈

马斯克旗下AI初创公司xAI正与沙特方面就租赁数据中心容量进行谈判,寻求在能源成本低廉地区扩展基础设施。谈判涉及两个潜在合作伙伴:沙特支持的AI公司Humain提供数千兆瓦容量方案,以及另一家正建设200兆瓦设施的公司。后者更具短期可行性。这些数据中心将为xAI的计算密集型AI模型提供算力支持。

谷歌将AI技术引入核反应堆业务

谷歌将AI技术引入核反应堆业务

谷歌与西屋电气公司合作,将生成式AI模型应用于核反应堆建设和运营优化。双方计划结合西屋的HiVE GenAI系统和bertha大语言模型与谷歌云技术,简化新核电站建设并提升现有反应堆性能。西屋声称其核能AI技术基于75年专有数据训练。此举旨在满足美国电网日益增长的能源需求,特别是AI数据中心快速增长带来的电力消耗。

Google为Discover功能新增AI生成摘要

Google为Discover功能新增AI生成摘要

谷歌正在其个性化内容流Discover中引入AI生成摘要功能,该功能已在美国的Android和iOS用户中开始推广。摘要卡片会显示新闻网站标志和AI生成的内容片段,用户可点击查看更多相关文章。谷歌声称此举能帮助用户更好地选择想要访问的页面,但出版商担心这会进一步减少点击流量。据估计,包含AI概览的搜索结果中有64%最终没有产生点击。该功能首先专注于体育和娱乐等热门生活方式话题。

联合健康集团首席数字官:速度是最大的知识产权

联合健康集团首席数字官:速度是最大的知识产权

联合健康集团首席数字与技术官Sandeep Dadlani正领导着医疗行业最雄心勃勃的数字化转型之一。作为年收入近3000亿美元的巨头企业,该公司通过United AI Studio平台大规模部署AI解决方案,每年处理1亿通客服电话。Dadlani强调"速度是最大的知识产权",通过数字优先策略服务5500万用户,利用AI技术帮助临床医生专注于护理而非行政工作,推动医疗系统效率提升。

Index Engines获得AI持续训练对抗网络威胁专利

Index Engines获得AI持续训练对抗网络威胁专利

Index Engines获得一项新专利,可对AI/ML模型进行针对真实攻击模式的持续训练。该公司的CyberSense产品利用AI和机器学习分析检测非结构化数据内容随时间的变化,以识别可疑行为和勒索软件相关损坏。其研发实验室开发了软件,在受控洁净室环境中自动摄取和行为分析勒索软件变体,训练AI模型应对真实攻击模式。企业战略集团验证该方法检测勒索软件损坏的有效率达99.99%。

Claude Code营收暴涨5.5倍,Anthropic推出分析仪表板

Claude Code营收暴涨5.5倍,Anthropic推出分析仪表板

Anthropic为其Claude Code AI编程助手推出综合分析仪表板,帮助企业技术领导者了解AI编码工具投资回报。新仪表板提供详细指标,包括代码接受率、用户活动、支出数据等。自5月推出Claude 4模型以来,Claude Code活跃用户增长300%,收入增长超过5.5倍。客户包括Figma、Rakuten等知名科技公司。该工具定位为高端企业解决方案,具备"智能体"能力,能理解整个代码库并进行协调性修改。

智能体AI时代来临,数据中心面临哪些变革

智能体AI时代来临,数据中心面临哪些变革

代理式AI是继生成式AI后的新兴技术趋势,通过软件"代理"自动化复杂任务执行。与生成内容的生成式AI不同,代理式AI专注于执行操作。该技术将在两个方面影响数据中心:首先,随着48%的技术领导者已在使用代理式AI,这将增加LLM推理需求,进一步推动数据中心容量需求;其次,AI代理可能革新数据中心管理,自动化工作负载重新部署、性能优化和网络流量路由等任务,提升运营效率。