深度学习 关键字列表
英伟达 GTC 2025 主题演讲:AI 性能提升 40 倍、开源"Dynamo"和星球大战风格的会走路机器人"Blue"

英伟达 GTC 2025 主题演讲:AI 性能提升 40 倍、开源"Dynamo"和星球大战风格的会走路机器人"Blue"

Nvidia CEO黄仁勋在GTC 2025大会上发表重要演讲,展示了公司在AI计算、推理能力和机器人技术等领域的最新进展。重点包括Blackwell平台性能提升40倍、开源AI工厂操作系统Dynamo、Rubin架构路线图、开源人形机器人模型Groot N1,以及与通用汽车在自动驾驶领域的合作。这些举措显示了Nvidia从GPU制造商向全方位AI基础设施公司的战略转型。

人工智能助力 Visa: 如何通过 RAG 即服务和深度学习提升安全性并加快数据检索速度

人工智能助力 Visa: 如何通过 RAG 即服务和深度学习提升安全性并加快数据检索速度

全球支付巨头 Visa 正在利用人工智能技术提升其业务运营。通过部署检索增强生成 (RAG) 系统,Visa 大幅提高了信息检索速度和准确性。同时,Visa 还开发了安全的内部 AI 模型,并利用深度学习来加强欺诈防范。这些 AI 应用都建立在 Visa 精心构建的多层技术架构之上,旨在平衡创新与风险管理。

AI 语音克隆对企业构成多大威胁?

AI 语音克隆对企业构成多大威胁?

AI 语音克隆技术的滥用正日益成为企业面临的重大安全威胁。近期多起高调事件显示,不法分子利用 AI 生成的虚假音频视频进行诈骗。目前许多语音克隆应用缺乏有效防护措施,企业领导人的公开音频很容易被用于克隆。专家呼吁采取多因素认证等措施加强防范,并预计未来将出台更多监管措施和检测技术来应对这一威胁。

Google 的 Gemini AI 现在能够查看你的搜索历史

Google 的 Gemini AI 现在能够查看你的搜索历史

Google 推出了 Gemini 2.0 模型的一系列改进,包括为免费用户开放高级功能。用户可以使用改进的深度研究功能获取详细信息,新的推理模型还能分析搜索历史以更好地了解用户。Google 强调这些功能需要用户选择加入,并可随时禁用。此外,Google 还为免费账户推出了 Gems 功能,允许用户创建自定义聊天机器人。

Google 的 Gemini 深入研究功能现已向所有用户开放

Google 的 Gemini 深入研究功能现已向所有用户开放

Google 宣布其 Gemini AI 的深度研究功能现已向所有用户免费开放,支持 45 种以上语言。该功能可生成复杂主题的综合报告。Google 还推出了基于个人化的实验性功能,可根据用户的 Google 应用和服务使用情况来定制回应。这些升级旨在提升 Gemini 的研究能力和个性化体验。

新技术帮助大语言模型控制思维链长度,在不增加计算成本的情况下优化推理能力

新技术帮助大语言模型控制思维链长度,在不增加计算成本的情况下优化推理能力

研究人员提出了一种名为长度控制策略优化(LCPO)的训练技术,可以让开发者更好地控制大语言模型的思维链长度。这种方法通过在训练过程中引入长度约束,使模型能够在保持准确性的同时生成更简洁的推理过程。实验表明,采用LCPO训练的模型在准确性和成本之间提供了平滑的权衡,并且在相同推理长度下可以超越更大的模型。这项技术有望大幅降低企业应用中推理的成本。

超越 ChatGPT:通往通用人工智能的 5 大挑战

超越 ChatGPT:通往通用人工智能的 5 大挑战

人工通用智能(AGI)是AI发展的终极目标,但实现这一目标面临诸多挑战。本文探讨了实现AGI的五大关键障碍:常识与直觉的缺乏、学习迁移能力不足、物理与数字世界的鸿沟、可扩展性难题,以及社会信任问题。克服这些挑战需要突破性技术进展、大规模投资和广泛的社会变革。

AI 泡沫论:事情没那么简单

AI 泡沫论:事情没那么简单

人工智能领域投资热潮与互联网泡沫有相似之处,但也存在不同。科技巨头大举投资AI,投资者面临重大抉择。有人认为这是新时代的开端,也有人警告可能是泡沫。专家意见不一,有人看好AI前景,也有人对高估值和风险表示担忧。关键在于AI能否带来实质性变革,以及哪些公司能在这场变革中生存下来。

OpenAI 发布 Responses API 和开源 Agents SDK,让开发者能够构建自己的 Deep Research 和 Operator

OpenAI 发布 Responses API 和开源 Agents SDK,让开发者能够构建自己的 Deep Research 和 Operator

OpenAI 正在推出一套新的 API 和工具,旨在帮助开发者和企业更高效地构建基于 AI 的代理,这些代理基于 OpenAI 自家首个 AI 代理 Deep Research 和 Operator 的技术。Deep Research 独立搜索互联网,生成丰富、组织良好且有引用的报告,而 Operator 则根据用户的文本指令自主控制网页浏览器光标并执行诸如查找体育票或进行预订等操作。

SambaNova 推出低成本开源深度研究代理框架

SambaNova 推出低成本开源深度研究代理框架

SambaNova Systems 推出新的 AI 深度研究框架,可生成深度报告的速度提高 3 倍,成本大幅降低。该框架与 CrewAI 合作开发,支持企业分析私密数据,使用开源大语言模型和 SambaNova 的 AI 加速器,无需依赖 Nvidia GPU。新框架包含智能路由系统,可根据需求选择最合适的智能体,提供从基础搜索到深度财务分析的全方位研究能力。

15个令人震惊的人工智能统计数据,你现在必须了解

15个令人震惊的人工智能统计数据,你现在必须了解

人工智能正在重塑商业、工作和日常生活。新突破如生成式语言模型和推理能力加速了AI的应用。本文列举了15个重要统计数据,揭示了当前AI革命的真实影响,涵盖了AI图像生成、社交媒体、深度伪造、投资规模、市场前景、企业应用、医疗保健、信任度差异等多个方面,展现了AI技术的巨大潜力和面临的挑战。

这款古怪的 AI 智能手机可以创建你的数字分身

这款古怪的 AI 智能手机可以创建你的数字分身

本周在巴塞罗那的移动世界大会上,一款声称预示着智能手机未来 AI 的新奇移动操作系统亮相。

Hugging Face 首席科学官担忧 AI 正在成为"服务器上的应声虫"

Hugging Face 首席科学官担忧 AI 正在成为"服务器上的应声虫"

Hugging Face 的联合创始人兼首席科学官 Thomas Wolf 表示,当前 AI 发展范式无法产生具有创造性问题解决能力的 AI。他认为,AI 目前主要是填补人类已知之间的空白,而非通过连接不相关事实来产生新知识。Wolf 呼吁 AI 行业转向能够衡量 AI 提出非常规问题和开辟新研究路径能力的评估方法。

AI 公司效仿 DeepSeek,通过"蒸馏"技术打造低成本模型

AI 公司效仿 DeepSeek,通过"蒸馏"技术打造低成本模型

领先的 AI 公司正在采用"蒸馏"技术,以创造更便宜、更易采用的 AI 模型。这种技术在 DeepSeek 成功应用后引起广泛关注,引发了硅谷 AI 领导地位的动摇。蒸馏技术通过将大型语言模型的知识转移到小型模型中,实现了高效且经济的 AI 应用。这一突破为初创公司和开发者提供了更多机会,同时也对现有 AI 公司的商业模式构成了挑战。

物理 AI 如何通过嵌入式智能改变行业格局

物理 AI 如何通过嵌入式智能改变行业格局

物理人工智能代表了人工智能从纯数字系统向能够与现实世界互动的智能机器的演变。与仅依赖软件的人工智能不同,物理人工智能将算法与传感器和执行器结合在机器人、车辆和设备中,使它们能够感知周围环境并实时做出决策。这些系统能够自主运行,适应不断变化的环境,而不是遵循固定的编程。

Sergey Brin 表示:如果谷歌员工每周工作 60 小时,AGI 指日可待

Sergey Brin 表示:如果谷歌员工每周工作 60 小时,AGI 指日可待

Google联合创始人谢尔盖·布林重返公司,呼吁员工每周工作60小时,以赢得人工智能竞赛。他认为Google有望实现通用人工智能(AGI)突破,但需要员工全身心投入。这一呼吁引发了对工作效率和AI发展前景的讨论,同时也反映了科技巨头在AI竞争中的紧迫感。

Tencent 发布新 AI 模型,称速度快于 DeepSeek-R1

Tencent 发布新 AI 模型,称速度快于 DeepSeek-R1

腾讯推出新AI模型"混元Turbo S",定位为"快思考模型",旨在与DeepSeek-R1等"慢思考模型"竞争。该模型通过提高输出速度和减少首字延迟,实现近乎"即时回复"。混元Turbo S融合了直觉式短思考链和理性推理长思考链,在数学、推理和知识等方面表现可比肩主流AI模型。腾讯采用混合Mamba-Transformer架构,提高效率并降低成本,有望成为未来基础模型的核心。

IBM 发布新的 Granite 3.2 系列模型,实现按需推理能力

IBM 发布新的 Granite 3.2 系列模型,实现按需推理能力

IBM 公司今天推出了新的 Granite AI 模型系列,具备实验性推理、视觉和预测能力,旨在在企业人工智能市场中占据一席之地。所有 Granite 模型均在 Apache 2.0 开源许可证下开放,现已在 Hugging Face 和 IBM watson.ai 等平台上提供。新系列的旗舰产品是 Granite 3.2 Instruct 变体,支持文本处理,能够执行摘要、问题解决和代码生成等任务,并设计为遵循指令。

Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

Anthropic 发布全新前沿 AI 模型 Claude 3.7 Sonnet,这是首个混合推理模型,能够实时回答问题,也可根据用户需求延长思考时间以提供更深入的答案。该模型在多项基准测试中表现优异,并推出了专注于代码开发的 Claude Code 版本。

DeepSeek 超越"开放权重"AI,计划发布源代码

DeepSeek 超越"开放权重"AI,计划发布源代码

DeepSeek 在上个月发布了一个开放权重的 AI 模型后,现在计划进一步开源其底层代码。公司将从下周开始发布五个开源仓库,涵盖其在线服务中的关键组件。这一举措将使 DeepSeek 的技术更加透明,有助于推动 AI 领域的集体进步,同时也与 OpenAI 等保持专有模型的公司形成对比。