大语言模型 关键字列表
微软 Copilot 个性化升级迎50周年

微软 Copilot 个性化升级迎50周年

从本周五起,Copilot 将记住用户会话和偏好信息(如宠物名、早餐口味及沟通风格),并试验个性化动画展示,同时支持在部分网站上预订票务、餐厅等服务,朝全面个人助理迈进。

今日大语言模型以闪电般的速度从补丁中构造漏洞利用

今日大语言模型以闪电般的速度从补丁中构造漏洞利用

生成式 AI 可在数小时内通过对比补丁差异自动识别并利用漏洞,极大降低防御响应时间。

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色,但幻觉率却远高于以往模型,引发了对准确性的严重担忧,亟待进一步研究。

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 最新升级其微调平台,支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重,同时新定价更低廉,旨在简化AI模型持续迭代。

Google 在 Cloud Next 2025 的 AI 创新:CIO 需要了解的事项

Google 在 Cloud Next 2025 的 AI 创新:CIO 需要了解的事项

在 Cloud Next 2025 上,Google 公布一系列 AI 更新,包括新 TPU 芯片、专业化 LLM 及开放代理框架,助力企业降低集成复杂度和成本,实现 AI 部署、扩展及管理。

OpenAI 转变重点:GPT-4.1 优先关注编程与成本效率

OpenAI 转变重点:GPT-4.1 优先关注编程与成本效率

OpenAI 推出了 GPT-4.1 系列,专注提升编程效率、扩展长文本处理能力与指令执行准确性,同时大幅降低成本,为企业和开发者提供更灵活的 AI 工具。

Google 推出企业级 AI 智能体开发套件,助力快速原型开发和部署

Google 推出企业级 AI 智能体开发套件,助力快速原型开发和部署

Google 发布了新的智能代理开发工具包 (ADK) 和相关功能,简化了基于 Gemini 模型的多代理系统创建过程。ADK 支持 Model Context Protocol,可帮助企业快速构建、部署和管理 AI 代理。同时推出的还有 Agent Engine 和 Agent Garden,为企业提供了更全面的代理开发和管理解决方案。这些新工具旨在增强企业对 AI 代理的控制和安全性。

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

英伟达发布了基于 Meta 旧版 Llama-3.1 的全新开源大语言模型 Llama-3.1-Nemotron-Ultra-253B。该模型在多项第三方基准测试中表现出色,尽管参数量仅为 DeepSeek R1 的一半,但在许多任务上都超越了这个强大的竞争对手。新模型支持高级推理、指令跟随和 AI 助手工作流,采用了创新架构和针对性后训练来优化性能。

Gemini "正在以非常棒的方式融合在一起",谷歌在发布2.5 Pro后表示

Gemini "正在以非常棒的方式融合在一起",谷歌在发布2.5 Pro后表示

Google 在生成式 AI 领域起步较晚,但近期 Gemini 发展迅速。最新发布的 Gemini 2.5 Pro (实验版)在基准测试和用户体验方面均有显著提升,有望挑战 ChatGPT 的主导地位。Google 表示,这得益于长期投资的成果开始发挥作用。新版本在推理能力、性能效率等方面都有进步,但在技术细节透明度方面仍有待改进。

思科:微调后的大语言模型成为威胁放大器——恶意行为可能性增加22倍

思科:微调后的大语言模型成为威胁放大器——恶意行为可能性增加22倍

思科最新研究表明,经过微调的大语言模型正在重塑网络攻击格局。这些模型可以自动化侦察、身份模仿和实时检测规避,加速大规模社会工程攻击。一些专门用于攻击的模型月租低至75美元。研究还发现,微调过程会削弱模型的安全控制,使其更容易被利用。这迫使安全领导者必须重新制定防御策略,将大语言模型视为新的攻击面来加以防护。

扎克伯格:Meta最新Llama模型将开源AI推向领导地位

扎克伯格:Meta最新Llama模型将开源AI推向领导地位

Meta发布了Llama 4系列大型语言模型,包括适合单GPU运行的Scout和媲美GPT-4o的Maverick,均拥有170亿参数。更强大的Behemoth模型仍在开发中,将拥有2880亿活跃参数。这些模型采用专家混合系统技术,在性能、效率和安全性方面均有显著提升,体现了Meta推动开源AI成为行业领先力量的战略。

Google 发布 Gemini 模型的速度快于其 AI 安全报告

Google 发布 Gemini 模型的速度快于其 AI 安全报告

Google 近期加快了 AI 模型的发布节奏,推出了业界领先的 Gemini 2.5 Pro 和 Gemini 2.0 Flash。然而,公司尚未发布这些新模型的安全报告,引发了对透明度的担忧。Google 表示正在权衡快速迭代和获取反馈的方式,承诺未来会发布更多文档,但专家认为这种做法可能会树立不良先例。

Google 新实验性 Gemini 2.5 模型向免费用户开放

Google 新实验性 Gemini 2.5 模型向免费用户开放

Google 推出最新的 Gemini 2.5 Pro (实验版) AI 模型,并以罕见的速度向免费用户开放。该模型支持模拟推理,提高了准确性,并在 LMSYS 聊天机器人竞技场排行榜上名列前茅。免费用户可在网页上试用,但有使用限制,无法上传文件,且有未明确的token和使用次数限制。

大语言模型供应商面临"淘汰"危机,资本支出现实带来严峻考验

大语言模型供应商面临"淘汰"危机,资本支出现实带来严峻考验

Gartner 预测,大语言模型 (LLM) 提供商市场即将进入"灭绝"阶段。在竞争激烈的环境下,巨额资本投入成为主要挑战。预计到 2025 年,全球生成式 AI 支出将达到 6440 亿美元,较 2024 年增长 76%。专家认为,LLM 市场将经历类似云计算市场的整合,最终可能只剩少数几家主导者。

OpenAI 将发布自 2019 年以来首个"开放权重"模型

OpenAI 将发布自 2019 年以来首个"开放权重"模型

OpenAI计划今年晚些时候向开发者社区发布一个"开放权重"模型,这是该公司自2019年以来的首次尝试。新模型将具备推理能力,类似于现有的o3-mini模型。这一战略转变旨在应对来自竞争对手的压力,同时为开发者提供更多定制和使用灵活性。虽然不完全开源,但这种方式可能有助于OpenAI在保持技术领先的同时,满足市场对更开放AI发展的需求。

Databricks 与 Anthropic、Palantir 达成企业 AI 合作

Databricks 与 Anthropic、Palantir 达成企业 AI 合作

Databricks 与 Palantir 签署合作协议,开发出更优的大语言模型微调方法,并与 Anthropic 达成为期五年的战略联盟,将 Claude 大语言模型整合到其数据湖平台中。此次合作将为企业客户提供更强大的 AI 能力,包括军工级安全性、高效的模型训练以及全面的数据治理,助力企业打造专属 AI 应用。

Google Gemini 2.5 成为最新对标 DeepSeek R1 的模型

Google Gemini 2.5 成为最新对标 DeepSeek R1 的模型

Google 发布新一代 AI 模型 Gemini 2.5,在 LMArena 评测中位居榜首。该模型采用递归分析方法提供输出,在推理、科学、数学和代码生成等方面表现出色。目前已向付费高级用户开放使用,并将在 2025 年投入 750 亿美元用于 AI 开发,以争夺未来万亿规模的 AI 市场。

"渐进,然后突然":AI 对就业岗位的冲击是否正在遵循这一模式?

"渐进,然后突然":AI 对就业岗位的冲击是否正在遵循这一模式?

AI 正在迅速改变我们的工作方式,无论是通过自动化任务、作为副驾驶还是生成文本、图像和软件。虽然目前尚未出现大规模的劳动力替代,但多项研究预测未来几年内 40% 的全球就业岗位可能面临 AI 自动化的冲击。这可能是暴风雨来临前的宁静。

腾讯放缓 GPU 部署步伐,从更少的加速器中榨取更多性能

腾讯放缓 GPU 部署步伐,从更少的加速器中榨取更多性能

腾讯放缓了GPU部署速度,原因是DeepSeek技术的突破使得现有GPU的生产力大幅提升。公司预计2025年资本支出将占收入的"低teens百分比",远低于微软和亚马逊的支出。腾讯强调效率和GPU服务器的高效利用,认为这不会影响技术开发的最终效果。公司计划在微信中加入AI驱动的搜索、语言输入和内容生成功能,并考虑引入智能AI服务。

谷歌推出全新可及的轻量级 Gemma 3 系列模型

谷歌推出全新可及的轻量级 Gemma 3 系列模型

Google 发布新一代轻量级开源大语言模型 Gemma 3,提供多种参数规模选择,可在单个 GPU 上运行。该模型基于 Gemini 技术,性能优异,具备多模态能力和大上下文窗口。同时推出 ShieldGemma 2 用于图像安全检查,为开发者提供更多 AI 应用开发选择。