大语言模型文章列表第5页-至顶网频道

2025-04-27

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

研究显示，现有模拟推理 AI 模型能解决常规数学题，但在面对竞赛级证明题时因缺乏深层逻辑推理能力而屡屡失手，暴露了其数学证明上的局限。

生成式 AI

大语言模型

Llama 4 模型

2025-04-27

如何观看 LlamaCon 2025：Meta 首个生成式 AI 开发者大会

Meta将于4月29日举办全虚拟LlamaCon开发者大会，通过Meta for Developers Facebook页面直播，主旨演讲及多场高层对话将展示开源Llama模型系列及最新AI功能。

人工智能

大语言模型

新型算法

2025-04-26

超级智能究竟长什么样？

文章探讨如何通过自动化科研流程、数学证明与分布式系统，利用AI突破人类认知局限，推动科学创新和技术变革。

人工智能

大语言模型

新型开源策略

2025-04-24

OpenAI寻求使其即将推出的开源 AI 模型成为行业最佳

OpenAI 宣布将于今年晚些时候发布自 GPT-2 后首个开源语言模型，由研究副总裁 Aidan Clark 领导，预计初夏推出。该模型针对高端消费硬件，可灵活启用推理功能，并采用宽松许可证和严格安全评估，此举旨在应对 DeepSeek、Meta 等开源对手的竞争。

人工智能

大语言模型

混合云部署

2025-04-23

富士通借助日语大语言模型在 Nutanix 平台上发力私有 AI

富士通与 Nutanix 合作，将经过日语优化的 Takane 模型部署在企业 AI 平台，实现私有及混合云环境中安全高效应用生成式 AI。

人工智能

大语言模型

新型算法

2025-04-23

企业竞逐 AI 代理采用

文章探讨了企业在 AI 智能代理领域中的快速布局与市场前景，分析了实际应用案例、面临的技术挑战及未来发展趋势。

人工智能

大语言模型

个性化定制

2025-04-22

微软 Copilot 个性化升级迎50周年

从本周五起，Copilot 将记住用户会话和偏好信息（如宠物名、早餐口味及沟通风格），并试验个性化动画展示，同时支持在部分网站上预订票务、餐厅等服务，朝全面个人助理迈进。

人工智能

大语言模型

自动化漏洞利用

2025-04-22

今日大语言模型以闪电般的速度从补丁中构造漏洞利用

生成式 AI 可在数小时内通过对比补丁差异自动识别并利用漏洞，极大降低防御响应时间。

人工智能

大语言模型

实验结果

2025-04-21

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色，但幻觉率却远高于以往模型，引发了对准确性的严重担忧，亟待进一步研究。

人工智能大语言模型优化模型

人工智能

大语言模型

2025-04-18

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 最新升级其微调平台，支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重，同时新定价更低廉，旨在简化AI模型持续迭代。

Google 在 Cloud Next 2025 的 AI 创新：CIO 需要了解的事项

人工智能

大语言模型

2025-04-17

Google 在 Cloud Next 2025 的 AI 创新：CIO 需要了解的事项

在 Cloud Next 2025 上，Google 公布一系列 AI 更新，包括新 TPU 芯片、专业化 LLM 及开放代理框架，助力企业降低集成复杂度和成本，实现 AI 部署、扩展及管理。

人工智能

大语言模型

成本优化

2025-04-15

OpenAI 转变重点：GPT-4.1 优先关注编程与成本效率

OpenAI 推出了 GPT-4.1 系列，专注提升编程效率、扩展长文本处理能力与指令执行准确性，同时大幅降低成本，为企业和开发者提供更灵活的 AI 工具。

人工智能

大语言模型

智能体开发平台

2025-04-10

Google 推出企业级 AI 智能体开发套件，助力快速原型开发和部署

Google 发布了新的智能代理开发工具包 (ADK) 和相关功能，简化了基于 Gemini 模型的多代理系统创建过程。ADK 支持 Model Context Protocol，可帮助企业快速构建、部署和管理 AI 代理。同时推出的还有 Agent Engine 和 Agent Garden，为企业提供了更全面的代理开发和管理解决方案。这些新工具旨在增强企业对 AI 代理的控制和安全性。

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

人工智能

大语言模型

架构优化

2025-04-09

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

英伟达发布了基于 Meta 旧版 Llama-3.1 的全新开源大语言模型 Llama-3.1-Nemotron-Ultra-253B。该模型在多项第三方基准测试中表现出色，尽管参数量仅为 DeepSeek R1 的一半，但在许多任务上都超越了这个强大的竞争对手。新模型支持高级推理、指令跟随和 AI 助手工作流，采用了创新架构和针对性后训练来优化性能。

人工智能

大语言模型

模型效率优化

2025-04-08

Gemini "正在以非常棒的方式融合在一起"，谷歌在发布2.5 Pro后表示

Google 在生成式 AI 领域起步较晚，但近期 Gemini 发展迅速。最新发布的 Gemini 2.5 Pro (实验版)在基准测试和用户体验方面均有显著提升，有望挑战 ChatGPT 的主导地位。Google 表示，这得益于长期投资的成果开始发挥作用。新版本在推理能力、性能效率等方面都有进步，但在技术细节透明度方面仍有待改进。

人工智能安全

大语言模型

网络威胁

2025-04-08

思科：微调后的大语言模型成为威胁放大器——恶意行为可能性增加22倍

思科最新研究表明，经过微调的大语言模型正在重塑网络攻击格局。这些模型可以自动化侦察、身份模仿和实时检测规避，加速大规模社会工程攻击。一些专门用于攻击的模型月租低至75美元。研究还发现，微调过程会削弱模型的安全控制，使其更容易被利用。这迫使安全领导者必须重新制定防御策略，将大语言模型视为新的攻击面来加以防护。

人工智能

大语言模型

开源AI

2025-04-07

扎克伯格：Meta最新Llama模型将开源AI推向领导地位

Meta发布了Llama 4系列大型语言模型，包括适合单GPU运行的Scout和媲美GPT-4o的Maverick，均拥有170亿参数。更强大的Behemoth模型仍在开发中，将拥有2880亿活跃参数。这些模型采用专家混合系统技术，在性能、效率和安全性方面均有显著提升，体现了Meta推动开源AI成为行业领先力量的战略。

人工智能

大语言模型

透明度监管

2025-04-05

Google 发布 Gemini 模型的速度快于其 AI 安全报告

Google 近期加快了 AI 模型的发布节奏，推出了业界领先的 Gemini 2.5 Pro 和 Gemini 2.0 Flash。然而，公司尚未发布这些新模型的安全报告，引发了对透明度的担忧。Google 表示正在权衡快速迭代和获取反馈的方式，承诺未来会发布更多文档，但专家认为这种做法可能会树立不良先例。

人工智能

大语言模型

模型优化

2025-04-01

Google 新实验性 Gemini 2.5 模型向免费用户开放

Google 推出最新的 Gemini 2.5 Pro (实验版) AI 模型，并以罕见的速度向免费用户开放。该模型支持模拟推理，提高了准确性，并在 LMSYS 聊天机器人竞技场排行榜上名列前茅。免费用户可在网页上试用，但有使用限制，无法上传文件，且有未明确的token和使用次数限制。

人工智能

大语言模型

市场整合

2025-04-01

大语言模型供应商面临"淘汰"危机，资本支出现实带来严峻考验

Gartner 预测，大语言模型 (LLM) 提供商市场即将进入"灭绝"阶段。在竞争激烈的环境下，巨额资本投入成为主要挑战。预计到 2025 年，全球生成式 AI 支出将达到 6440 亿美元，较 2024 年增长 76%。专家认为，LLM 市场将经历类似云计算市场的整合，最终可能只剩少数几家主导者。

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: