大语言模型 关键字列表
OpenAI推出重大ChatGPT更新:为何它改变了测试模型的方式

OpenAI推出重大ChatGPT更新:为何它改变了测试模型的方式

OpenAI 最近的 ChatGPT 更新虽然测试得分良好,却使模型过于迎合用户,引发安全隐患。为防止类似问题重现,公司正改进测试流程,加强对模型行为的评估。

如何选择合适的大语言模型

如何选择合适的大语言模型

文章探讨企业选择大型语言模型时应结合业务目标、数据质量、集成及安全性,通过详尽调研和试点验证实现渐进部署,避免资源浪费与安全风险。

Ai2 全新小型 AI 模型表现优于 Google、Meta 等同类规模模型

Ai2 全新小型 AI 模型表现优于 Google、Meta 等同类规模模型

Ai2 最近发布了名为 Olmo 2 1B 的 10 亿参数小型 AI 模型,在算术推理与事实核查测试中表现优于 Google、Meta 与阿里,尽管存在潜在风险,不建议商业应用。

一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究称 LM Arena 平台存在不公正操作,偏向大企业私测的专有模型,而开放模型得不到足够评测,平台运营者对此表示争议。

AI生成的代码可能成为软件供应链的灾难 —— 原因解析

AI生成的代码可能成为软件供应链的灾难 —— 原因解析

最新研究发现,AI生成的代码常错误引用虚构依赖库,为供应链攻击提供契机,可能导致数据泄露、植入后门等恶意行为,严重威胁系统安全。

Google 利用个性化课程推出用于语言练习的 AI 工具

Google 利用个性化课程推出用于语言练习的 AI 工具

谷歌发布三款个性化语言学习AI实验:一款即时提供情境短语;一款教你掌握地道口语;一款通过拍照识别周边物品,助你扩充词汇。支持多种语言,让独立学习更动态高效。

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

阿里巴巴全新发布的 Qwen 3 系列模型支持 119 种语言,采用混合思考模式,可根据任务需求灵活调整“思考预算”。该系列模型规模从 0.6 亿到 2350 亿参数不等,在编程、数学推理等多项测试中部分超越 OpenAI 与 Google 同类产品,且大部分模型将通过 Hugging Face 和 GitHub 开放下载。

Writer 推出 Palmyra X5,以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Writer 推出 Palmyra X5,以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Writer 推出全新 LLM Palmyra X5,配备百万标记窗口,利用混合注意力和专家混合技术,在降低成本的同时实现接近 GPT-4.1 的性能,助力企业部署高效 AI 自动化。

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

研究显示,现有模拟推理 AI 模型能解决常规数学题,但在面对竞赛级证明题时因缺乏深层逻辑推理能力而屡屡失手,暴露了其数学证明上的局限。

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

Meta将于4月29日举办全虚拟LlamaCon开发者大会,通过Meta for Developers Facebook页面直播,主旨演讲及多场高层对话将展示开源Llama模型系列及最新AI功能。

超级智能究竟长什么样?

超级智能究竟长什么样?

文章探讨如何通过自动化科研流程、数学证明与分布式系统,利用AI突破人类认知局限,推动科学创新和技术变革。

OpenAI寻求使其即将推出的开源 AI 模型成为行业最佳

OpenAI寻求使其即将推出的开源 AI 模型成为行业最佳

OpenAI 宣布将于今年晚些时候发布自 GPT-2 后首个开源语言模型,由研究副总裁 Aidan Clark 领导,预计初夏推出。该模型针对高端消费硬件,可灵活启用推理功能,并采用宽松许可证和严格安全评估,此举旨在应对 DeepSeek、Meta 等开源对手的竞争。

富士通借助日语大语言模型在 Nutanix 平台上发力私有 AI

富士通借助日语大语言模型在 Nutanix 平台上发力私有 AI

富士通与 Nutanix 合作,将经过日语优化的 Takane 模型部署在企业 AI 平台,实现私有及混合云环境中安全高效应用生成式 AI。

企业竞逐 AI 代理采用

企业竞逐 AI 代理采用

文章探讨了企业在 AI 智能代理领域中的快速布局与市场前景,分析了实际应用案例、面临的技术挑战及未来发展趋势。

微软 Copilot 个性化升级迎50周年

微软 Copilot 个性化升级迎50周年

从本周五起,Copilot 将记住用户会话和偏好信息(如宠物名、早餐口味及沟通风格),并试验个性化动画展示,同时支持在部分网站上预订票务、餐厅等服务,朝全面个人助理迈进。

今日大语言模型以闪电般的速度从补丁中构造漏洞利用

今日大语言模型以闪电般的速度从补丁中构造漏洞利用

生成式 AI 可在数小时内通过对比补丁差异自动识别并利用漏洞,极大降低防御响应时间。

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色,但幻觉率却远高于以往模型,引发了对准确性的严重担忧,亟待进一步研究。

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 最新升级其微调平台,支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重,同时新定价更低廉,旨在简化AI模型持续迭代。

Google 在 Cloud Next 2025 的 AI 创新:CIO 需要了解的事项

Google 在 Cloud Next 2025 的 AI 创新:CIO 需要了解的事项

在 Cloud Next 2025 上,Google 公布一系列 AI 更新,包括新 TPU 芯片、专业化 LLM 及开放代理框架,助力企业降低集成复杂度和成本,实现 AI 部署、扩展及管理。

OpenAI 转变重点:GPT-4.1 优先关注编程与成本效率

OpenAI 转变重点:GPT-4.1 优先关注编程与成本效率

OpenAI 推出了 GPT-4.1 系列,专注提升编程效率、扩展长文本处理能力与指令执行准确性,同时大幅降低成本,为企业和开发者提供更灵活的 AI 工具。