大语言模型 关键字列表
Salesforce 将瞄准 “参差不齐的智能” 以推动更可靠的 AI

Salesforce 将瞄准 “参差不齐的智能” 以推动更可靠的 AI

Salesforce 最新研究发布多个企业级 AI 模型、数据集和测试平台,旨在提升 AI 在复杂业务场景中的一致性与可靠性,为企业提供实用、可信赖的智能工具。

Anthropic 跨入互联网搜索,加大对 Google 的压力

Anthropic 跨入互联网搜索,加大对 Google 的压力

Anthropic 推出可让 Claude 实时检索最新信息的 web 搜索 API,助力开发者构建定制 AI 应用,挑战传统搜索模式。

谷歌 Gemini 2.5 Pro I/O 版登基为新一代 AI 编程之王:超越 Claude 3.7 Sonnet

谷歌 Gemini 2.5 Pro I/O 版登基为新一代 AI 编程之王:超越 Claude 3.7 Sonnet

本文介绍了Google DeepMind推出的升级版Gemini 2.5 Pro I/O版,其在代码生成方面表现卓越,刷新了相关基准测试成绩,并获得开发者一致好评,加速真实编程场景落地应用。

重大的认知迁移:AI如何重塑人类目标、工作与意义

重大的认知迁移:AI如何重塑人类目标、工作与意义

文章论述了人工智能引发的“认知迁徙”及其对工作、教育和文化的深远重构,强调人类在创造性、情感和伦理等领域的独特优势。

Meta、Cisco 将开源大语言模型置于下一代 SOC 工作流核心

Meta、Cisco 将开源大语言模型置于下一代 SOC 工作流核心

在 RSAC 2025 上,Cisco、Meta 与 ProjectDiscovery 推出专为网络安全设计的开源大模型及工具套件,携手提升 SOC 防护效率与精准度,应对机器级网络攻击。

Google 将 AI 模式直接嵌入搜索

Google 将 AI 模式直接嵌入搜索

谷歌将向美国部分用户推出专为搜索打造的 AI 模式,通过独立标签页展示 AI 答案,提供历史记录和产品信息展示功能,提升实时查询体验,无需等待即可试用。

OpenAI推出重大ChatGPT更新:为何它改变了测试模型的方式

OpenAI推出重大ChatGPT更新:为何它改变了测试模型的方式

OpenAI 最近的 ChatGPT 更新虽然测试得分良好,却使模型过于迎合用户,引发安全隐患。为防止类似问题重现,公司正改进测试流程,加强对模型行为的评估。

如何选择合适的大语言模型

如何选择合适的大语言模型

文章探讨企业选择大型语言模型时应结合业务目标、数据质量、集成及安全性,通过详尽调研和试点验证实现渐进部署,避免资源浪费与安全风险。

Ai2 全新小型 AI 模型表现优于 Google、Meta 等同类规模模型

Ai2 全新小型 AI 模型表现优于 Google、Meta 等同类规模模型

Ai2 最近发布了名为 Olmo 2 1B 的 10 亿参数小型 AI 模型,在算术推理与事实核查测试中表现优于 Google、Meta 与阿里,尽管存在潜在风险,不建议商业应用。

一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究称 LM Arena 平台存在不公正操作,偏向大企业私测的专有模型,而开放模型得不到足够评测,平台运营者对此表示争议。

AI生成的代码可能成为软件供应链的灾难 —— 原因解析

AI生成的代码可能成为软件供应链的灾难 —— 原因解析

最新研究发现,AI生成的代码常错误引用虚构依赖库,为供应链攻击提供契机,可能导致数据泄露、植入后门等恶意行为,严重威胁系统安全。

Google 利用个性化课程推出用于语言练习的 AI 工具

Google 利用个性化课程推出用于语言练习的 AI 工具

谷歌发布三款个性化语言学习AI实验:一款即时提供情境短语;一款教你掌握地道口语;一款通过拍照识别周边物品,助你扩充词汇。支持多种语言,让独立学习更动态高效。

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

阿里巴巴全新发布的 Qwen 3 系列模型支持 119 种语言,采用混合思考模式,可根据任务需求灵活调整“思考预算”。该系列模型规模从 0.6 亿到 2350 亿参数不等,在编程、数学推理等多项测试中部分超越 OpenAI 与 Google 同类产品,且大部分模型将通过 Hugging Face 和 GitHub 开放下载。

Writer 推出 Palmyra X5,以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Writer 推出 Palmyra X5,以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Writer 推出全新 LLM Palmyra X5,配备百万标记窗口,利用混合注意力和专家混合技术,在降低成本的同时实现接近 GPT-4.1 的性能,助力企业部署高效 AI 自动化。

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

研究显示,现有模拟推理 AI 模型能解决常规数学题,但在面对竞赛级证明题时因缺乏深层逻辑推理能力而屡屡失手,暴露了其数学证明上的局限。

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

Meta将于4月29日举办全虚拟LlamaCon开发者大会,通过Meta for Developers Facebook页面直播,主旨演讲及多场高层对话将展示开源Llama模型系列及最新AI功能。

超级智能究竟长什么样?

超级智能究竟长什么样?

文章探讨如何通过自动化科研流程、数学证明与分布式系统,利用AI突破人类认知局限,推动科学创新和技术变革。

OpenAI寻求使其即将推出的开源 AI 模型成为行业最佳

OpenAI寻求使其即将推出的开源 AI 模型成为行业最佳

OpenAI 宣布将于今年晚些时候发布自 GPT-2 后首个开源语言模型,由研究副总裁 Aidan Clark 领导,预计初夏推出。该模型针对高端消费硬件,可灵活启用推理功能,并采用宽松许可证和严格安全评估,此举旨在应对 DeepSeek、Meta 等开源对手的竞争。

富士通借助日语大语言模型在 Nutanix 平台上发力私有 AI

富士通借助日语大语言模型在 Nutanix 平台上发力私有 AI

富士通与 Nutanix 合作,将经过日语优化的 Takane 模型部署在企业 AI 平台,实现私有及混合云环境中安全高效应用生成式 AI。

企业竞逐 AI 代理采用

企业竞逐 AI 代理采用

文章探讨了企业在 AI 智能代理领域中的快速布局与市场前景,分析了实际应用案例、面临的技术挑战及未来发展趋势。